Ο Πόλεμος Πνευματικών Δικαιωμάτων στην Εκπαίδευση της AI, Απλά Εξηγημένος
Γεια σου! Αν τον τελευταίο καιρό «αράζεις» στο internet, σίγουρα έχεις δει μερικά απίστευτα πράγματα. Η AI μπορεί πλέον να γράψει ένα πιασάρικο τραγούδι, να σε βοηθήσει να φτιάξεις έναν ιστότοπο ή ακόμα και να ζωγραφίσει μια γάτα να κάνει ποδήλατο στο διάστημα. Μοιάζει λίγο με μαγεία, έτσι δεν είναι; Αλλά πίσω από αυτή τη μαγεία κρύβεται ένα πολύ μεγάλο και πολύ σημαντικό ερώτημα που συζητούν όλοι. Από πού προέρχεται όλη αυτή η γνώση; Για να γίνουν αυτά τα εργαλεία τόσο έξυπνα, οι εταιρείες έπρεπε να τα «εκπαιδεύσουν» χρησιμοποιώντας εκατομμύρια άρθρα, φωτογραφίες και βιβλία. Αυτό έχει ξεκινήσει μια τεράστια συζήτηση για το ποιος είναι ο ιδιοκτήτης αυτού του περιεχομένου και αν οι άνθρωποι που το δημιούργησαν θα πρέπει να πληρώνονται. Είναι μια ζωντανή εποχή για να παρακολουθείς τα τελευταία νέα και updates της AI, γιατί οι κανόνες για το πώς χρησιμοποιούμε το internet ξαναγράφονται αυτή τη στιγμή. Το βασικό συμπέρασμα είναι ότι κινούμαστε προς έναν κόσμο όπου οι tech εταιρείες και οι δημιουργοί προσπαθούν να βρουν έναν τρόπο να συνεργαστούν, ώστε όλοι να κερδίζουν. Είναι μια συναρπαστική αλλαγή που θα βοηθήσει να γίνουν τα εργαλεία που χρησιμοποιούμε καθημερινά ακόμα καλύτερα και πιο αξιόπιστα.
Ίσως αναρωτιέσαι πώς μαθαίνει πραγματικά μια AI να κάνει αυτό που κάνει. Φαντάσου την σαν έναν μαθητή σε μια τεράστια βιβλιοθήκη. Για να μάθει να γράφει σαν άνθρωπος, ο μαθητής AI διαβάζει σχεδόν τα πάντα σε αυτή τη βιβλιοθήκη. Αυτό περιλαμβάνει ειδήσεις, blog posts, ακόμα και δημόσιες ενημερώσεις στα social media. Αυτή η διαδικασία συχνά ονομάζεται training. Η AI δεν αντιγράφει απλώς και επικολλά ό,τι διαβάζει. Αντίθετα, αναζητά μοτίβα. Μαθαίνει ότι η λέξη «μήλο» εμφανίζεται συχνά κοντά στη λέξη «ζουμερό» ή «κόκκινο». Μαθαίνει ότι ένα ηλιοβασίλεμα έχει συνήθως αποχρώσεις πορτοκαλί και ροζ. Εξετάζοντας δισεκατομμύρια παραδείγματα, γίνεται ειδικός στην πρόβλεψη του τι πρέπει να ακολουθήσει. Έτσι δημιουργεί κάτι νέο που μοιάζει πολύ ανθρώπινο. Για πολύ καιρό, αυτό θεωρούνταν απλώς ένα cool επιστημονικό project. Αλλά τώρα που αυτά τα εργαλεία είναι μεγάλες επιχειρήσεις, οι άνθρωποι που έγραψαν τα βιβλία και τράβηξαν τις φωτογραφίες σε αυτή τη βιβλιοθήκη αρχίζουν να θέτουν μερικά δίκαια ερωτήματα σχετικά με το πώς χρησιμοποιείται η δουλειά τους.
Βρήκατε κάποιο λάθος ή κάτι που χρειάζεται διόρθωση; Ενημερώστε μας.Μια κοινή παρανόηση είναι ότι η AI είναι απλώς μια τεράστια βάση δεδομένων κλεμμένης δουλειάς. Αυτό δεν είναι ακριβώς σωστό. Η AI δεν αποθηκεύει τα πρωτότυπα αρχεία. Αποθηκεύει τα μοτίβα που έμαθε από αυτά. Ωστόσο, η ένταση προέρχεται από το πώς συλλέχθηκαν αυτές οι πληροφορίες εξαρχής. Αυτή η πρακτική είναι γνωστή ως data scraping. Φαντάσου μια γιγάντια ψηφιακή ηλεκτρική σκούπα που ταξιδεύει στον ιστό και ρουφάει κάθε κομμάτι δημόσιων δεδομένων που μπορεί να βρει. Στις αρχές, αυτό αγνοούνταν ως επί το πλείστον. Αλλά πρόσφατα, τα πράγματα άλλαξαν. Μεγάλα ονόματα στον δημιουργικό κόσμο, από διάσημους συγγραφείς μέχρι μεγάλα ειδησεογραφικά πρακτορεία, άρχισαν να λένε ότι αυτό το «σκούπισμα» δεν πρέπει να είναι δωρεάν. Υποστηρίζουν ότι η δουλειά τους έχει αξία και ότι αν μια tech εταιρεία πρόκειται να βγάλει χρήματα χρησιμοποιώντας ένα εργαλείο που έχει εκπαιδευτεί στα δεδομένα τους, θα πρέπει να πάρουν ένα κομμάτι της πίτας. Αυτή είναι η καρδιά της συζήτησης. Είναι ένας αγώνας δρόμου μεταξύ της ταχύτητας της καινοτομίας και των δικαιωμάτων των ανθρώπων που παρέχουν την πρώτη ύλη για αυτή την καινοτομία.
Το Μεγάλο Ερώτημα: Ποιος Κατέχει τον «Εγκέφαλο» της AI;
Αυτή η συζήτηση συμβαίνει σε όλο τον κόσμο, και είναι στην πραγματικότητα εξαιρετικά νέα για το μέλλον του internet. Γιατί; Επειδή σημαίνει ότι επιτέλους καταλαβαίνουμε πώς να αξιολογούμε την ψηφιακή εργασία με έναν τρόπο που να έχει νόημα για τη σύγχρονη εποχή. Σε μέρη όπως οι Ηνωμένες Πολιτείες, τα δικαστήρια εξετάζουν κάτι που ονομάζεται **fair use**. Αυτή είναι μια νομική ιδέα που λέει ότι μπορείς να χρησιμοποιήσεις υλικό που προστατεύεται από πνευματικά δικαιώματα χωρίς άδεια, αν το αλλάζεις σε κάτι νέο και δεν βλάπτεις τον αρχικό δημιουργό. Οι tech εταιρείες υποστηρίζουν ότι το AI training είναι η απόλυτη μορφή fair use. Λένε ότι δημιουργούν κάτι εντελώς διαφορετικό από τα αρχικά δεδομένα. Από την άλλη πλευρά, οι δημιουργοί λένε ότι αν μια AI μπορεί να γράψει μια ιστορία στο στυλ ενός συγκεκριμένου συγγραφέα, σίγουρα ανταγωνίζεται αυτόν τον συγγραφέα. Αυτό δεν συμβαίνει μόνο στις ΗΠΑ. Η Ευρωπαϊκή Ένωση και χώρες όπως η Ιαπωνία δημιουργούν επίσης τους δικούς τους κανόνες. Κάποιες είναι πολύ φιλικές προς τις εταιρείες AI για να ενθαρρύνουν την ανάπτυξη, ενώ άλλες βάζουν «φράχτες» για να προστατεύσουν τους τοπικούς καλλιτέχνες και δημοσιογράφους τους.
Ο παγκόσμιος αντίκτυπος αυτών των αποφάσεων θα είναι τεράστιος. Αν κάθε χώρα έχει διαφορετικούς κανόνες, θα μπορούσε να γίνει πολύ μπερδεμένο για τις εταιρείες που λειτουργούν παντού. Γι’ αυτό πολλοί άνθρωποι κοιτάζουν τον Παγκόσμιο Οργανισμό Πνευματικής Ιδιοκτησίας (WIPO) για να βοηθήσει στη δημιουργία ενός προτύπου που όλοι μπορούν να ακολουθήσουν. Δεν πρόκειται μόνο για μεγάλες αγωγές. Πρόκειται για τη δημιουργία ενός βιώσιμου συστήματος. Βλέπουμε ήδη κάποια συναρπαστική πρόοδο. Ορισμένοι tech κολοσσοί έχουν αρχίσει να υπογράφουν συμφωνίες αδειοδότησης (licensing deals) με μεγάλους εκδότες. Αυτό σημαίνει ότι πληρώνουν για το δικαίωμα χρήσης δεδομένων υψηλής ποιότητας για να εκπαιδεύσουν τα μοντέλα τους. Αυτός θα μπορούσε να είναι ένας φανταστικός τρόπος να υποστηριχθεί η δημοσιογραφία και η τέχνη, ενώ παράλληλα η τεχνολογία AI προχωρά με γρήγορους ρυθμούς. Δείχνει ότι δεν χρειάζεται να επιλέξουμε μεταξύ cool tech και δίκαιης αμοιβής. Μπορούμε να έχουμε και τα δύο! Αυτή η στροφή προς την αδειοδότηση είναι μια μεγάλη αλλαγή από μόλις ένα ή δύο χρόνια πριν, όταν οι περισσότερες εταιρείες απλώς «ρούφαγαν» ό,τι έβρισκαν χωρίς να ρωτήσουν.
Πώς Λειτουργεί η Ψηφιακή Ηλεκτρική Σκούπα
Για μια επιχείρηση, αυτή η νομική αβεβαιότητα μπορεί να είναι λίγο «πονοκέφαλος». Φαντάσου ότι είσαι μια μικρή εταιρεία που θέλει να φτιάξει ένα νέο app χρησιμοποιώντας AI. Αν δεν ξέρεις αν η AI που χρησιμοποιείς εκπαιδεύτηκε νόμιμα, μπορεί να ανησυχείς ότι θα μηνυθείς αργότερα. Αυτή η αβεβαιότητα μπορεί να επιβραδύνει τα πράγματα. Οι εταιρείες μπορεί να περιμένουν στην άκρη αντί να δημιουργούν νέα πράγματα. Γι’ αυτό οι σαφείς κανόνες είναι τόσο σημαντικοί. Όταν οι κανόνες είναι σαφείς, οι επιχειρήσεις μπορούν να επενδύσουν με αυτοπεποίθηση. Θα ξέρουν ακριβώς τι πρέπει να κάνουν για να παραμείνουν στη σωστή πλευρά του νόμου. Αυτό μπορεί να σημαίνει ότι θα πληρώσουν λίγο περισσότερο για αδειοδοτημένα μοντέλα AI, αλλά η ηρεμία αξίζει τον κόπο. Επίσης, ενθαρρύνει τη δημιουργία πιο ηθικών εργαλείων AI που οι επιχειρήσεις μπορούν να χρησιμοποιούν με περηφάνια. Βλέπουμε μια απομάκρυνση από την παλιά ιδέα του «κάνε γρήγορα και χάλασε πράγματα». Τώρα, ο στόχος είναι να κινείσαι γρήγορα, διασφαλίζοντας παράλληλα ότι έχεις τις σωστές άδειες. Αυτός είναι ένας πολύ καλύτερος τρόπος για να χτίσεις μια μακροπρόθεσμη βιομηχανία που όλοι μπορούν να εμπιστευτούν.
Γιατί Όλος ο Κόσμος Παρακολουθεί τα Δικαστήρια
Ας δούμε πώς αυτό επηρεάζει έναν πραγματικό άνθρωπο. Γνώρισε τον Μάικ. Ο Μάικ διευθύνει μια μικρή διαφημιστική εταιρεία. Λατρεύει να χρησιμοποιεί την AI για να τον βοηθάει να βρίσκει ιδέες για τους πελάτες του. Στο παρελθόν, ποτέ δεν σκέφτηκε πραγματικά από πού έπαιρνε η AI τις ιδέες της. Αλλά τον τελευταίο καιρό, οι πελάτες του κάνουν ερωτήσεις. Θέλουν να βεβαιωθούν ότι οι εικόνες και τα κείμενα που τους δίνει ο Μάικ δεν θα προκαλέσουν νομικά προβλήματα. Λόγω των πρόσφατων αλλαγών στον κλάδο, ο Μάικ μπορεί τώρα να επιλέξει να χρησιμοποιήσει εργαλεία AI που εκπαιδεύονται μόνο σε αδειοδοτημένα δεδομένα. Αυτό είναι μια τεράστια νίκη για αυτόν. Μπορεί να πει στους πελάτες του ότι όλα είναι 100 τοις εκατό νόμιμα και ηθικά. Αυτό του δίνει ένα ανταγωνιστικό πλεονέκτημα. Στην άλλη πλευρά του κόσμου, μια συγγραφέας ονόματι Έλενα βλέπει επίσης τα οφέλη. Ανήκει σε μια ομάδα που μόλις υπέγραψε συμφωνία με μια μεγάλη εταιρεία AI. Τώρα, κάθε φορά που η AI χρησιμοποιεί τη δουλειά της για να μάθει, ένα μικρό ποσό χρημάτων πηγαίνει σε ένα ταμείο για συγγραφείς σαν αυτήν. Αυτό τη βοηθά να συνεχίσει να κάνει αυτό που αγαπά, ενώ ο κόσμος της τεχνολογίας συνεχίζει να αλλάζει γύρω της.
Μια Μέρα στη Ζωή Ενός Σύγχρονου Δημιουργού
Μια τυπική μέρα για κάποιον σαν την Έλενα ή τον Μάικ είναι πλέον γεμάτη με πολύ περισσότερη σαφήνεια από ό,τι πριν. Η Έλενα ξεκινά το πρωί της ελέγχοντας το dashboard της για να δει πώς χρησιμοποιείται το περιεχόμενό της. Νιώθει σεβασμό επειδή είχε την επιλογή να κάνει *opt-out* ή να συμμετάσχει στο πρόγραμμα αδειοδότησης. Εν τω μεταξύ, ο Μάικ χρησιμοποιεί ένα εργαλείο AI που έχει ένα σαφές «σήμα» που λέει ότι εκπαιδεύτηκε σε εξουσιοδοτημένα δεδομένα. Περνάει το απόγευμά του δημιουργώντας μια όμορφη καμπάνια για ένα τοπικό αρτοποιείο, γνωρίζοντας ότι υποστηρίζει τους καλλιτέχνες των οποίων η δουλειά βοήθησε την AI να μάθει. Αυτός είναι ο πραγματικός αντίκτυπος του πολέμου των πνευματικών δικαιωμάτων. Δεν αφορά μόνο δικηγόρους με κοστούμια. Αφορά τη διασφάλιση ότι οι άνθρωποι που κάνουν το internet ένα διασκεδαστικό και ενδιαφέρον μέρος μπορούν να συνεχίσουν να κάνουν τη δουλειά τους. Η ένταση μεταξύ καινοτομίας και ιδιοκτησίας εξακολουθεί να υπάρχει, αλλά γίνεται μια παραγωγική ένταση. Μας ωθεί να βρούμε δημιουργικές λύσεις που ίσως δεν είχαμε σκεφτεί διαφορετικά.
Κάποιος μπορεί να αναρωτηθεί για το κρυφό κόστος όλου αυτού του νομικού ελέγχοu και αν θα κάνει τα αγαπημένα μας εργαλεία πιο ακριβά. Είναι μια πολύ δίκαιη ερώτηση. Αν οι εταιρείες πρέπει να πληρώνουν για κάθε κομμάτι δεδομένων, θα μετακυλίσουν αυτά τα κόστη σε εμάς; Πρέπει επίσης να σκεφτούμε αν αυτό θα δώσει ένα τεράστιο πλεονέκτημα στις μεγαλύτερες tech εταιρείες που έχουν τα περισσότερα χρήματα για να πληρώσουν για άδειες. Είναι ένα ενδιαφέρον παζλ για επίλυση, γιατί θέλουμε να διατηρήσουμε την AI προσβάσιμη σε όλους, όχι μόνο στους πλούσιους. Πρέπει επίσης να παραμείνουμε περίεργοι για την ιδιωτικότητα. Αν μια AI εκπαιδεύεται σε δημόσια δεδομένα, θα πρέπει πάντα να ρωτάμε πώς χειρίζονται τα προσωπικά μας δεδομένα. Αυτοί δεν είναι λόγοι ανησυχίας, αλλά είναι σπουδαία πράγματα που πρέπει να παρακολουθούμε καθώς μαθαίνουμε όλοι μαζί. Το να είμαστε περίεργοι μας βοηθά να διασφαλίσουμε ότι η τεχνολογία παραμένει χρήσιμη και φιλική για όλους μακροπρόθεσμα.
Έχετε μια ιστορία, εργαλείο, τάση ή ερώτηση σχετικά με την τεχνητή νοημοσύνη που πιστεύετε ότι πρέπει να καλύψουμε; Στείλτε μας την ιδέα σας για άρθρο — θα χαρούμε να την ακούσουμε.Η Τεχνική Πλευρά της Νομικής Συμμόρφωσης
Τώρα, για όσους λατρεύουν να μπαίνουν στις «λεπτομέρειες», ας μιλήσουμε για το πώς λειτουργεί αυτό σε τεχνικό επίπεδο. Οι developers χτίζουν μερικούς πραγματικά έξυπνους τρόπους για να χειρίζονται τα πνευματικά δικαιώματα. Μία από τις μεγαλύτερες τάσεις είναι η χρήση μικρότερων, εξειδικευμένων μοντέλων. Αντί για μία γιγάντια AI που τα ξέρει όλα, οι εταιρείες χτίζουν μικρότερες που εκπαιδεύονται σε πολύ συγκεκριμένα, αδειοδοτημένα datasets. Αυτό καθιστά πολύ πιο εύκολο να παρακολουθείς από πού προήλθαν οι πληροφορίες. Βλέπουμε επίσης πολλή δουλειά σε API limits και data provenance. Το provenance είναι απλώς μια «φάνσι» λέξη για την ιστορία από όπου ξεκίνησε ένα κομμάτι δεδομένων. Χρησιμοποιώντας blockchain ή άλλες ψηφιακές υπογραφές, οι developers μπορούν να αποδείξουν ότι ένα κομμάτι training data χρησιμοποιήθηκε με άδεια. Αυτό γίνεται ένα τυπικό μέρος του workflow για πολλές ομάδες AI. Όλα έχουν να κάνουν με τη δημιουργία ενός διαφανούς pipeline από τον δημιουργό στην έξοδο της AI.
Ένα άλλο cool κομμάτι tech ονομάζεται Retrieval-Augmented Generation. Αυτός είναι ένας τρόπος για μια AI να αναζητά πληροφορίες σε πραγματικό χρόνο από μια συγκεκριμένη, αξιόπιστη πηγή, αντί να βασίζεται απλώς σε ό,τι έμαθε κατά τη διάρκεια του training. Αυτό είναι υπέροχο για να παραμένει νόμιμο, επειδή η εταιρεία μπορεί να ελέγχει ακριβώς ποια έγγραφα επιτρέπεται να δει η AI. Βοηθά επίσης με το local storage. Πολλές επιχειρήσεις επιλέγουν τώρα να τρέχουν τα δικά τους μοντέλα AI στους δικούς τους servers χρησιμοποιώντας τα δικά τους ιδιωτικά δεδομένα. Αυτό αποφεύγει εντελώς όλη τη συζήτηση για το public scraping. Μπορούν να χρησιμοποιήσουν ένα base model που έχει ήδη εγκριθεί για χρήση και στη συνέχεια να προσθέσουν τη δική τους «μυστική σάλτσα». Αυτός είναι ένας πολύ έξυπνος τρόπος για να παραμείνεις καινοτόμος, διατηρώντας παράλληλα τα πάντα ασφαλή και σωστά. Το Γραφείο Πνευματικών Δικαιωμάτων των ΗΠΑ ενημερώνει συνεχώς τις οδηγίες του σχετικά με αυτές τις τεχνικές μεθόδους, οπότε είναι καλή ιδέα να παρακολουθείτε τις αναφορές τους.
Το BotNews.today χρησιμοποιεί εργαλεία τεχνητής νοημοσύνης για την έρευνα, συγγραφή, επιμέλεια και μετάφραση περιεχομένου. Η ομάδα μας ελέγχει και επιβλέπει τη διαδικασία για να διατηρεί τις πληροφορίες χρήσιμες, σαφείς και αξιόπιστες.
Βλέπουμε επίσης μεγάλη ανάπτυξη στον κόσμο των synthetic data. Αυτά είναι δεδομένα που δημιουργούνται από μια άλλη AI ειδικά για σκοπούς training. Εφόσον τα δημιούργησε μια μηχανή, δεν υπάρχουν ανθρώπινα ζητήματα πνευματικών δικαιωμάτων για να ανησυχούμε! Ωστόσο, εξακολουθείς να χρειάζεσαι κάποια πραγματικά ανθρώπινα δεδομένα για να ξεκινήσει η διαδικασία. Η ισορροπία μεταξύ της χρήσης πραγματικής ανθρώπινης δημιουργικότητας και των synthetic data είναι ένα σημαντικό επίκεντρο για τους ερευνητές αυτή τη στιγμή. Υπάρχει επίσης μια μεγάλη ώθηση για καλύτερα robots.txt files. Αυτά είναι τα μικρά αρχεία στους ιστότοπους που λένε στις μηχανές αναζήτησης τι μπορούν και τι δεν μπορούν να δουν. Νέες εκδόσεις αυτών των αρχείων σχεδιάζονται για να λένε στους AI scrapers τι ακριβώς επιτρέπεται να χρησιμοποιούν. Είναι μια τεχνική λύση σε ένα πολύ ανθρώπινο πρόβλημα, και βοηθά στην οικοδόμηση ενός πιο ευγενικού και σεβαστού internet για όλους. Για περισσότερα σχετικά με αυτές τις εξελίξεις, μπορείτε να δείτε τα τελευταία updates σχετικά με την αγωγή των New York Times, η οποία αποτελεί μια σημαντική δοκιμαστική περίπτωση για αυτές τις ιδέες.
Σημείωση συντάκτη: Δημιουργήσαμε αυτόν τον ιστότοπο ως έναν πολύγλωσσο κόμβο ειδήσεων και οδηγών τεχνητής νοημοσύνης για άτομα που δεν είναι φανατικοί των υπολογιστών, αλλά εξακολουθούν να θέλουν να κατανοήσουν την τεχνητή νοημοσύνη, να τη χρησιμοποιούν με μεγαλύτερη αυτοπεποίθηση και να παρακολουθούν το μέλλον που ήδη έρχεται.
Η ουσία είναι ότι ο κόσμος της AI «μεγαλώνει». Ξεπερνάμε τη φάση όπου όλα ήταν λίγο «χαοτικά» και μπαίνουμε σε μια εποχή όπου υπάρχουν σαφείς δρόμοι για όλους. Αυτή η συζήτηση για τα πνευματικά δικαιώματα είναι ένα σημάδι ότι η AI γίνεται ένα μόνιμο και σεβαστό μέρος της κοινωνίας μας. Μας κάνει να σκεφτούμε τι σημαίνει να είσαι δημιουργός και πώς μπορούμε να προστατεύσουμε τα πράγματα που φτιάχνουμε. Είτε είσαι λάτρης της τεχνολογίας, ιδιοκτήτης επιχείρησης ή καλλιτέχνης, όλα αυτά είναι πολύ θετικά. Σημαίνει ότι τα εργαλεία που χρησιμοποιούμε θα χτιστούν πάνω σε μια βάση δικαιοσύνης και σεβασμού. Καθώς προχωράμε, θα δούμε ακόμα πιο εκπληκτικές εφευρέσεις που θα μας βοηθήσουν να εργαζόμαστε πιο γρήγορα και να είμαστε πιο δημιουργικοί. Είναι ένα λαμπρό και ηλιόλουστο μέλλον για την τεχνολογία, και είμαστε όλοι μέρος του ταξιδιού. Συνέχισε να είσαι περίεργος και να εξερευνάς, γιατί το καλύτερο έρχεται!