Οι δικαστικές υποθέσεις που μπορεί να αλλάξουν την AI
Οι νομικές μάχες που εκτυλίσσονται αυτή τη στιγμή στα ομοσπονδιακά δικαστήρια δεν αφορούν μόνο χρήματα ή δικαιώματα χρήσης. Αντιπροσωπεύουν έναν θεμελιώδη αγώνα για τον ορισμό της δημιουργίας στην εποχή των generative models. Για χρόνια, οι εταιρείες τεχνολογίας έκαναν scraping στο ανοιχτό διαδίκτυο χωρίς ιδιαίτερη αντίσταση, υποθέτοντας ότι η κλίμακα των δραστηριοτήτων τους θα τους παρείχε μια μορφή de facto ασυλίας. Αυτή η εποχή τελείωσε. Οι δικαστές στη Νέα Υόρκη και την Καλιφόρνια καλούνται τώρα να αποφασίσουν αν μια μηχανή μπορεί να μαθαίνει από υλικό που προστατεύεται από πνευματικά δικαιώματα με τον ίδιο τρόπο που ένας άνθρωπος μαθαίνει από ένα σχολικό βιβλίο, ή αν αυτά τα μοντέλα είναι απλώς εξελιγμένες μηχανές για λογοκλοπή υψηλής ταχύτητας. Το αποτέλεσμα θα καθορίσει την οικονομική δομή του διαδικτύου για την επόμενη δεκαετία. Αν τα δικαστήρια αποφανθούν ότι η εκπαίδευση αποτελεί transformative use, η τρέχουσα πορεία ραγδαίας ανάπτυξης θα συνεχιστεί. Αν αποφασίσουν ότι η εκπαίδευση απαιτεί ρητή άδεια για κάθε δεδομένο, το κόστος δημιουργίας συστημάτων μεγάλης κλίμακας θα εκτοξευθεί. Πρόκειται για τη σημαντικότερη νομική ένταση από τις πρώτες μέρες του file sharing, αλλά το διακύβευμα αφορά τα ίδια τα δομικά στοιχεία της ανθρώπινης γνώσης και έκφρασης.
Καθορίζοντας τα όρια του Fair Use
Στο επίκεντρο σχεδόν κάθε μεγάλης αγωγής βρίσκεται το δόγμα του fair use. Αυτή η νομική αρχή επιτρέπει τη χρήση υλικού που προστατεύεται από πνευματικά δικαιώματα χωρίς άδεια υπό συγκεκριμένες συνθήκες, όπως για κριτική, ειδησεογραφία ή έρευνα. Οι εταιρείες τεχνολογίας υποστηρίζουν ότι τα μοντέλα τους δεν αποθηκεύουν αντίγραφα των πρωτότυπων έργων. Αντίθετα, ισχυρίζονται ότι τα μοντέλα μαθαίνουν τις μαθηματικές σχέσεις μεταξύ λέξεων ή pixel για να δημιουργήσουν κάτι εντελώς νέο. Αυτό είναι που η βιομηχανία αποκαλεί transformative use. Επισημαίνουν προηγούμενες αποφάσεις που αφορούσαν search engines, οι οποίες επιτρεπόταν να ευρετηριάζουν ιστοσελίδες επειδή παρείχαν μια νέα υπηρεσία αντί να αντικαθιστούν το πρωτότυπο περιεχόμενο. Ωστόσο, οι ενάγοντες, συμπεριλαμβανομένων μεγάλων ειδησεογραφικών οργανισμών και ομάδων καλλιτεχνών, υποστηρίζουν ότι τα generative συστήματα είναι διαφορετικά. Ισχυρίζονται ότι αυτά τα μοντέλα έχουν σχεδιαστεί για να ανταγωνίζονται άμεσα τους ανθρώπους των οποίων το έργο χρησιμοποιήθηκε για την εκπαίδευσή τους. Όταν ένας χρήστης ζητά από μια AI να γράψει μια ιστορία στο στυλ ενός συγκεκριμένου εν ζωή συγγραφέα, το μοντέλο χρησιμοποιεί το έργο ζωής αυτού του συγγραφέα για να αντικαταστήσει ενδεχομένως το μελλοντικό του εισόδημα.
Τα διαδικαστικά βήματα σε αυτές τις υποθέσεις είναι εξίσου σημαντικά με τις τελικές αποφάσεις. Πριν ένας δικαστής αποφασίσει επί της ουσίας, πρέπει να αποφανθεί για αιτήσεις απόρριψης και αιτήματα discovery. Αυτά τα αρχικά στάδια αναγκάζουν τις εταιρείες τεχνολογίας να αποκαλύψουν ακριβώς ποια δεδομένα χρησιμοποίησαν και πώς τα επεξεργάστηκαν. Πολλές εταιρείες κρατούσαν τα training sets τους μυστικά, επικαλούμενες ανταγωνιστικό πλεονέκτημα. Τα δικαστήρια τώρα καταργούν αυτή τη μυστικότητα. Ακόμη και αν μια υπόθεση καταλήξει σε συμβιβασμό εκτός δικαστηρίου, οι πληροφορίες που δημοσιοποιούνται κατά τη φάση του discovery μπορούν να παρέχουν έναν οδικό χάρτη για μελλοντική ρύθμιση. Βλέπουμε μια μετατόπιση όπου το βάρος της απόδειξης μετακινείται από τους δημιουργούς στους κολοσσούς της τεχνολογίας. Τα δικαστήρια δεν εξετάζουν μόνο το τελικό output της AI, αλλά ολόκληρο το pipeline της εισαγωγής δεδομένων. Αυτό περιλαμβάνει τον τρόπο με τον οποίο έγινε το scraping, πού αποθηκεύτηκαν και αν παρακάμφθηκαν εργαλεία digital rights management κατά τη διαδικασία. Αυτές οι τεχνικές λεπτομέρειες θα αποτελέσουν τη βάση για νέα νομικά πρότυπα για ολόκληρη τη βιομηχανία.
Διεθνής απόκλιση στα δικαιώματα δεδομένων
Ενώ τα αμερικανικά δικαστήρια εστιάζουν στο fair use, ο υπόλοιπος κόσμος ακολουθεί διαφορετικό δρόμο. Αυτό δημιουργεί ένα κατακερματισμένο νομικό περιβάλλον για τις παγκόσμιες εταιρείες τεχνολογίας. Στην Ευρωπαϊκή Ένωση, το AI Act εισάγει αυστηρές απαιτήσεις διαφάνειας. Επιβάλλει στις εταιρείες να αποκαλύπτουν το υλικό με πνευματικά δικαιώματα που χρησιμοποιήθηκε για εκπαίδευση, ανεξάρτητα από το πού έλαβε χώρα η εκπαίδευση. Αυτό έρχεται σε έντονη αντίθεση με το σύστημα των ΗΠΑ, το οποίο βασίζεται περισσότερο σε δικαστικές διαμάχες εκ των υστέρων. Η προσέγγιση της ΕΕ είναι προληπτική, στοχεύοντας στην αποτροπή παραβίασης πνευματικών δικαιωμάτων πριν καν ένα μοντέλο κυκλοφορήσει στο κοινό. Αυτή η διαφορά στη φιλοσοφία σημαίνει ότι ένα μοντέλο που είναι νόμιμο στο Σαν Φρανσίσκο μπορεί να είναι παράνομο στο Βερολίνο. Για ένα παγκόσμιο κοινό, αυτό σημαίνει ότι οι δυνατότητες που είναι διαθέσιμες στην περιοχή σας θα εξαρτώνται όλο και περισσότερο από τις τοπικές ερμηνείες της κυριαρχίας δεδομένων. Ορισμένες χώρες εξετάζουν ακόμη και εξαιρέσεις για