Ιδρυτές, Ερευνητές και η Αλήθεια πίσω από το AI
Οι περισσότεροι γνωρίζουν τον CEO της OpenAI. Λίγοι όμως ξέρουν τους συγγραφείς της έρευνας που καθόρισε την τρέχουσα εποχή των μεγάλων γλωσσικών μοντέλων (LLMs). Αυτό το κενό γνώσης δημιουργεί μια διαστρεβλωμένη εικόνα για το πώς προχωρά πραγματικά η τεχνολογία. Αντιμετωπίζουμε το artificial intelligence σαν μια σειρά από product launches, ενώ στην πραγματικότητα πρόκειται για μια αργή συσσώρευση μαθηματικών ανακαλύψεων. Οι ιδρυτές διαχειρίζονται το κεφάλαιο και το δημόσιο αφήγημα. Οι ερευνητές διαχειρίζονται τα weights και τη λογική. Η κατανόηση αυτής της διαφοράς είναι ο μόνος τρόπος για να δεις πέρα από τα marketing σύννεφα. Αν ακολουθείς μόνο τους ιδρυτές, βλέπεις μια ταινία. Αν ακολουθείς τους ερευνητές, διαβάζεις το σενάριο. Αυτό το άρθρο εξετάζει γιατί αυτή η διάκριση έχει σημασία και πώς να εντοπίζεις τα σήματα που καθορίζουν το μέλλον του κλάδου. Θα αφήσουμε πίσω τις χαρισματικές ομιλίες για να δούμε την ψυχρή πραγματικότητα του lab. Ήρθε η ώρα να εστιάσουμε σε αυτούς που γράφουν τον κώδικα και όχι μόνο σε αυτούς που υπογράφουν τα press releases.
Οι Αόρατοι Αρχιτέκτονες της Μηχανικής Εποχής
Οι ιδρυτές είναι το δημόσιο πρόσωπο. Μιλούν στο World Economic Forum και καταθέτουν στο Κογκρέσο. Η δουλειά τους είναι να εξασφαλίζουν δισεκατομμύρια σε funding και να χτίζουν ένα brand που μοιάζει αναπόφευκτο. Χρησιμοποιούν λέξεις που παραπέμπουν σε μαγεία. Οι ερευνητές είναι διαφορετικοί. Δουλεύουν σε Python και LaTeX. Τους ενδιαφέρουν τα loss functions και το token efficiency. Ένας ιδρυτής μπορεί να πει ότι το μοντέλο του «σκέφτεται». Ένας ερευνητής θα σου πει ότι προβλέπει την επόμενη πιο πιθανή λέξη βάσει μιας συγκεκριμένης κατανομής πιθανοτήτων. Η σύγχυση προκύπτει επειδή τα media αντιμετωπίζουν αυτές τις δύο ομάδες ως μία. Όταν ένας CEO λέει ότι ένα μοντέλο θα λύσει την κλιματική αλλαγή, είναι πωλήσεις. Όταν ένας ερευνητής δημοσιεύει μια έρευνα για sparse autoencoders, είναι ένας τεχνικός ισχυρισμός. Το ένα είναι ελπίδα. Το άλλο είναι γεγονός.
Το κοινό συχνά μπερδεύει την ελπίδα με το γεγονός. Αυτό οδηγεί σε έναν κύκλο υπερβολικών υποσχέσεων. Για να κατανοήσεις αυτόν τον τομέα, πρέπει να διαχωρίσεις αυτόν που πουλάει το αυτοκίνητο από αυτόν που σχεδίασε τη μηχανή. Ο σχεδιαστής της μηχανής ξέρει ακριβώς πού είναι χαλαρές οι βίδες. Ο πωλητής δεν θα σου πει ποτέ για τις χαλαρές βίδες γιατί η δουλειά του είναι να κρατά την τιμή της μετοχής ψηλά. Το βλέπουμε να συμβαίνει κάθε φορά που κυκλοφορεί ένα νέο μοντέλο. Ο ιδρυτής κάνει ένα αινιγματικό tweet για να χτίσει hype. Ο ερευνητής δημοσιεύει έναν σύνδεσμο για ένα τεχνικό report στο arXiv. Το tweet παίρνει ένα εκατομμύριο views. Το τεχνικό report διαβάζεται από μερικές χιλιάδες ανθρώπους που πραγματικά χτίζουν πράγματα. Αυτό δημιουργεί ένα feedback loop όπου οι πιο δυνατές φωνές ορίζουν την πραγματικότητα για όλους τους άλλους.
Πέρα από το Δημόσιο Πρόσωπο της Καινοτομίας
Αυτό το χάσμα έχει τεράστιες επιπτώσεις στην παγκόσμια πολιτική. Οι κυβερνήσεις γράφουν νόμους βασισμένες στις προειδοποιήσεις των ιδρυτών. Αυτοί οι ιδρυτές συχνά προειδοποιούν για υπαρξιακούς κινδύνους που μοιάζουν με επιστημονική φαντασία. Αυτό κρατά την εστίαση σε υποθετικά μέλλοντα αντί για τρέχουσες βλάβες. Εν τω μεταξύ, οι ερευνητές επισημαίνουν άμεσα ζητήματα όπως το data bias και η κατανάλωση ενέργειας. Ακούγοντας κυρίως τα διάσημα ονόματα, ρισκάρουμε να ρυθμίσουμε τα λάθος πράγματα. Μπορεί να απαγορεύσουμε μια μελλοντική υπερνοημοσύνη αγνοώντας ότι τα τρέχοντα μοντέλα αδειάζουν τους υδροφόρους ορίζοντες μικρών πόλεων για να ψύξουν τα data centers τους. Αυτό δεν είναι μόνο αμερικανικό ζήτημα. Στην Ευρώπη και την Ασία, υπάρχει η ίδια δυναμική.
Οι φωνές που παίρνουν τον περισσότερο χρόνο είναι αυτές με τα μεγαλύτερα marketing budgets. Αυτό δημιουργεί ένα περιβάλλον όπου λίγες εταιρείες ορίζουν την ατζέντα για ολόκληρο τον πλανήτη. Αν δεν διευρύνουμε την οπτική μας, επιτρέπουμε σε μια χούφτα ανθρώπων στη Silicon Valley να ορίζουν τι είναι ασφαλές και τι είναι εφικτό. Αυτή η συγκέντρωση ισχύος είναι από μόνη της κίνδυνος. Περιορίζει την ποικιλομορφία της σκέψης σε έναν τομέα που την απαιτεί. Πρέπει να ακούσουμε τους ανθρώπους από το University of Toronto ή τα labs στο Τόκιο όσο ακούμε και τους ανθρώπους στο Σαν Φρανσίσκο. Η επιστημονική πρόοδος είναι μια παγκόσμια προσπάθεια, αλλά το αφήγημα είναι επί του παρόντος ένα τοπικό μονοπώλιο. Πρέπει να κοιτάξουμε περιοδικά όπως το Nature για να δούμε την πραγματική πρόοδο που γίνεται έξω από τα εταιρικά διοικητικά συμβούλια.
Γιατί ο Κόσμος Ακούει τους Λάθος Ανθρώπους
Σκέψου μια μέρα στη ζωή ενός lead researcher σε ένα μεγάλο lab. Ξυπνάει και ελέγχει τα αποτελέσματα ενός training run που κόστισε τρία εκατομμύρια δολάρια. Βλέπει ότι το μοντέλο κάνει περισσότερα hallucinations από το αναμενόμενο. Ξοδεύει δέκα ώρες κοιτάζοντας data clusters για να βρει τον θόρυβο. Δεν σκέφτεται τις εκλογές του 2024 ή τη μοίρα της ανθρωπότητας. Σκέφτεται γιατί το μοντέλο αποτυγχάνει να κατανοήσει την άρνηση σε σύνθετες προτάσεις. Κοιτάζει heat maps ενεργοποίησης νευρώνων. Η επιτυχία τους μετριέται σε bits ανά χαρακτήρα ή ακρίβεια σε ένα συγκεκριμένο benchmark. Τώρα σκέψου τη μέρα ενός ιδρυτή. Είναι σε ένα private jet για να συναντήσει έναν αρχηγό κράτους. Μιλάει για την ευκαιρία τρισεκατομμυρίων της νέας οικονομίας.
Ο ερευνητής ασχολείται με το «πώς». Ο ιδρυτής ασχολείται με το «γιατί αξίζει χρήματα». Για έναν developer που χτίζει ένα app, ο ερευνητής είναι το πιο σημαντικό πρόσωπο. Ο ερευνητής καθορίζει το API latency και το context window. Ο ιδρυτής καθορίζει την τιμή. Αν προσπαθείς να χτίσεις μια επιχείρηση, πρέπει να ξέρεις αν η τεχνολογία μπορεί πραγματικά να κάνει αυτά που λέει ο ιδρυτής. Συχνά, δεν μπορεί. Το είδαμε αυτό με τις πρώτες μέρες της αυτόνομης οδήγησης. Οι ιδρυτές έλεγαν ότι θα είχαμε εκατομμύρια robotaxis μέχρι το 2026. Οι ερευνητές ήξεραν ότι τα edge cases στη δυνατή βροχή ήταν ακόμα ένα άλυτο πρόβλημα. Το κοινό πίστεψε τους ιδρυτές. Οι ερευνητές είχαν δίκιο.
Αυτό το ίδιο μοτίβο επαναλαμβάνεται στον χώρο του generative AI. Μας λένε ότι τα μοντέλα σύντομα θα αντικαταστήσουν δικηγόρους και γιατρούς. Αν διαβάσεις τα τεχνικά papers, θα δεις ότι τα μοντέλα ακόμα δυσκολεύονται με τη βασική λογική συνέπεια. Το χάσμα μεταξύ του demo και της πραγματικότητας είναι εκεί όπου οι εταιρείες χάνουν χρήματα. Μπορείς να βρεις ένα deep dive στα trends του artificial intelligence για να δεις πώς δοκιμάζονται σήμερα αυτά τα τεχνικά όρια. Αυτή η διάκριση είναι η διαφορά μεταξύ μιας σωστής επένδυσης και μιας κερδοσκοπικής φούσκας. Όταν ακούς έναν νέο ισχυρισμό, αναρωτήσου αν προήλθε από ένα paper ή ένα press release. Η απάντηση θα σου πει πόση βαρύτητα να του δώσεις. Οι δημοσιογράφοι στο MIT Technology Review συχνά αναδεικνύουν αυτό το χάσμα μεταξύ του lab και του lobby. Πρέπει να θυμόμαστε ότι οι ιδρυτές έχουν κίνητρο να κρύψουν τα ελαττώματα, ενώ οι ερευνητές έχουν κίνητρο να τα βρουν. Οι πρώτοι χτίζουν το hype και οι δεύτεροι χτίζουν την αλήθεια. Μακροπρόθεσμα, η αλήθεια είναι το μόνο πράγμα που κλιμακώνεται. Το είδαμε αυτό το 2026 όταν το πρώτο κύμα hype άρχισε να ψύχεται κάτω από το βάρος της τεχνικής πραγματικότητας.
Μια Τρίτη στο Lab έναντι του Boardroom
Πρέπει να κάνουμε δύσκολες ερωτήσεις για την τρέχουσα πορεία ανάπτυξης. Ποιος πληρώνει για την έρευνα που οι ιδρυτές ισχυρίζονται ότι θα ωφελήσει τους πάντες; Οι περισσότεροι κορυφαίοι ερευνητές έχουν εγκαταλείψει την ακαδημία για private labs. Αυτό σημαίνει ότι η γνώση που παράγουν δεν είναι πλέον δημόσιο αγαθό. Είναι εταιρικό μυστικό. Τι συμβαίνει στην επιστημονική μέθοδο όταν τα δεδομένα που χρησιμοποιούνται για να αποδειχθεί ένα σημείο είναι κρυμμένα πίσω από ένα paywall; Βλέπουμε μια στροφή από την open science προς ένα μοντέλο κλειστού ανταγωνιστικού πλεονεκτήματος. Η φήμη μερικών ατόμων βοηθά τον τομέα ή δημιουργεί μια προσωπολατρία που αποθαρρύνει τη διαφωνία; Αν ένας ερευνητής βρει ένα σημαντικό ελάττωμα σε ένα flagship μοντέλο, νιώθει ασφαλής να το αναφέρει αν αυτό μπορεί να ρίξει την αποτίμηση της εταιρείας;
Το BotNews.today χρησιμοποιεί εργαλεία τεχνητής νοημοσύνης για την έρευνα, συγγραφή, επιμέλεια και μετάφραση περιεχομένου. Η ομάδα μας ελέγχει και επιβλέπει τη διαδικασία για να διατηρεί τις πληροφορίες χρήσιμες, σαφείς και αξιόπιστες.
Η οικονομική πίεση σε αυτές τις εταιρείες είναι τεράστια. Πρέπει επίσης να εξετάσουμε το περιβαλλοντικό κόστος. Αξίζει η επιδίωξη ελαφρώς καλύτερων benchmarks το τεράστιο carbon footprint της εκπαίδευσης αυτών των μοντέλων; Συχνά μιλάμε για τα οφέλη του AI για το περιβάλλον, αλλά σπάνια βλέπουμε έναν ισολογισμό που εξισορροπεί τα δύο. Τέλος, ποιος κατέχει την κουλτούρα πάνω στην οποία εκπαιδεύονται αυτά τα μοντέλα; Οι ερευνητές χρησιμοποιούν τη συλλογική παραγωγή του internet για να χτίσουν τα συστήματά τους. Οι ιδρυτές στη συνέχεια χρεώνουν το κοινό για να αποκτήσει πρόσβαση σε μια αποσταγμένη έκδοση της ίδιας παραγωγής. Αυτή είναι μια μεταφορά πλούτου που σπάνια συζητείται στα πρωτοσέλιδα. Αυτά δεν είναι μόνο τεχνικά προβλήματα. Είναι κοινωνικά και ηθικά διλήμματα που απαιτούν κάτι παραπάνω από έναν καλύτερο αλγόριθμο για να λυθούν.
Τεχνικοί Περιορισμοί και Τοπική Υλοποίηση
Για όσους χτίζουν πάνω σε αυτές τις πλατφόρμες, οι τεχνικές λεπτομέρειες έχουν μεγαλύτερη σημασία από τη φιλοσοφία. Τα τρέχοντα API limits είναι ένα σημαντικό bottleneck για την υιοθέτηση από επιχειρήσεις. Οι περισσότεροι providers έχουν αυστηρά rate limits που εμποδίζουν το high volume real time processing. Αυτός είναι ο λόγος που πολλές εταιρείες εξετάζουν το local storage και την local εκτέλεση. Η χρήση μοντέλων όπως το Llama 3 σε τοπικό hardware επιτρέπει καλύτερο data privacy και χαμηλότερο μακροπρόθεσμο κόστος. Ωστόσο, οι απαιτήσεις σε hardware είναι υψηλές. Για να τρέξεις ένα μοντέλο 70 δισεκατομμυρίων παραμέτρων με αξιοπρεπή ταχύτητα, χρειάζεσαι high end GPUs με σημαντική VRAM. Εδώ το geek section συναντά το οικονομικό section. Το κόστος ενός cluster H100 είναι ένα εμπόδιο εισόδου που κρατά τη δύναμη στα χέρια των πλουσίων.
Βλέπουμε επίσης μια στροφή προς το εξειδικευμένο fine tuning. Αντί να χρησιμοποιούν ένα γενικό μοντέλο για τα πάντα, οι developers χρησιμοποιούν μικρότερα μοντέλα εκπαιδευμένα σε συγκεκριμένα datasets. Αυτό βελτιώνει την ακρίβεια και μειώνει το token count. Η τεχνική πρόκληση εδώ είναι το data curation. Αν τα δεδομένα εισόδου είναι κακής ποιότητας, το fine tuned μοντέλο θα είναι χειρότερο από το γενικό. Βλέπουμε επίσης περισσότερη χρήση του Retrieval Augmented Generation (RAG) για να βασίζονται τα μοντέλα σε πραγματικά δεδομένα. Αυτό παρακάμπτει την ανάγκη για τεράστια context windows και μειώνει τα hallucinations. Αλλά το RAG έχει τα δικά του όρια, ειδικά στο πώς διαχειρίζεται το ranking των εγγράφων που ανακτώνται. Αν το search step αποτύχει, το output του μοντέλου είναι άχρηστο. Οι περισσότεροι χρήστες δεν συνειδητοποιούν ότι η απόδοση ενός AI εξαρτάται τόσο από τη βάση δεδομένων που ερωτά όσο και από το ίδιο το μοντέλο.
Το Τελικό Φίλτρο για την Πληροφορία
Το μέλλον του AI δεν είναι μια ενιαία ιστορία που λέγεται από ένα μόνο άτομο. Είναι μια χαοτική, συνεχιζόμενη συζήτηση μεταξύ αυτών που πουλάνε ένα όραμα και αυτών που χτίζουν την πραγματικότητα. Για να είσαι έξυπνος καταναλωτής tech ειδήσεων, πρέπει να μάθεις να κοιτάς πέρα από τον χαρισματικό ιδρυτή. Ψάξε τα ονόματα στα papers. Ψάξε τους ερευνητές που είναι πρόθυμοι να μιλήσουν για το τι δεν μπορούν να κάνουν τα μοντέλα τους. Οι αντιφάσεις στον κλάδο δεν είναι bugs. Είναι το πιο ειλικρινές κομμάτι της ιστορίας. Ο τομέας θα συνεχίσει να εξελίσσεται γιατί τα τεχνικά προβλήματα απέχουν πολύ από το να λυθούν. Το ζωντανό ερώτημα παραμένει: μπορούμε να χτίσουμε ένα πραγματικά ευφυές σύστημα χωρίς την τεράστια κατανάλωση πόρων που ορίζει την τρέχουσα εποχή; Μέχρι να απαντήσουμε σε αυτό, το hype θα συνεχίσει να ξεπερνά την επιστήμη. Πρέπει να παραμείνουμε σκεπτικοί απέναντι σε οποιοδήποτε αφήγημα υπόσχεται μια τέλεια λύση χωρίς να αναφέρει τα trade offs που εμπλέκονται.
Σημείωση συντάκτη: Δημιουργήσαμε αυτόν τον ιστότοπο ως έναν πολύγλωσσο κόμβο ειδήσεων και οδηγών τεχνητής νοημοσύνης για άτομα που δεν είναι φανατικοί των υπολογιστών, αλλά εξακολουθούν να θέλουν να κατανοήσουν την τεχνητή νοημοσύνη, να τη χρησιμοποιούν με μεγαλύτερη αυτοπεποίθηση και να παρακολουθούν το μέλλον που ήδη έρχεται.
Βρήκατε κάποιο λάθος ή κάτι που χρειάζεται διόρθωση; Ενημερώστε μας.