Γιατί η AI είναι μια ιστορία hardware όσο και software
Η κοινή αντίληψη για την τεχνητή νοημοσύνη εστιάζει σχεδόν αποκλειστικά στον κώδικα. Οι άνθρωποι μιλούν για τα μεγάλα γλωσσικά μοντέλα σαν να υπάρχουν σε ένα κενό καθαρής λογικής. Συζητούν για τη λαμπρότητα ενός αλγορίθμου ή την απόχρωση μιας απάντησης από chatbot. Αυτή η οπτική χάνει τον πιο κρίσιμο παράγοντα στη σημερινή εποχή της τεχνολογίας. Η AI δεν είναι απλώς μια ιστορία λογισμικού. Είναι μια ιστορία βαριάς βιομηχανίας. Αφορά την τεράστια κατανάλωση ηλεκτρικής ενέργειας και τα φυσικά όρια του πυριτίου. Κάθε φορά που ένας χρήστης κάνει μια ερώτηση σε ένα chatbot, μια αλυσίδα φυσικών γεγονότων συμβαίνει σε ένα data center μίλια μακριά. Αυτή η διαδικασία περιλαμβάνει εξειδικευμένα chips που είναι αυτή τη στιγμή τα πιο πολύτιμα εμπορεύματα στον κόσμο. Αν θέλετε να καταλάβετε γιατί ορισμένες εταιρείες κερδίζουν και άλλες αποτυγχάνουν, πρέπει να κοιτάξετε το hardware. Το software είναι το τιμόνι, αλλά το hardware είναι η μηχανή και το καύσιμο. Χωρίς τη φυσική υποδομή, το πιο προηγμένο μοντέλο στον κόσμο είναι απλώς μια συλλογή άχρηστων μαθηματικών.
Το ταβάνι του πυριτίου
Για δεκαετίες, η ανάπτυξη λογισμικού ακολουθούσε μια προβλέψιμη πορεία. Γράφατε κώδικα και έτρεχε σε τυπικούς κεντρικούς επεξεργαστές ή CPUs. Αυτά τα chips ήταν γενικής χρήσης. Μπορούσαν να χειριστούν μια ποικιλία εργασιών το ένα μετά το άλλο. Ωστόσο, η AI άλλαξε τις απαιτήσεις. Τα σύγχρονα μοντέλα δεν χρειάζονται έναν γενικιστή. Χρειάζονται έναν ειδικό που μπορεί να εκτελεί δισεκατομμύρια απλές μαθηματικές πράξεις ταυτόχρονα. Αυτό ονομάζεται παράλληλη επεξεργασία. Η βιομηχανία μετέφερε την εστίασή της στις μονάδες επεξεργασίας γραφικών ή GPUs. Αυτά τα chips σχεδιάστηκαν αρχικά για την απόδοση video games, αλλά οι ερευνητές ανακάλυψαν ότι ήταν τέλεια για τον πολλαπλασιασμό πινάκων που οδηγεί τα νευρωνικά δίκτυα. Αυτή η αλλαγή δημιούργησε ένα τεράστιο bottleneck. Δεν μπορείτε απλά να κατεβάσετε περισσότερη νοημοσύνη. Πρέπει να την χτίσετε με φυσικά εξαρτήματα που είναι απίστευτα δύσκολο να κατασκευαστούν. Ο κόσμος αντιμετωπίζει σήμερα μια πραγματικότητα όπου η ταχύτητα της προόδου της AI υπαγορεύεται από το πόσο γρήγορα εταιρείες όπως η TSMC μπορούν να χαράξουν κυκλώματα σε wafers πυριτίου.
Αυτός ο φυσικός περιορισμός έχει δημιουργήσει ένα νέο είδος ταξικού συστήματος στον κόσμο της τεχνολογίας. Υπάρχουν οι compute rich και οι compute poor. Μια εταιρεία με δέκα χιλιάδες high-end chips μπορεί να εκπαιδεύσει ένα μοντέλο που μια εταιρεία με εκατό chips δεν μπορεί καν να αρχίσει να επιχειρεί. Αυτό δεν είναι θέμα ταλέντου ή έξυπνου κώδικα. Είναι θέμα ωμής ισχύος. Η παρανόηση ότι η AI είναι ένα εξισωτικό πεδίο όπου οποιοσδήποτε με ένα laptop μπορεί να ανταγωνιστεί, ξεθωριάζει. Η τιμή εισόδου για το κορυφαίο επίπεδο ανάπτυξης AI μετριέται πλέον σε δισεκατομμύρια δολάρια σε hardware. Αυτός είναι ο λόγος που βλέπουμε τις μεγαλύτερες εταιρείες τεχνολογίας στον κόσμο να ξοδεύουν πρωτοφανή ποσά σε υποδομές. Δεν αγοράζουν απλώς servers. Χτίζουν τα εργοστάσια του μέλλοντος. Το hardware είναι η τάφρος που προστατεύει τα επιχειρηματικά τους μοντέλα.
Η γεωπολιτική της άμμου και της ενέργειας
Η στροφή προς την AI που βασίζεται στο hardware έχει μετακινήσει το κέντρο βάρους για τη βιομηχανία της τεχνολογίας. Δεν αφορά πλέον μόνο τη Silicon Valley. Αφορά το στενό της Ταϊβάν και τα δίκτυα ηλεκτροδότησης της βόρειας Βιρτζίνια. Η διαδικασία κατασκευής για τα πιο προηγμένα AI chips είναι τόσο περίπλοκη που μόνο μία εταιρεία, η TSMC, μπορεί να το κάνει σε κλίμακα. Αυτό δημιουργεί ένα ενιαίο σημείο αποτυχίας για ολόκληρη την παγκόσμια οικονομία. Αν η παραγωγή στην Ταϊβάν σταματήσει, η πρόοδος της AI σταματά. Αυτός είναι ο λόγος που οι κυβερνήσεις αντιμετωπίζουν πλέον την κατασκευή chips ως ζήτημα εθνικής ασφάλειας. Επιδοτούν την κατασκευή νέων εργοστασίων και επιβάλλουν ελέγχους εξαγωγών σε high-end hardware. Ο στόχος είναι να διασφαλιστεί ότι οι εγχώριες βιομηχανίες τους έχουν πρόσβαση στα φυσικά εξαρτήματα που χρειάζονται για να παραμείνουν ανταγωνιστικές.
Πέρα από τα ίδια τα chips, υπάρχει το ζήτημα της ενέργειας. Τα μοντέλα AI διψούν απίστευτα για ενέργεια. Ένα μόνο query μπορεί να καταναλώσει σημαντικά περισσότερο ηλεκτρισμό από ένα τυπικό αίτημα σε μηχανή αναζήτησης. Αυτό ασκεί τεράστια πίεση στα τοπικά δίκτυα ηλεκτροδότησης. Σε μέρη όπου συγκεντρώνονται τα data centers, η ζήτηση για ηλεκτρική ενέργεια αυξάνεται ταχύτερα από την προσφορά. Αυτό οδήγησε σε ανανεωμένο ενδιαφέρον για την πυρηνική ενέργεια και άλλες πηγές ενέργειας υψηλής χωρητικότητας. Ο Διεθνής Οργανισμός Ενέργειας σημείωσε ότι τα data centers θα μπορούσαν να διπλασιάσουν την κατανάλωση ηλεκτρικής ενέργειας τους έως το 2026. Αυτό δεν είναι ένα πρόβλημα λογισμικού που μπορεί να βελτιστοποιηθεί με καλύτερο κώδικα. Είναι μια φυσική πραγματικότητα του πώς λειτουργούν αυτά τα συστήματα. Ο περιβαλλοντικός αντίκτυπος της AI δεν βρίσκεται στις γραμμές του κώδικα, αλλά στα συστήματα ψύξης και στο αποτύπωμα άνθρακα των εργοστασίων παραγωγής ενέργειας που κρατούν τους servers σε λειτουργία. Οι οργανισμοί πρέπει να υπολογίζουν αυτά τα φυσικά κόστη όταν υπολογίζουν την αξία των πρωτοβουλιών τους στην AI.
Το υψηλό κόστος κάθε prompt
Για να κατανοήσετε τον πρακτικό αντίκτυπο των περιορισμών του hardware, σκεφτείτε μια μέρα στη ζωή μιας ιδρύτριας startup στην τρέχουσα αγορά. Ας την πούμε Sarah. Η Sarah έχει μια λαμπρή ιδέα για ένα νέο ιατρικό διαγνωστικό εργαλείο. Έχει τα δεδομένα και το ταλέντο. Ωστόσο, συνειδητοποιεί γρήγορα ότι το μεγαλύτερο εμπόδιό της δεν είναι ο αλγόριθμος. Είναι το κόστος του inference. Κάθε φορά που ένας γιατρός χρησιμοποιεί το εργαλείο της, πρέπει να πληρώνει για χρόνο σε μια high-end GPU στο cloud. Αυτά τα κόστη δεν είναι στατικά. Κυμαίνονται με βάση την παγκόσμια ζήτηση. Κατά τις ώρες αιχμής, η τιμή του compute μπορεί να εκτοξευθεί, μειώνοντας τα περιθώρια κέρδους της. Ξοδεύει περισσότερο χρόνο διαχειριζόμενη τα cloud credits της και βελτιστοποιώντας τη χρήση του hardware της παρά στην ίδια την ιατρική έρευνα. Αυτή είναι η πραγματικότητα για χιλιάδες δημιουργούς σήμερα. Είναι δεμένοι με τη φυσική διαθεσιμότητα του hardware.
Για τον μέσο χρήστη, αυτό εκδηλώνεται ως latency και περιορισμοί. Έχετε παρατηρήσει ποτέ ότι ένα chatbot γίνεται πιο αργό ή λιγότερο ικανό κατά τη διάρκεια ορισμένων ωρών της ημέρας; Αυτό συμβαίνει συχνά επειδή ο πάροχος φτάνει σε ένα όριο hardware. Διανέμουν το διαθέσιμο compute τους για να διαχειριστούν το φορτίο. Αυτή είναι μια άμεση συνέπεια της φυσικής φύσης της AI. Σε αντίθεση με το παραδοσιακό λογισμικό, το οποίο μπορεί να αντιγραφεί και να διανεμηθεί με σχεδόν μηδενικό οριακό κόστος, κάθε instance ενός μοντέλου AI που τρέχει απαιτεί ένα αποκλειστικό κομμάτι hardware. Αυτό δημιουργεί ένα ταβάνι στο πόσοι άνθρωποι μπορούν να χρησιμοποιούν αυτά τα εργαλεία ταυτόχρονα. Εξηγεί επίσης γιατί πολλές εταιρείες στρέφονται προς μικρότερα μοντέλα που μπορούν να τρέξουν σε τοπικές συσκευές όπως τηλέφωνα ή laptops. Προσπαθούν να μεταφέρουν το βάρος του hardware από τα data centers τους στον τελικό χρήστη. Αυτή η αλλαγή οδηγεί σε έναν νέο κύκλο αναβαθμίσεων καταναλωτικού hardware. Οι άνθρωποι αγοράζουν νέους υπολογιστές όχι επειδή οι παλιοί τους χάλασαν, αλλά επειδή οι παλιοί τους στερούνται τα εξειδικευμένα chips που χρειάζονται για να τρέξουν σύγχρονα χαρακτηριστικά AI τοπικά.
Το BotNews.today χρησιμοποιεί εργαλεία τεχνητής νοημοσύνης για την έρευνα, συγγραφή, επιμέλεια και μετάφραση περιεχομένου. Η ομάδα μας ελέγχει και επιβλέπει τη διαδικασία για να διατηρεί τις πληροφορίες χρήσιμες, σαφείς και αξιόπιστες.
Οι δυναμικές της επιχειρηματικής ισχύος αλλάζουν επίσης. Στο παρελθόν, μια εταιρεία λογισμικού μπορούσε να κλιμακωθεί παγκοσμίως με ένα πολύ μικρό φυσικό αποτύπωμα. Σήμερα, οι εταιρείες με τη μεγαλύτερη δύναμη είναι αυτές που κατέχουν την υποδομή. Αυτός είναι ο λόγος που η NVIDIA έχει γίνει μία από τις πιο πολύτιμες εταιρείες στον κόσμο. Παρέχουν τα εργαλεία για τον πυρετό του χρυσού της AI. Ακόμη και οι πιο επιτυχημένες εταιρείες λογισμικού AI είναι συχνά απλώς ενοικιαστές στα data centers των μεγαλύτερων ανταγωνιστών τους. Αυτό δημιουργεί μια επισφαλή κατάσταση. Αν ο ιδιοκτήτης αποφασίσει να αυξήσει το ενοίκιο ή να δώσει προτεραιότητα στα δικά του εσωτερικά έργα, η εταιρεία λογισμικού δεν έχει πού αλλού να πάει. Το φυσικό επίπεδο είναι η απόλυτη πηγή μόχλευσης στη σύγχρονη οικονομία της τεχνολογίας. Είναι μια επιστροφή σε μια πιο βιομηχανική μορφή ανταγωνισμού όπου η κλίμακα και τα φυσικά περιουσιακά στοιχεία έχουν μεγαλύτερη σημασία από τις απλώς έξυπνες ιδέες.
Οι ερωτήσεις που δεν κάνουμε
Καθώς προχωράμε βαθύτερα σε αυτή την εποχή που εξαρτάται από το hardware, πρέπει να κάνουμε δύσκολες ερωτήσεις σχετικά με τα κρυφά κόστη. Ποιος ωφελείται πραγματικά όταν τα εμπόδια εισόδου είναι τόσο υψηλά; Αν μόνο μια χούφτα εταιρειών μπορεί να αντέξει οικονομικά το hardware που απαιτείται για την κατασκευή των πιο προηγμένων μοντέλων, τι σημαίνει αυτό για τον ανταγωνισμό και την καινοτομία; Βλέπουμε μια συγκέντρωση ισχύος που είναι πρωτοφανής στην ιστορία της τεχνολογίας. Αυτή η συγκεντροποίηση δημιουργεί έναν τεράστιο κίνδυνο για την ιδιωτικότητα και τη λογοκρισία. Αν όλη η επεξεργασία AI συμβαίνει σε μερικές χιλιάδες servers που ανήκουν σε τρεις ή τέσσερις εταιρείες, αυτές οι εταιρείες έχουν τον απόλυτο έλεγχο για το τι μπορεί να ειπωθεί και τι μπορεί να γίνει με την τεχνολογία. Τι συμβαίνει με την κυριαρχία μικρότερων εθνών που δεν έχουν την οικονομική δυνατότητα να χτίσουν τη δική τους υποδομή AI;
Υπάρχει επίσης το ερώτημα των φυσικών υλικών που απαιτούνται για την κατασκευή αυτών των μηχανών. Το hardware AI εξαρτάται από σπάνια μέταλλα και περίπλοκες εφοδιαστικές αλυσίδες που συχνά βρίσκονται σε ασταθείς περιοχές. Το περιβαλλοντικό κόστος της εξόρυξης αυτών των υλικών συζητείται σπάνια στο πλαίσιο της προόδου της AI. Μιλάμε για την κομψότητα του μοντέλου ενώ αγνοούμε τα ορυχεία ανοιχτού λάκκου και τα τοξικά απόβλητα που παράγονται κατά τη διαδικασία κατασκευής. Αξίζει το όφελος ενός ελαφρώς καλύτερου chatbot την οικολογική ζημιά που προκαλείται από το hardware που απαιτεί; Επιπλέον, πρέπει να εξετάσουμε τη μακροπρόθεσμη βιωσιμότητα των τρεχουσών τάσεων κατανάλωσης ενέργειας. Σύμφωνα με αναφορές από τον Διεθνή Οργανισμό Ενέργειας, η αύξηση της ζήτησης ενέργειας των data centers ξεπερνά ήδη την προσθήκη ανανεώσιμων πηγών ενέργειας σε ορισμένες περιοχές. Χτίζουμε ένα τεχνολογικό μέλλον που ο πλανήτης δεν μπορεί πραγματικά να υποστηρίξει; Αυτά δεν είναι τεχνικά bugs που πρέπει να διορθωθούν. Είναι θεμελιώδεις συμβιβασμοί που έρχονται με την απόφαση να επιδιώξουμε την AI σε αυτή την κλίμακα. Πρέπει να είμαστε ειλικρινείς σχετικά με το γεγονός ότι η AI είναι μια φυσική παρέμβαση στον κόσμο, όχι μόνο μια ψηφιακή.
Αρχιτεκτονική και Latency
Για τους power users και τους προγραμματιστές, η ιστορία του hardware γίνεται ακόμα πιο συγκεκριμένη. Δεν αφορά μόνο το να έχεις μια GPU. Αφορά τη συγκεκριμένη αρχιτεκτονική αυτής της GPU. Ένα από τα μεγαλύτερα bottlenecks στη σύγχρονη AI δεν είναι η ταχύτητα του επεξεργαστή, αλλά η ταχύτητα της μνήμης. Αυτό είναι γνωστό ως το memory wall. Η High Bandwidth Memory ή HBM είναι απαραίτητη για να διατηρείται ο επεξεργαστής τροφοδοτημένος με δεδομένα. Αν η μνήμη είναι πολύ αργή, ο επεξεργαστής μένει αδρανής, σπαταλώντας ακριβούς κύκλους υπολογισμού. Αυτός είναι ο λόγος που τα τελευταία chips από μεγάλους κατασκευαστές εστιάζουν τόσο πολύ στο bandwidth και τη χωρητικότητα της μνήμης. Αν τρέχετε ένα τοπικό μοντέλο, το ποσό της VRAM στην κάρτα σας είναι ο πιο σημαντικός παράγοντας. Καθορίζει το μέγεθος του μοντέλου που μπορείτε να φορτώσετε και την ταχύτητα με την οποία μπορεί να παράγει κείμενο.
Η ενσωμάτωση στη ροή εργασίας γίνεται επίσης πρόβλημα hardware. Πολλά επαγγελματικά εργαλεία ενσωματώνουν πλέον χαρακτηριστικά AI που απαιτούν συγκεκριμένα όρια API ή τοπική επιτάχυνση. Αν χρησιμοποιείτε ένα cloud-based API, υπόκειστε στη διαθεσιμότητα hardware του παρόχου. Αυτό μπορεί να οδηγήσει σε απρόβλεπτο latency που καταστρέφει την εμπειρία του χρήστη. Για την τοπική αποθήκευση, οι απαιτήσεις αυξάνονται επίσης. Η αποθήκευση μεγάλων μοντέλων και των datasets που χρησιμοποιούνται για το fine-tuning τους απαιτεί terabytes γρήγορης αποθήκευσης NVMe. Βλέπουμε επίσης την άνοδο εξειδικευμένων interconnects όπως το NVLink, τα οποία επιτρέπουν σε πολλαπλές GPUs να επικοινωνούν μεταξύ τους με απίστευτες ταχύτητες. Αυτό είναι απαραίτητο επειδή τα μεγαλύτερα μοντέλα δεν χωρούν πλέον σε ένα μόνο chip. Πρέπει να διαμοιραστούν σε δεκάδες ή και εκατοντάδες chips, όλα να δουλεύουν σε τέλειο συγχρονισμό. Αν η φυσική σύνδεση μεταξύ αυτών των chips είναι πολύ αργή, ολόκληρο το σύστημα καταρρέει. Αυτό το επίπεδο πολυπλοκότητας hardware απέχει πολύ από τις μέρες της απλής συγγραφής ενός script και της εκτέλεσής του σε ένα laptop. Μπορείτε να βρείτε πιο αναλυτικούς οδηγούς για τη βελτιστοποίηση του τοπικού σας setup στον ιστότοπο του AI Magazine. Η κατανόηση αυτών των τεχνικών προδιαγραφών δεν είναι πλέον προαιρετική για όποιον θέλει να εργαστεί στην αιχμή αυτού του πεδίου. Η διαφορά μεταξύ μιας επιτυχημένης ανάπτυξης και μιας αποτυχίας συχνά καταλήγει στο πόσο καλά διαχειρίζεστε τους φυσικούς περιορισμούς του hardware stack σας.
Η φυσική πραγματικότητα
Το αφήγημα της AI ως ένα καθαρά ψηφιακό φαινόμενο έχει πεθάνει. Η πραγματικότητα είναι ότι η AI είναι μια φυσική βιομηχανία που απαιτεί τεράστιες ποσότητες γης, νερού, ενέργειας και πυριτίου. Η πρόοδος που βλέπουμε τα επόμενα χρόνια θα καθοριστεί τόσο από ανακαλύψεις στην επιστήμη των υλικών και την παραγωγή ενέργειας όσο και από ανακαλύψεις στη μηχανική μάθηση. Εισερχόμαστε σε μια περίοδο όπου ο φυσικός κόσμος επιβεβαιώνει την κυριαρχία του πάνω στον ψηφιακό κόσμο. Οι εταιρείες που το κατανοούν αυτό και επενδύουν στο δικό τους hardware και στις προμήθειες ενέργειας θα είναι αυτές που θα ηγηθούν. Όσες αντιμετωπίζουν το hardware ως δευτερεύον ζήτημα θα βρεθούν εκτός αγοράς λόγω κόστους. Το πιο σημαντικό πράγμα που πρέπει να θυμάστε είναι ότι κάθε bit ψηφιακής νοημοσύνης έχει ένα φυσικό σπίτι. Έως το 2026, ο χάρτης του κόσμου της AI θα μοιάζει πολύ με έναν χάρτη των πιο ισχυρών βιομηχανικών κόμβων του κόσμου. Το ταβάνι του πυριτίου είναι πραγματικό και όλοι ζούμε κάτω από αυτό.
Σημείωση συντάκτη: Δημιουργήσαμε αυτόν τον ιστότοπο ως έναν πολύγλωσσο κόμβο ειδήσεων και οδηγών τεχνητής νοημοσύνης για άτομα που δεν είναι φανατικοί των υπολογιστών, αλλά εξακολουθούν να θέλουν να κατανοήσουν την τεχνητή νοημοσύνη, να τη χρησιμοποιούν με μεγαλύτερη αυτοπεποίθηση και να παρακολουθούν το μέλλον που ήδη έρχεται.
Βρήκατε κάποιο λάθος ή κάτι που χρειάζεται διόρθωση; Ενημερώστε μας.