Η κρυφή μηχανή πίσω από το AI: Chips, Cloud και βιομηχανική κλίμακα
Η τεχνητή νοημοσύνη περιγράφεται συχνά ως μια σειρά από αιθέριους αλγόριθμους που ζουν στο cloud. Αυτή η περιγραφή είναι ένας βολικός μύθος που αγνοεί τα τεράστια βιομηχανικά μηχανήματα που απαιτούνται για να διατηρηθούν αυτά τα συστήματα σε λειτουργία. Η πραγματικότητα του σύγχρονου AI βρίσκεται στον φυσικό κόσμο των γραμμών μεταφοράς υψηλής τάσης, των τεράστιων συστημάτων ψύξης και της εξειδικευμένης κατασκευής πυριτίου. Ενώ τα software updates κινούνται με την ταχύτητα του φωτός, η υποδομή που τα υποστηρίζει κινείται με την ταχύτητα του μπετόν και του ατσαλιού. Η πρόοδος των large scale μοντέλων προσκρούει πλέον στα σκληρά όρια της φυσικής και της εφοδιαστικής. Βλέπουμε μια μετατόπιση όπου η ικανότητα εξασφάλισης μιας σύνδεσης στο δίκτυο ή μιας άδειας για ένα data center είναι εξίσου σημαντική με την ικανότητα συγγραφής αποδοτικού κώδικα. Η κατανόηση του μέλλοντος της τεχνολογίας απαιτεί να κοιτάξουμε πέρα από την οθόνη, στη βαριά βιομηχανία που την τροφοδοτεί. Το bottleneck δεν είναι πλέον μόνο η ανθρώπινη εφευρετικότητα, αλλά η διαθεσιμότητα γης, νερού και ηλεκτρικής ενέργειας σε κλίμακα που λίγες βιομηχανίες έχουν απαιτήσει ποτέ.
Το βιομηχανικό βάρος της εικονικής νοημοσύνης
Το hardware που απαιτείται για το AI είναι πολύ πιο περίπλοκο από τον τυπικό εξοπλισμό server. Ξεκινά με τον εξειδικευμένο σχεδιασμό chip, αλλά η ιστορία μεταφέρεται γρήγορα στο packaging και τη μνήμη. Η High Bandwidth Memory είναι απαραίτητη για την τροφοδοσία δεδομένων στους επεξεργαστές αρκετά γρήγορα ώστε να διατηρείται η απόδοση. Αυτή η μνήμη είναι στοιβασμένη κάθετα και ενσωματωμένη στον επεξεργαστή χρησιμοποιώντας προηγμένες τεχνικές όπως Chip on Wafer on Substrate. Αυτή η διαδικασία διαχειρίζεται από έναν πολύ μικρό αριθμό εταιρειών, δημιουργώντας ένα στενό χωνί για ολόκληρη την παγκόσμια προσφορά. Το networking είναι ένα άλλο κρίσιμο φυσικό συστατικό. Αυτά τα συστήματα δεν λειτουργούν μεμονωμένα. Απαιτούν high speed interconnects όπως το InfiniBand για να επιτρέπουν σε χιλιάδες chips να λειτουργούν ως μία ενιαία μονάδα. Αυτό δημιουργεί φυσικούς περιορισμούς στον τρόπο με τον οποίο κατασκευάζονται τα data centers, επειδή το μήκος των καλωδίων χαλκού ή οπτικών ινών μπορεί να επηρεάσει την ταχύτητα ολόκληρου του συστήματος.
Η κατασκευή αυτών των εξαρτημάτων συγκεντρώνεται σε λίγες εξαιρετικά εξειδικευμένες εγκαταστάσεις. Μια μόνο εταιρεία, η TSMC, παράγει τη συντριπτική πλειοψηφία των high end chips παγκοσμίως. Αυτή η συγκέντρωση σημαίνει ότι ένα μεμονωμένο τοπικό γεγονός ή μια αλλαγή στην εμπορική πολιτική μπορεί να σταματήσει την πρόοδο για ολόκληρο τον κλάδο. Η πολυπλοκότητα του κατασκευαστικού εξοπλισμού είναι επίσης ένας παράγοντας. Τα μηχανήματα που χρησιμοποιούν extreme ultraviolet lithography είναι τα πιο περίπλοκα εργαλεία που έχουν κατασκευαστεί ποτέ από ανθρώπους. Παράγονται μόνο από μία εταιρεία στον κόσμο και απαιτούν χρόνια προετοιμασίας για παραγγελία και εγκατάσταση. Αυτός δεν είναι ένας κόσμος ταχείας επανάληψης. Είναι ένας κόσμος μακροπρόθεσμου σχεδιασμού και τεράστιων κεφαλαιουχικών δαπανών. Η υποδομή είναι το θεμέλιο πάνω στο οποίο χτίζεται κάθε chatbot και image generator. Χωρίς αυτό το φυσικό επίπεδο, το software απλά δεν μπορεί να υπάρξει.
- Οι προηγμένες τεχνικές packaging όπως το CoWoS αποτελούν επί του παρόντος το κύριο bottleneck στην προσφορά chip.
- Η παραγωγή High Bandwidth Memory απαιτεί εξειδικευμένα εργοστάσια που λειτουργούν ήδη στο μέγιστο της χωρητικότητάς τους.
- Το hardware δικτύωσης πρέπει να σχεδιαστεί για να διαχειρίζεται τεράστιο throughput δεδομένων με ελάχιστο latency.
- Ο κατασκευαστικός εξοπλισμός για τους τελευταίους κόμβους έχει καθυστέρηση παραγγελιών πολλών ετών.
- Η συγκέντρωση της παραγωγής σε συγκεκριμένες γεωγραφικές περιοχές δημιουργεί σημαντικό κίνδυνο στην εφοδιαστική αλυσίδα.
Ο γεωπολιτικός χάρτης της υπολογιστικής ισχύος
Η συγκέντρωση της παραγωγής hardware έχει μετατρέψει το AI σε ζήτημα εθνικής ασφάλειας. Οι κυβερνήσεις χρησιμοποιούν πλέον ελέγχους εξαγωγών για να περιορίσουν τη ροή high end chips και κατασκευαστικού εξοπλισμού σε ορισμένες περιοχές. Αυτοί οι έλεγχοι δεν αφορούν μόνο τα ίδια τα chips, αλλά και τη γνώση που απαιτείται για την κατασκευή και τη συντήρηση των μηχανημάτων που τα παράγουν. Αυτό έχει δημιουργήσει ένα κατακερματισμένο περιβάλλον όπου διαφορετικά μέρη του κόσμου έχουν πρόσβαση σε διαφορετικά επίπεδα υπολογιστικής ισχύος. Αυτό το χάσμα επηρεάζει τα πάντα, από την παραγωγικότητα των επιχειρήσεων έως την επιστημονική έρευνα. Οι εταιρείες αναγκάζονται πλέον να εξετάζουν τη γεωγραφική θέση των data centers τους όχι μόνο για το latency, αλλά για την πολιτική σταθερότητα και τη συμμόρφωση με τους κανονισμούς. Πρόκειται για μια σημαντική αλλαγή από τις πρώτες μέρες του διαδικτύου, όταν η φυσική τοποθεσία ενός server ήταν σχεδόν άσχετη.
Η επιχειρηματική ισχύς σε αυτή τη νέα εποχή κατέχεται από εκείνους που ελέγχουν την υποδομή. Οι cloud providers που εξασφάλισαν μεγάλες παραγγελίες chips πριν από χρόνια έχουν πλέον τεράστιο πλεονέκτημα έναντι των νεοεισερχόμενων. Αυτή η συγκέντρωση ισχύος είναι άμεσο αποτέλεσμα των φυσικών απαιτήσεων της τεχνολογίας. Για μια βαθύτερη κατανόηση αυτών των δυναμικών, μπορείτε να διαβάσετε αυτό το deep dive στην υποδομή τεχνητής νοημοσύνης για να δείτε πώς το hardware διαμορφώνει το software. Το κόστος εισόδου για την κατασκευή ενός ανταγωνιστικού large scale μοντέλου μετριέται πλέον σε δισεκατομμύρια δολάρια σε hardware. Αυτό δημιουργεί ένα εμπόδιο εισόδου που ευνοεί τους καθιερωμένους κολοσσούς και τις κρατικά υποστηριζόμενες οντότητες. Συνολικά, η εστίαση έχει μετατοπιστεί από το ποιος έχει τον καλύτερο αλγόριθμο στο ποιος έχει την πιο αξιόπιστη εφοδιαστική αλυσίδα και τα μεγαλύτερα data centers. Αυτή η τάση είναι πιθανό να συνεχιστεί καθώς τα μοντέλα μεγαλώνουν σε μέγεθος και πολυπλοκότητα.
Μπετόν και ψύξη στον πραγματικό κόσμο
Ο περιβαλλοντικός αντίκτυπος του AI είναι συχνά κρυμμένος από τον τελικό χρήστη. Ένα μόνο query σε ένα large language model μπορεί να απαιτεί σημαντικά περισσότερη ενέργεια από ένα τυπικό αίτημα σε μηχανή αναζήτησης. Αυτή η κατανάλωση ενέργειας μεταφράζεται σε θερμότητα, η οποία πρέπει να διαχειριστεί με τεράστια συστήματα ψύξης. Αυτά τα συστήματα χρησιμοποιούν συχνά εκατομμύρια γαλόνια νερού κάθε μέρα. Σε περιοχές που αντιμετωπίζουν λειψυδρία, αυτό δημιουργεί άμεσο ανταγωνισμό μεταξύ των εταιρειών τεχνολογίας και των τοπικών κοινοτήτων. Η ενεργειακή πυκνότητα ενός data center AI είναι αρκετές φορές υψηλότερη από μια παραδοσιακή εγκατάσταση. Αυτό σημαίνει ότι τα υπάρχοντα ηλεκτρικά δίκτυα συχνά δεν μπορούν να διαχειριστούν το φορτίο χωρίς σημαντικές αναβαθμίσεις. Αυτές οι αναβαθμίσεις μπορεί να διαρκέσουν χρόνια για να ολοκληρωθούν και απαιτούν πολύπλοκες διαδικασίες αδειοδότησης που περιλαμβάνουν τοπικές και κρατικές κυβερνήσεις.
Σκεφτείτε μια μέρα στη ζωή ενός διαχειριστή δημοτικών υπηρεσιών κοινής ωφέλειας σε μια περιοχή όπου χτίζεται ένα νέο data center. Πρέπει να διασφαλίσουν ότι το τοπικό δίκτυο μπορεί να διαχειριστεί την τεράστια, συνεχή κατανάλωση ενέργειας χωρίς να προκαλέσει διακοπές ρεύματος για τους κατοίκους. Διαχειρίζονται τις καθημερινές λειτουργίες ενός συστήματος που δεν σχεδιάστηκε ποτέ για αυτό το επίπεδο συγκεντρωμένης ζήτησης.
Το BotNews.today χρησιμοποιεί εργαλεία τεχνητής νοημοσύνης για την έρευνα, συγγραφή, επιμέλεια και μετάφραση περιεχομένου. Η ομάδα μας ελέγχει και επιβλέπει τη διαδικασία για να διατηρεί τις πληροφορίες χρήσιμες, σαφείς και αξιόπιστες.
Η αδειοδότηση είναι ένας άλλος πρακτικός περιορισμός που συχνά παραβλέπεται. Η κατασκευή ενός data center περιλαμβάνει την πλοήγηση σε έναν πολύπλοκο ιστό περιβαλλοντικών κανονισμών, νόμων χωροταξίας και οικοδομικών κωδίκων. Σε ορισμένες δικαιοδοσίες, η διαδικασία μπορεί να διαρκέσει περισσότερο από την ίδια την κατασκευή. Αυτό δημιουργεί μια αποσύνδεση μεταξύ του ταχύτατου ρυθμού ανάπτυξης software και του αργού ρυθμού της φυσικής υποδομής. Οι εταιρείες αναζητούν πλέον τοποθεσίες με γρήγορη αδειοδότηση και άμεση πρόσβαση σε ανανεώσιμες πηγές ενέργειας. Ωστόσο, ακόμη και με ανανεώσιμες πηγές, η τεράστια κλίμακα της ζήτησης αποτελεί πρόκληση. Ένα data center που λειτουργεί 24 ώρες το 24ωρο απαιτεί συνεχή παροχή ενέργειας, πράγμα που σημαίνει ότι η αιολική και η ηλιακή ενέργεια πρέπει να συμπληρώνονται από τεράστια αποθήκευση μπαταριών ή άλλες μορφές ενέργειας βάσης. Αυτό προσθέτει ένα άλλο επίπεδο φυσικής πολυπλοκότητας και κόστους στη λειτουργία.
Δύσκολα ερωτήματα για την εποχή της κλιμάκωσης
Καθώς συνεχίζουμε να κλιμακώνουμε αυτά τα συστήματα, πρέπει να θέσουμε δύσκολα ερωτήματα σχετικά με το κρυφό κόστος. Ποιος πληρώνει πραγματικά για την τεράστια υποδομή που απαιτείται για το AI; Ενώ τα εργαλεία είναι συχνά δωρεάν ή χαμηλού κόστους για τον τελικό χρήστη, το περιβαλλοντικό και κοινωνικό κόστος κατανέμεται σε ολόκληρη την κοινωνία. Αξίζει το όφελος ενός ελαφρώς πιο ακριβούς chatbot την πίεση στα ηλεκτρικά μας δίκτυα και τις προμήθειες νερού; Υπάρχει επίσης το ζήτημα της ιδιωτικότητας και της κυριαρχίας των δεδομένων. Καθώς περισσότερα δεδομένα υποβάλλονται σε επεξεργασία σε τεράστιες, κεντρικές εγκαταστάσεις, ο κίνδυνος μεγάλης κλίμακας παραβιάσεων δεδομένων αυξάνεται. Η φυσική συγκέντρωση δεδομένων τα καθιστά επίσης στόχο για κρατικούς δρώντες και κυβερνοεγκληματίες. Πρέπει να εξετάσουμε αν η κίνηση προς τεράστια, κεντρικά υπολογιστικά συστήματα είναι ο μόνος δρόμος προς τα εμπρός ή αν θα έπρεπε να επενδύουμε περισσότερο σε αποκεντρωμένες και αποδοτικές εναλλακτικές λύσεις.
Το κόστος του hardware είναι επίσης ανησυχητικό. Εάν μόνο λίγες εταιρείες έχουν την οικονομική δυνατότητα να χτίσουν την υποδομή που απαιτείται για τα πιο προηγμένα μοντέλα, τι σημαίνει αυτό για το μέλλον της ανοιχτής έρευνας και του ανταγωνισμού; Βλέπουμε μια τάση όπου τα πιο ικανά συστήματα είναι κλειδωμένα πίσω από proprietary APIs, με το υποκείμενο hardware και τα δεδομένα να παραμένουν κρυφά. Αυτή η έλλειψη διαφάνειας καθιστά δύσκολο για ανεξάρτητους ερευνητές να επαληθεύσουν ισχυρισμούς σχετικά με την ασφάλεια και την προκατάληψη. Δημιουργεί επίσης εξάρτηση από μια χούφτα παρόχων για κρίσιμες υποδομές. Εάν ένας από αυτούς τους παρόχους αντιμετωπίσει μια μεγάλη αστοχία hardware ή μια γεωπολιτική αναταραχή, ο αντίκτυπος θα γινόταν αισθητός σε ολόκληρη την παγκόσμια οικονομία. Αυτά δεν είναι μόνο τεχνικά προβλήματα, αλλά θεμελιώδη ερωτήματα σχετικά με το πώς θέλουμε να χτίσουμε το τεχνολογικό μας μέλλον.
Έχετε μια ιστορία, εργαλείο, τάση ή ερώτηση σχετικά με την τεχνητή νοημοσύνη που πιστεύετε ότι πρέπει να καλύψουμε; Στείλτε μας την ιδέα σας για άρθρο — θα χαρούμε να την ακούσουμε.
Η αρχιτεκτονική hardware των σύγχρονων μοντέλων
Για τους power users και τους developers, οι φυσικοί περιορισμοί του AI εκδηλώνονται στις ενσωματώσεις ροής εργασίας και στα API limits. Οι περισσότεροι χρήστες αλληλεπιδρούν με αυτά τα μοντέλα μέσω ενός API, το οποίο είναι ουσιαστικά ένα παράθυρο σε ένα τεράστιο data center. Αυτά τα API έχουν όρια ρυθμού που συνδέονται άμεσα με τη διαθέσιμη υπολογιστική ισχύ στην άλλη άκρη. Όταν ένα μοντέλο αργεί να ανταποκριθεί, είναι συχνά επειδή το φυσικό hardware διαμοιράζεται από χιλιάδες άλλους χρήστες. Ορισμένοι developers στρέφονται προς το local storage και το local inference για να παρακάμψουν αυτά τα όρια. Ωστόσο, η εκτέλεση ενός μεγάλου μοντέλου τοπικά απαιτεί σημαντικό hardware, συμπεριλαμβανομένων high end GPUs με μεγάλες ποσότητες VRAM. Αυτό οδήγησε σε αύξηση της ζήτησης για hardware καταναλωτικού επιπέδου που μπορεί να διαχειριστεί AI workloads, αλλά ακόμη και τα καλύτερα καταναλωτικά chips είναι ένα κλάσμα της ισχύος ενός dedicated data center rack.
Η ενσωμάτωση του AI στις επαγγελματικές ροές εργασίας εξαρτάται επίσης από τη φυσική τοποθεσία των δεδομένων. Για εταιρείες με αυστηρές απαιτήσεις data residency, η χρήση ενός cloud based μοντέλου μπορεί να μην είναι επιλογή. Αυτό οδηγεί μια αγορά για on premises AI hardware, το οποίο επιτρέπει στις εταιρείες να εκτελούν μοντέλα στους δικούς τους servers. Αυτά τα συστήματα είναι ακριβά και απαιτούν εξειδικευμένο προσωπικό για τη συντήρησή τους. Το networking παραμένει ένα σημαντικό bottleneck και εδώ. Η μετακίνηση μεγάλων συνόλων δεδομένων μέσα και έξω από ένα μοντέλο απαιτεί συνδέσεις υψηλού bandwidth που πολλά γραφεία δεν διαθέτουν. Γι’ αυτό βλέπουμε μια εστίαση στο edge computing, όπου η επεξεργασία γίνεται πιο κοντά στο σημείο όπου παράγονται τα δεδομένα. Αυτό μειώνει την ανάγκη για τεράστιες μεταφορές δεδομένων και μπορεί να βελτιώσει την εμπειρία του χρήστη μειώνοντας το latency. Το hardware stack της NVIDIA έχει γίνει το de facto πρότυπο για αυτές τις λειτουργίες, αλλά ο κλάδος αναζητά εναλλακτικές λύσεις για να μειώσει το κόστος και την εξάρτηση.
- Τα API rate limits είναι άμεση αντανάκλαση της φυσικής υπολογιστικής ικανότητας του παρόχου.
- Το local inference απαιτεί υψηλή χωρητικότητα VRAM, η οποία αποτελεί επί του παρόντος premium χαρακτηριστικό στις καταναλωτικές GPUs.
- Οι νόμοι περί data residency αναγκάζουν πολλές επιχειρήσεις να επιστρέψουν στο on premises hardware.
- Το edge computing στοχεύει στην επίλυση του bottleneck δικτύωσης μετακινώντας την υπολογιστική ισχύ πιο κοντά στον χρήστη.
- Το κόστος συντήρησης εξειδικευμένου hardware AI αποτελεί σημαντικό overhead για τις μικρές επιχειρήσεις.
Η φυσική πραγματικότητα του μέλλοντος
Το αφήγημα του AI ως ένα καθαρά ψηφιακό φαινόμενο δεν είναι πλέον βιώσιμο. Οι περιορισμοί της ενέργειας, του νερού, της γης και του πυριτίου είναι πλέον οι κύριοι παράγοντες που καθορίζουν τον ρυθμό προόδου. Εισερχόμαστε σε μια εποχή όπου η επιτυχία μιας εταιρείας τεχνολογίας εξαρτάται τόσο από την ικανότητά της να διαχειρίζεται μια παγκόσμια εφοδιαστική αλυσίδα και να εξασφαλίζει συμβόλαια ενέργειας, όσο και από την εξειδίκευσή της στο software. Οι αντιφάσεις μεταξύ του εικονικού κόσμου του AI και του φυσικού κόσμου των υποδομών γίνονται πιο ορατές κάθε μέρα. Συνολικά, πρέπει να αναγνωρίσουμε ότι κάθε ψηφιακή πρόοδος έχει ένα φυσικό κόστος. Η πρόκληση για την επόμενη δεκαετία θα είναι να βρούμε τρόπους να συνεχίσουμε αυτή την πρόοδο διαχειριζόμενοι τα πολύ πραγματικά όρια των πόρων του πλανήτη μας. Το μέλλον της τεχνολογίας δεν βρίσκεται μόνο στον κώδικα, αλλά στο hardware και την υποδομή που το καθιστά δυνατό.
Σημείωση συντάκτη: Δημιουργήσαμε αυτόν τον ιστότοπο ως έναν πολύγλωσσο κόμβο ειδήσεων και οδηγών τεχνητής νοημοσύνης για άτομα που δεν είναι φανατικοί των υπολογιστών, αλλά εξακολουθούν να θέλουν να κατανοήσουν την τεχνητή νοημοσύνη, να τη χρησιμοποιούν με μεγαλύτερη αυτοπεποίθηση και να παρακολουθούν το μέλλον που ήδη έρχεται.
Βρήκατε κάποιο λάθος ή κάτι που χρειάζεται διόρθωση; Ενημερώστε μας.