Основатели, критици и изследователи: разговорите, които си струва да прочетете
Повечето хора знаят кой е изпълнителният директор на OpenAI. Малцина обаче могат да назоват авторите на научния труд, който постави началото на сегашната ера на големите езикови модели. Тази празнина в познанията създава изкривена представа за това как всъщност напредват технологиите. Ние третираме изкуствения интелект като поредица от продуктови премиери, докато в действителност това е бавно натрупване на математически пробиви. Основателите управляват капитала и обществения наратив. Изследователите управляват теглата и логиката. Разбирането на тази разлика е единственият начин да прогледнете през маркетинговата мъгла. Ако следите само основателите, вие гледате филм. Ако следите изследователите, вие четете сценария. Тази статия разглежда защо това разграничение е важно и как да идентифицирате сигналите, които реално диктуват бъдещето на индустрията. Ще оставим настрана харизматичните речи, за да погледнем към студената реалност в лабораторията. Време е да се фокусираме върху хората, които пишат кода, а не само върху тези, които подписват прессъобщенията.
Невидимите архитекти на машинната ера
Основателите са публичното лице. Те говорят на Световния икономически форум и свидетелстват пред Конгреса. Тяхната работа е да осигурят милиарди финансиране и да изградят бранд, който изглежда неизбежен. Те използват думи, които звучат като магия. Изследователите са различни. Те работят с Python и LaTeX. Те се интересуват от функции на загуба и ефективност на токените. Един основател може да каже, че неговият модел „мисли“. Един изследовател ще ви каже, че той предсказва следващата най-вероятна дума въз основа на специфично разпределение на вероятностите. Объркването възниква, защото медиите третират тези две групи като една. Когато един CEO каже, че даден модел ще реши климатичните промени, това е търговски трик. Когато изследовател публикува труд за sparse autoencoders, това е техническо твърдение. Едното е надежда. Другото е факт.
Обществото често бърка надеждата с факта. Това води до цикъл на преувеличени обещания и недостатъчни резултати. За да разберете тази сфера, трябва да отделите човека, който продава колата, от човека, който е проектирал двигателя. Дизайнерът на двигателя знае точно къде болтовете са разхлабени. Търговецът никога няма да ви каже за разхлабените болтове, защото неговата работа е да поддържа цената на акциите висока. Виждаме това всеки път, когато излезе нов модел. Основателят пуска криптиран туит, за да създаде хайп. Изследователят публикува линк към технически доклад в arXiv. Туитът събира милиони гледания. Техническият доклад се чете от няколко хиляди души, които реално създават нещата. Това създава обратна връзка, при която най-силните гласове определят реалността за всички останали.
Отвъд публичното лице на иновациите
Това разделение има огромни последици за глобалната политика. Правителствата в момента пишат закони въз основа на предупрежденията на основателите. Тези основатели често предупреждават за екзистенциални рискове, които звучат като научна фантастика. Това насочва фокуса към хипотетични бъдещи събития, вместо към текущите вреди. Междувременно изследователите посочват непосредствени проблеми като пристрастия в данните и консумация на енергия. Слушайки предимно известните имена, рискуваме да регулираме грешните неща. Може да забраним бъдещ суперразум, докато игнорираме факта, че настоящите модели източват водните запаси на малки градове, за да охлаждат своите дейта центрове. Това не е само американски проблем. В Европа и Азия съществува същата динамика.
Гласовете, които получават най-много ефирно време, са тези с най-големи маркетингови бюджети. Това създава среда тип „победителят взема всичко“, където няколко компании определят дневния ред за цялата планета. Ако не разширим перспективата си, позволяваме на шепа хора в Силициевата долина да определят кое е безопасно и кое е възможно. Тази концентрация на власт сама по себе си е риск. Тя ограничава разнообразието на мисълта в сфера, която се нуждае от него. Трябва да чуваме хората от Университета в Торонто или лабораториите в Токио толкова, колкото и хората в Сан Франциско. Научният прогрес е глобално усилие, но наративът в момента е локален монопол. Трябва да гледаме списания като Nature, за да видим истинския прогрес, който се случва извън корпоративните зали за срещи.
Защо светът слуша грешните хора
Помислете за един ден от живота на водещ изследовател в голяма лаборатория. Те се събуждат и проверяват резултатите от обучение, което е струвало три милиона долара. Виждат, че моделът халюцинира повече от очакваното. Прекарват десет часа в разглеждане на клъстери от данни, за да открият шума. Те не мислят за изборите през 2024 г. или за съдбата на човечеството. Те мислят защо моделът не успява да разбере отрицанието в сложни изречения. Те разглеждат топлинни карти на невронна активация. Техният успех се измерва в битове на символ или точност при специфичен бенчмарк. Сега помислете за деня на един основател. Те са на частен самолет за среща с държавен глава. Говорят за възможността за трилиони долари от новата икономика.
Изследователят се занимава с „как“. Основателят се занимава с „защо си струва парите“. За разработчик, който изгражда приложение, изследователят е по-важната фигура. Изследователят определя API латентността и контекстния прозорец. Основателят определя цената. Ако се опитвате да изградите бизнес, трябва да знаете дали технологията наистина може да прави това, което основателят твърди. Често тя не може. Видяхме това в ранните дни на автономното шофиране. Основателите казваха, че ще имаме милиони роботаксита до 2026. Изследователите знаеха, че крайните случаи при силен дъжд все още са нерешен проблем. Обществото повярва на основателите. Изследователите бяха прави.
Същият модел се повтаря в пространството на генеративния AI. Казват ни, че моделите скоро ще заменят адвокати и лекари. Ако прочетете техническите доклади, ще видите, че моделите все още се борят с основната логическа последователност. Пропастта между демото и реалността е мястото, където компаниите губят пари. Можете да намерите задълбочен анализ на тенденциите в изкуствения интелект, за да видите как тези технически ограничения се тестват днес. Това разграничение е разликата между разумна инвестиция и спекулативен балон. Когато чуете ново твърдение, запитайте се дали идва от научен труд или от прессъобщение. Отговорът ще ви каже колко тежест да му дадете. Журналистите от MIT Technology Review често подчертават тази пропаст между лабораторията и лобито. Трябва да помним, че основателите са мотивирани да крият недостатъците, докато изследователите са мотивирани да ги откриват. Първите изграждат хайпа, а вторите изграждат истината. В дългосрочен план истината е единственото, което се мащабира. Видяхме това през 2026, когато първата вълна на хайпа започна да се охлажда под тежестта на техническата реалност.
Вторник в лабораторията срещу заседателната зала
Трябва да зададем трудни въпроси за текущия път на развитие. Кой плаща за изследванията, за които основателите твърдят, че ще са от полза за всички? Повечето от най-добрите изследователи напуснаха академичните среди заради частни лаборатории. Това означава, че знанието, което произвеждат, вече не е обществено благо. То е корпоративна тайна. Какво се случва с научния метод, когато данните, използвани за доказване на теза, са скрити зад платена стена? Виждаме движение от отворена наука към модел на затворено конкурентно предимство. Дали славата на няколко личности помага на сферата или създава култ към личността, който обезсърчава несъгласието? Ако изследовател открие голям дефект в водещ модел, чувства ли се в безопасност да го докладва, ако това може да срине пазарната оценка на компанията?
BotNews.today използва инструменти за изкуствен интелект за проучване, писане, редактиране и превод на съдържание. Нашият екип преглежда и наблюдава процеса, за да запази информацията полезна, ясна и надеждна.
Финансовият натиск върху тези фирми е огромен. Трябва също да вземем предвид екологичните разходи. Струва ли си преследването на малко по-добри бенчмаркове огромния въглероден отпечатък от обучението на тези модели? Често говорим за ползите от AI за околната среда, но рядко виждаме отчет, който балансира двете. И накрая, кой притежава културата, върху която са обучени тези модели? Изследователите използват колективния резултат от интернет, за да изградят своите системи. След това основателите таксуват обществото за достъп до дестилирана версия на същия този резултат. Това е трансфер на богатство, който рядко се обсъжда в заглавията. Това не са просто технически проблеми. Това са социални и етични дилеми, които изискват нещо повече от по-добър алгоритъм за решаване.
Технически ограничения и локално внедряване
За тези, които изграждат върху тези платформи, техническите детайли са по-важни от философията. Текущите API лимити са основно тясно място за корпоративното приемане. Повечето доставчици имат строги ограничения за скоростта, които пречат на обработката в реално време с голям обем. Ето защо много фирми разглеждат локалното съхранение и локалното изпълнение. Използването на модели като Llama 3 върху локален хардуер позволява по-добра поверителност на данните и по-ниски дългосрочни разходи. Хардуерните изисквания обаче са високи. За да стартирате модел със 70 милиарда параметри с прилична скорост, са ви нужни висок клас GPU с голям VRAM. Тук секцията за гийкове се среща с финансовата секция. Цената на H100 клъстер е бариера за навлизане, която държи властта в ръцете на богатите.
Виждаме и преминаване към специализирано fine-tuning. Вместо да използват общ модел за всичко, разработчиците използват по-малки модели, обучени върху специфични набори от данни. Това подобрява точността и намалява броя на токените. Техническото предизвикателство тук е курирането на данни. Ако входните данни са лоши, fine-tuned моделът ще бъде по-лош от общия. Виждаме и по-голямо използване на Retrieval Augmented Generation (RAG) за базиране на моделите върху фактически данни. Това заобикаля нуждата от масивни контекстни прозорци и намалява халюцинациите. Но RAG има свои собствени ограничения, особено в начина, по който се справя с класирането на извлечените документи. Ако стъпката на търсене се провали, изходът на модела е безполезен. Повечето потребители не осъзнават, че производителността на един AI зависи толкова от базата данни, която заявят, колкото и от самия модел.
Последният филтър за информация
Бъдещето на AI не е единна история, разказана от един човек. Това е разхвърлян, продължаващ дебат между тези, които продават визия, и тези, които изграждат реалността. За да бъдете интелигентен потребител на технологични новини, трябва да се научите да гледате отвъд харизматичния основател. Търсете имената в научните трудове. Търсете изследователите, които са готови да говорят за това, което техните модели не могат да правят. Противоречията в индустрията не са бъгове. Те са най-честната част от историята. Сферата ще продължи да се развива, защото техническите проблеми далеч не са решени. Живият въпрос остава: можем ли да изградим наистина интелигентна система без масивната консумация на ресурси, която определя сегашната ера? Докато не отговорим на това, хайпът ще продължи да изпреварва науката. Трябва да останем скептични към всеки наратив, който обещава перфектно решение, без да споменава включените компромиси.
Бележка на редактора: Създадохме този сайт като многоезичен център за новини и ръководства за изкуствен интелект за хора, които не са компютърни маниаци, но все пак искат да разберат изкуствения интелект, да го използват с повече увереност и да следят бъдещето, което вече настъпва.
Открихте грешка или нещо, което трябва да бъде коригирано? Уведомете ни.