Засновники, критики та дослідники: розмови, які варто прочитати
Більшість людей знають ім’я CEO OpenAI. Але мало хто назве авторів статті, що визначила нинішню еру великих мовних моделей. Ця прогалина у знаннях створює викривлене уявлення про те, як насправді розвиваються технології. Ми сприймаємо штучний інтелект як серію запусків продуктів, хоча насправді це повільне накопичення математичних проривів. Засновники керують капіталом та публічним наративом. Дослідники керують вагами та логікою. Розуміння цієї різниці — єдиний спосіб розгледіти суть крізь маркетинговий туман. Якщо ви стежите лише за засновниками, ви дивитеся кіно. Якщо за дослідниками — ви читаєте сценарій. Ця стаття пояснює, чому ця відмінність важлива і як розпізнати сигнали, що насправді визначають майбутнє індустрії. Ми відійдемо від харизматичних промов до холодної реальності лабораторій. Настав час зосередитися на людях, які пишуть код, а не лише на тих, хто підписує пресрелізи.
Невидимі архітектори епохи машин
Засновники — це публічне обличчя. Вони виступають на Всесвітньому економічному форумі та дають свідчення в Конгресі. Їхня робота — забезпечити мільярдне фінансування та створити бренд, який здається неминучим. Вони використовують слова, що натякають на магію. Дослідники інші. Вони працюють у Python та LaTeX. Їм важливі функції втрат та ефективність токенів. Засновник може сказати, що їхня модель «думає». Дослідник скаже вам, що вона передбачає наступне найбільш імовірне слово на основі конкретного розподілу ймовірностей. Плутанина виникає через те, що медіа сприймають ці дві групи як одне ціле. Коли CEO каже, що модель вирішить проблему зміни клімату, це продажний пітч. Коли дослідник публікує статтю про розріджені автоенкодери, це технічне твердження. Одне — це надія. Інше — факт.
Громадськість часто плутає надію з фактом. Це призводить до циклу завищених очікувань та невиконаних обіцянок. Щоб зрозуміти цю сферу, ви повинні відокремити того, хто продає автомобіль, від того, хто спроєктував двигун. Конструктор двигуна точно знає, де ослабли болти. Продавець ніколи не розповість вам про це, бо його робота — підтримувати високу ціну акцій. Ми бачимо це щоразу, коли виходить нова модель. Засновник пише загадковий твіт, щоб створити хайп. Дослідник публікує посилання на технічний звіт на arXiv. Твіт отримує мільйон переглядів. Технічний звіт читають кілька тисяч людей, які дійсно щось створюють. Це створює цикл зворотного зв’язку, де найгучніші голоси визначають реальність для всіх інших.
За межами публічного обличчя інновацій
Цей розкол має величезні наслідки для глобальної політики. Уряди зараз пишуть закони, базуючись на попередженнях засновників. Ці засновники часто попереджають про екзистенційні ризики, що звучать як наукова фантастика. Це зміщує фокус на гіпотетичне майбутнє, а не на поточну шкоду. Тим часом дослідники вказують на негайні проблеми, як-от упередженість даних та споживання енергії. Слухаючи переважно відомі імена, ми ризикуємо регулювати не те, що потрібно. Ми можемо заборонити майбутній суперінтелект, ігноруючи той факт, що нинішні моделі виснажують водні ресурси невеликих міст для охолодження своїх дата-центрів. Це не лише американська проблема. В Європі та Азії існує та сама динаміка.
Голоси, що отримують найбільше ефірного часу, належать тим, у кого найбільші маркетингові бюджети. Це створює середовище «переможець отримує все», де кілька компаній визначають порядок денний для всієї планети. Якщо ми не розширимо свій кругозір, ми дозволимо жменьці людей із Кремнієвої долини визначати, що є безпечним, а що можливим. Ця концентрація влади сама по собі є ризиком. Вона обмежує різноманітність думок у сфері, яка цього потребує. Нам потрібно чути людей з Університету Торонто чи лабораторій у Токіо так само часто, як і людей із Сан-Франциско. Науковий прогрес — це глобальне зусилля, але наратив зараз є локальною монополією. Нам потрібно дивитися на такі журнали, як Nature, щоб побачити реальний прогрес, що відбувається поза корпоративними залами засідань.
Чому світ слухає не тих людей
Уявіть день із життя провідного дослідника у великій лабораторії. Вони прокидаються і перевіряють результати тренування, яке коштувало три мільйони доларів. Вони бачать, що модель галюцинує більше, ніж очікувалося. Вони витрачають десять годин, вивчаючи кластери даних, щоб знайти шум. Вони не думають про вибори 2024 року чи долю людства. Вони думають про те, чому модель не може зрозуміти заперечення у складних реченнях. Вони дивляться на теплові карти активації нейронів. Їхній успіх вимірюється в бітах на символ або точності на конкретному бенчмарку. А тепер уявіть день засновника. Вони летять на приватному літаку на зустріч із главою держави. Вони говорять про трильйонні можливості нової економіки.
Дослідник має справу з тим, «як». Засновник має справу з тим, «чому це приносить гроші». Для розробника, що створює застосунок, дослідник є важливішою фігурою. Дослідник визначає затримку API та контекстне вікно. Засновник визначає ціну. Якщо ви намагаєтеся побудувати бізнес, вам потрібно знати, чи може технологія насправді робити те, що каже засновник. Часто — ні. Ми бачили це на ранніх етапах автономного водіння. Засновники казали, що у нас будуть мільйони роботаксі до 2026. Дослідники знали, що крайові випадки під час сильного дощу залишалися невирішеною проблемою. Громадськість повірила засновникам. Дослідники мали рацію.
Цей самий шаблон повторюється у сфері генеративного ШІ. Нам кажуть, що моделі скоро замінять юристів та лікарів. Якщо ви читаєте технічні статті, то бачите, що моделі все ще борються з базовою логічною послідовністю. Прірва між демо-версією та реальністю — це те місце, де компанії втрачають гроші. Ви можете знайти глибокий аналіз трендів штучного інтелекту, щоб побачити, як ці технічні обмеження тестуються сьогодні. Ця відмінність — це різниця між надійною інвестицією та спекулятивною бульбашкою. Коли ви чуєте нову заяву, запитайте себе, чи прийшла вона зі статті чи з пресрелізу. Відповідь підкаже, скільки ваги їй надати. Журналісти MIT Technology Review часто висвітлюють цей розрив між лабораторією та лобі. Ми повинні пам’ятати, що засновники мають стимули приховувати недоліки, тоді як дослідники мають стимули їх знаходити. Перші будують хайп, а другі — правду. У довгостроковій перспективі правда — це єдине, що масштабується. Ми бачили це у 2026, коли перша хвиля хайпу почала вщухати під вагою технічної реальності.
Вівторок у лабораторії проти зали засідань
Ми повинні поставити складні запитання щодо поточного шляху розвитку. Хто платить за дослідження, які, за словами засновників, принесуть користь усім? Більшість провідних дослідників залишили академію заради приватних лабораторій. Це означає, що знання, які вони виробляють, більше не є суспільним благом. Це корпоративна таємниця. Що стається з науковим методом, коли дані, використані для доведення точки зору, приховані за пейволом? Ми бачимо рух від відкритої науки до моделі закритої конкурентної переваги. Чи допомагає слава кількох осіб сфері, чи створює культ особистості, що перешкоджає інакомисленню? Якщо дослідник знаходить серйозний недолік у флагманській моделі, чи почуваються вони в безпеці, повідомляючи про це, якщо це може знизити оцінку компанії?
BotNews.today використовує інструменти ШІ для дослідження, написання, редагування та перекладу контенту. Наша команда перевіряє та контролює процес, щоб інформація залишалася корисною, зрозумілою та надійною.
Фінансовий тиск на ці фірми величезний. Ми також повинні враховувати екологічну ціну. Чи варте прагнення до трохи кращих бенчмарків величезного вуглецевого сліду від тренування цих моделей? Ми часто говоримо про переваги ШІ для довкілля, але рідко бачимо баланс між ними. Нарешті, хто володіє культурою, на якій тренуються ці моделі? Дослідники використовують колективний продукт інтернету для створення своїх систем. Потім засновники стягують плату з громадськості за доступ до дистильованої версії того самого продукту. Це перерозподіл багатства, який рідко обговорюється в заголовках. Це не просто технічні проблеми. Це соціальні та етичні дилеми, для вирішення яких потрібно більше, ніж просто кращий алгоритм.
Технічні обмеження та локальна реалізація
Для тих, хто будує на цих платформах, технічні деталі важливіші за філософію. Поточні ліміти API є головним вузьким місцем для впровадження на рівні підприємств. Більшість провайдерів мають суворі обмеження швидкості, що перешкоджають обробці великих обсягів даних у реальному часі. Саме тому багато фірм розглядають локальне зберігання та локальне виконання. Використання моделей, таких як Llama 3 на локальному обладнанні, дозволяє краще захистити дані та знизити довгострокові витрати. Однак вимоги до обладнання високі. Щоб запустити модель із 70 мільярдами параметрів із пристойною швидкістю, вам потрібні висококласні GPU зі значним обсягом VRAM. Тут секція для гіків зустрічається з фінансовою секцією. Вартість кластера H100 — це бар’єр для входу, який утримує владу в руках багатих.
Ми також бачимо перехід до спеціалізованого fine-tuning. Замість використання загальної моделі для всього, розробники використовують менші моделі, навчені на специфічних датасетах. Це покращує точність і зменшує кількість токенів. Технічний виклик тут — кураторство даних. Якщо вхідні дані погані, донавчена модель буде гіршою за загальну. Ми також бачимо більше використання Retrieval Augmented Generation (RAG) для заземлення моделей на фактичних даних. Це дозволяє обійти потребу у величезних контекстних вікнах і зменшує галюцинації. Але RAG має свої обмеження, особливо в тому, як він обробляє ранжування отриманих документів. Якщо етап пошуку не вдається, результат моделі марний. Більшість користувачів не усвідомлюють, що продуктивність ШІ залежить від бази даних, яку він запитує, так само сильно, як і від самої моделі.
Фінальний фільтр інформації
Майбутнє ШІ — це не одна історія, розказана однією людиною. Це безладна, триваюча дискусія між тими, хто продає бачення, і тими, хто будує реальність. Щоб бути розумним споживачем технологічних новин, ви повинні навчитися бачити далі харизматичного засновника. Шукайте імена в статтях. Шукайте дослідників, які готові говорити про те, чого їхні моделі не можуть робити. Суперечності в індустрії — це не баги. Це найчесніша частина історії. Сфера продовжуватиме розвиватися, тому що технічні проблеми ще далекі від вирішення. Головне питання залишається: чи можемо ми побудувати справді інтелектуальну систему без величезного споживання ресурсів, що визначає нинішню еру? Поки ми не відповімо на це, хайп продовжуватиме випереджати науку. Ми повинні залишатися скептичними до будь-якого наративу, що обіцяє ідеальне рішення, не згадуючи про пов’язані з цим компроміси.
Примітка редактора: Ми створили цей сайт як багатомовний центр новин та посібників зі штучного інтелекту для людей, які не є комп'ютерними гіками, але все ще хочуть зрозуміти штучний інтелект, використовувати його з більшою впевненістю та стежити за майбутнім, яке вже настає.
Знайшли помилку або щось, що потрібно виправити? Повідомте нас.