Nhà sáng lập, nhà phê bình và nhà nghiên cứu: Những cuộc trò chuyện đáng đọc
Hầu hết mọi người đều biết tên CEO của OpenAI. Nhưng ít ai biết đến những tác giả của bài báo khoa học đã định hình kỷ nguyên mô hình ngôn ngữ lớn hiện nay. Khoảng cách kiến thức này tạo ra cái nhìn méo mó về cách công nghệ thực sự phát triển. Chúng ta thường coi trí tuệ nhân tạo như một chuỗi các đợt ra mắt sản phẩm, trong khi thực tế đó là sự tích lũy chậm rãi của những đột phá toán học. Các nhà sáng lập quản lý vốn và câu chuyện truyền thông, còn các nhà nghiên cứu quản lý trọng số và logic. Hiểu được sự khác biệt này là cách duy nhất để nhìn thấu những đám mây tiếp thị. Nếu bạn chỉ theo dõi các nhà sáng lập, bạn đang xem một bộ phim. Nếu bạn theo dõi các nhà nghiên cứu, bạn đang đọc kịch bản. Bài viết này xem xét lý do tại sao sự phân biệt này lại quan trọng và cách xác định các tín hiệu thực sự quyết định tương lai của ngành. Chúng ta sẽ vượt qua những bài phát biểu đầy sức hút để nhìn vào thực tế lạnh lùng trong phòng thí nghiệm. Đã đến lúc tập trung vào những người viết mã thay vì chỉ những người ký tên vào các thông cáo báo chí.
Những kiến trúc sư vô hình của kỷ nguyên máy móc
Các nhà sáng lập là gương mặt đại diện. Họ phát biểu tại Diễn đàn Kinh tế Thế giới và điều trần trước Quốc hội. Công việc của họ là đảm bảo nguồn vốn hàng tỷ đô la và xây dựng một thương hiệu có vẻ như tất yếu. Họ sử dụng những từ ngữ gợi lên sự kỳ diệu. Các nhà nghiên cứu thì khác. Họ làm việc với Python và LaTeX. Họ quan tâm đến hàm mất mát (loss functions) và hiệu suất token. Một nhà sáng lập có thể nói mô hình của họ đang suy nghĩ. Một nhà nghiên cứu sẽ nói với bạn rằng nó đang dự đoán từ tiếp theo có khả năng xảy ra cao nhất dựa trên một phân phối xác suất cụ thể. Sự nhầm lẫn nảy sinh vì truyền thông coi hai nhóm này là một. Khi một CEO nói mô hình sẽ giải quyết biến đổi khí hậu, đó là một chiêu trò bán hàng. Khi một nhà nghiên cứu xuất bản một bài báo về sparse autoencoders, đó là một tuyên bố kỹ thuật. Một bên là hy vọng, bên kia là sự thật.
Công chúng thường nhầm lẫn hy vọng với sự thật. Điều này dẫn đến một chu kỳ hứa hẹn quá mức và thực hiện không tới nơi. Để hiểu lĩnh vực này, bạn phải tách biệt người bán xe với người thiết kế động cơ. Người thiết kế động cơ biết chính xác chỗ nào lỏng ốc vít. Người bán hàng sẽ không bao giờ nói cho bạn biết về những con ốc lỏng đó vì công việc của họ là giữ giá cổ phiếu ở mức cao. Chúng ta thấy điều này diễn ra mỗi khi một mô hình mới ra mắt. Nhà sáng lập đăng một dòng tweet khó hiểu để tạo sự cường điệu. Nhà nghiên cứu đăng một liên kết đến báo cáo kỹ thuật trên arXiv. Dòng tweet nhận được hàng triệu lượt xem. Báo cáo kỹ thuật chỉ được đọc bởi vài nghìn người thực sự xây dựng sản phẩm. Điều này tạo ra một vòng lặp phản hồi nơi những tiếng nói lớn nhất định nghĩa thực tế cho tất cả những người còn lại.
Vượt ra ngoài gương mặt đại diện của sự đổi mới
Sự chia rẽ này có tác động to lớn đến chính sách toàn cầu. Các chính phủ hiện đang soạn thảo luật dựa trên những cảnh báo của các nhà sáng lập. Những nhà sáng lập này thường cảnh báo về những rủi ro hiện sinh nghe như khoa học viễn tưởng. Điều này giữ sự tập trung vào những tương lai giả định thay vì những tác hại hiện tại. Trong khi đó, các nhà nghiên cứu đang chỉ ra những vấn đề cấp bách như thiên kiến dữ liệu và tiêu thụ năng lượng. Bằng cách chủ yếu lắng nghe những cái tên nổi tiếng, chúng ta có nguy cơ quản lý sai hướng. Chúng ta có thể cấm một siêu trí tuệ tương lai trong khi phớt lờ thực tế rằng các mô hình hiện tại đang làm cạn kiệt nguồn nước của các thị trấn nhỏ để làm mát trung tâm dữ liệu. Đây không chỉ là vấn đề của Mỹ. Ở châu Âu và châu Á, động lực tương tự cũng tồn tại.
Những tiếng nói có nhiều thời lượng phát sóng nhất là những người có ngân sách tiếp thị lớn nhất. Điều này tạo ra một môi trường kẻ thắng cuộc lấy tất cả, nơi một vài công ty đặt ra chương trình nghị sự cho toàn hành tinh. Nếu chúng ta không mở rộng góc nhìn, chúng ta sẽ cho phép một nhóm nhỏ người ở Silicon Valley định nghĩa cái gì là an toàn và cái gì là khả thi. Sự tập trung quyền lực này tự nó đã là một rủi ro. Nó hạn chế sự đa dạng tư duy trong một lĩnh vực vốn rất cần điều đó. Chúng ta cần lắng nghe những người tại Đại học Toronto hay các phòng thí nghiệm ở Tokyo nhiều như chúng ta nghe những người ở San Francisco. Tiến bộ khoa học là một nỗ lực toàn cầu, nhưng câu chuyện hiện tại lại là một sự độc quyền cục bộ. Chúng ta cần xem các tạp chí như Nature để thấy sự tiến bộ thực sự đang được thực hiện bên ngoài các phòng họp doanh nghiệp.
Tại sao thế giới lại lắng nghe nhầm người
Hãy xem xét một ngày làm việc của một nhà nghiên cứu chính tại một phòng thí nghiệm lớn. Họ thức dậy và kiểm tra kết quả của một đợt huấn luyện tiêu tốn ba triệu đô la. Họ thấy mô hình đang ảo giác nhiều hơn dự kiến. Họ dành mười giờ để xem xét các cụm dữ liệu nhằm tìm ra nhiễu. Họ không nghĩ về cuộc bầu cử năm 2024 hay số phận nhân loại. Họ đang nghĩ về lý do tại sao mô hình không hiểu được sự phủ định trong các câu phức tạp. Họ đang nhìn vào các bản đồ nhiệt của sự kích hoạt neuron. Thành công của họ được đo bằng bit trên mỗi ký tự hoặc độ chính xác trên một tiêu chuẩn cụ thể. Bây giờ hãy xem xét một ngày của một nhà sáng lập. Họ đang trên máy bay phản lực tư nhân để gặp nguyên thủ quốc gia. Họ đang nói về cơ hội nghìn tỷ đô la của nền kinh tế mới.
Nhà nghiên cứu giải quyết câu hỏi “làm thế nào”. Nhà sáng lập giải quyết câu hỏi “tại sao nó đáng tiền”. Đối với một nhà phát triển đang xây dựng ứng dụng, nhà nghiên cứu là nhân vật quan trọng hơn. Nhà nghiên cứu xác định độ trễ API và ngữ cảnh (context window). Nhà sáng lập xác định giá cả. Nếu bạn đang cố gắng xây dựng một doanh nghiệp, bạn cần biết liệu công nghệ có thực sự làm được những gì nhà sáng lập nói hay không. Thường thì không. Chúng ta đã thấy điều này với những ngày đầu của xe tự lái. Các nhà sáng lập nói rằng chúng ta sẽ có hàng triệu robotaxi vào 2026. Các nhà nghiên cứu biết rằng các trường hợp biên (edge cases) khi trời mưa to vẫn là một vấn đề chưa được giải quyết. Công chúng tin vào các nhà sáng lập. Các nhà nghiên cứu đã đúng.
Mô hình tương tự này đang lặp lại trong không gian AI tạo sinh. Chúng ta được bảo rằng các mô hình sẽ sớm thay thế luật sư và bác sĩ. Nếu bạn đọc các bài báo kỹ thuật, bạn sẽ thấy rằng các mô hình vẫn chật vật với tính nhất quán logic cơ bản. Khoảng cách giữa bản demo và thực tế là nơi các công ty mất tiền. Bạn có thể tìm thấy một bài phân tích sâu về các xu hướng trí tuệ nhân tạo để xem các giới hạn kỹ thuật này đang được kiểm chứng như thế nào ngày nay. Sự khác biệt này chính là ranh giới giữa một khoản đầu tư hợp lý và một bong bóng đầu cơ. Khi bạn nghe một tuyên bố mới, hãy tự hỏi liệu nó đến từ một bài báo hay một thông cáo báo chí. Câu trả lời sẽ cho bạn biết nên đặt bao nhiêu trọng lượng vào đó. Các nhà báo tại MIT Technology Review thường làm nổi bật khoảng cách giữa phòng thí nghiệm và sảnh đợi này. Chúng ta phải nhớ rằng các nhà sáng lập có động lực để che giấu các lỗ hổng trong khi các nhà nghiên cứu có động lực để tìm ra chúng. Người trước xây dựng sự cường điệu và người sau xây dựng sự thật. Về lâu dài, sự thật là thứ duy nhất có thể mở rộng. Chúng ta đã thấy điều này vào 2026 khi làn sóng cường điệu đầu tiên bắt đầu hạ nhiệt dưới sức nặng của thực tế kỹ thuật.
Một ngày thứ Ba trong phòng thí nghiệm so với phòng họp
Chúng ta phải đặt ra những câu hỏi khó về con đường phát triển hiện tại. Ai đang trả tiền cho nghiên cứu mà các nhà sáng lập tuyên bố sẽ mang lại lợi ích cho mọi người? Hầu hết các nhà nghiên cứu hàng đầu đã rời bỏ học thuật để đến các phòng thí nghiệm tư nhân. Điều này có nghĩa là kiến thức họ tạo ra không còn là hàng hóa công cộng nữa. Nó là một bí mật doanh nghiệp. Điều gì xảy ra với phương pháp khoa học khi dữ liệu được sử dụng để chứng minh một quan điểm bị ẩn sau tường phí? Chúng ta đang thấy sự chuyển dịch từ khoa học mở sang mô hình lợi thế cạnh tranh đóng. Liệu danh tiếng của một vài cá nhân có đang giúp ích cho lĩnh vực này hay nó đang tạo ra một sự sùng bái cá nhân ngăn cản sự bất đồng? Nếu một nhà nghiên cứu tìm thấy một lỗ hổng lớn trong một mô hình chủ chốt, liệu họ có cảm thấy an toàn khi báo cáo nó nếu nó có thể làm sụt giảm giá trị công ty?
BotNews.today sử dụng các công cụ AI để nghiên cứu, viết, chỉnh sửa và dịch nội dung. Đội ngũ của chúng tôi xem xét và giám sát quy trình để giữ cho thông tin hữu ích, rõ ràng và đáng tin cậy.
Áp lực tài chính lên các công ty này là rất lớn. Chúng ta cũng phải xem xét chi phí môi trường. Liệu việc theo đuổi các tiêu chuẩn tốt hơn một chút có đáng giá với dấu chân carbon khổng lồ của việc huấn luyện các mô hình này không? Chúng ta thường nói về lợi ích của AI đối với môi trường, nhưng hiếm khi thấy một bảng cân đối kế toán cho cả hai. Cuối cùng, ai sở hữu văn hóa mà các mô hình này được huấn luyện trên đó? Các nhà nghiên cứu sử dụng đầu ra tập thể của internet để xây dựng hệ thống của họ. Sau đó, các nhà sáng lập tính phí công chúng để truy cập vào một phiên bản chắt lọc của chính đầu ra đó. Đây là một sự chuyển dịch của cải hiếm khi được thảo luận trên các tiêu đề báo chí. Đây không chỉ là những vấn đề kỹ thuật. Chúng là những tình thế tiến thoái lưỡng nan về xã hội và đạo đức đòi hỏi nhiều hơn là chỉ một thuật toán tốt hơn để giải quyết.
Các ràng buộc kỹ thuật và triển khai cục bộ
Đối với những người xây dựng trên các nền tảng này, các chi tiết kỹ thuật quan trọng hơn triết lý. Các giới hạn API hiện tại là một nút thắt cổ chai lớn cho việc áp dụng trong doanh nghiệp. Hầu hết các nhà cung cấp đều có giới hạn tốc độ nghiêm ngặt ngăn cản việc xử lý thời gian thực khối lượng lớn. Đây là lý do tại sao nhiều công ty đang xem xét lưu trữ cục bộ và thực thi cục bộ. Sử dụng các mô hình như Llama 3 trên phần cứng cục bộ cho phép bảo mật dữ liệu tốt hơn và chi phí dài hạn thấp hơn. Tuy nhiên, các yêu cầu về phần cứng rất cao. Để chạy một mô hình 70 tỷ tham số với tốc độ ổn, bạn cần các GPU cao cấp với VRAM đáng kể. Đây là nơi phần kỹ thuật gặp phần tài chính. Chi phí của một cụm H100 là một rào cản gia nhập giữ quyền lực trong tay những người giàu có.
Chúng ta cũng đang thấy sự chuyển dịch sang tinh chỉnh chuyên biệt (fine-tuning). Thay vì sử dụng một mô hình tổng quát cho mọi thứ, các nhà phát triển đang sử dụng các mô hình nhỏ hơn được huấn luyện trên các tập dữ liệu cụ thể. Điều này cải thiện độ chính xác và giảm số lượng token. Thách thức kỹ thuật ở đây là quản lý dữ liệu. Nếu dữ liệu đầu vào kém, mô hình tinh chỉnh sẽ tệ hơn mô hình tổng quát. Chúng ta cũng đang thấy việc sử dụng nhiều hơn Retrieval Augmented Generation (RAG) để đặt nền tảng cho các mô hình dựa trên dữ liệu thực tế. Điều này bỏ qua nhu cầu về các ngữ cảnh khổng lồ và giảm ảo giác. Nhưng RAG có những giới hạn riêng, cụ thể là cách nó xử lý việc xếp hạng các tài liệu được truy xuất. Nếu bước tìm kiếm thất bại, đầu ra của mô hình là vô dụng. Hầu hết người dùng không nhận ra rằng hiệu suất của một AI phụ thuộc vào cơ sở dữ liệu mà nó truy vấn nhiều như chính mô hình đó.
Bộ lọc cuối cùng cho thông tin
Tương lai của AI không phải là một câu chuyện duy nhất được kể bởi một người duy nhất. Đó là một cuộc tranh luận lộn xộn, đang diễn ra giữa những người bán tầm nhìn và những người xây dựng thực tế. Để trở thành một người tiêu dùng thông minh về tin tức công nghệ, bạn phải học cách nhìn xa hơn nhà sáng lập đầy sức hút. Hãy tìm tên trên các bài báo. Hãy tìm những nhà nghiên cứu sẵn sàng nói về những gì mô hình của họ không thể làm. Những mâu thuẫn trong ngành không phải là lỗi. Chúng là phần trung thực nhất của câu chuyện. Lĩnh vực này sẽ tiếp tục phát triển vì các vấn đề kỹ thuật còn lâu mới được giải quyết. Câu hỏi còn bỏ ngỏ là: liệu chúng ta có thể xây dựng một hệ thống thực sự thông minh mà không cần tiêu thụ tài nguyên khổng lồ như hiện nay không? Cho đến khi chúng ta trả lời được điều đó, sự cường điệu sẽ tiếp tục vượt xa khoa học. Chúng ta phải luôn hoài nghi về bất kỳ câu chuyện nào hứa hẹn một giải pháp hoàn hảo mà không đề cập đến những sự đánh đổi liên quan.
Lưu ý của biên tập viên: Chúng tôi tạo trang web này như một trung tâm tin tức và hướng dẫn AI đa ngôn ngữ dành cho những người không phải là chuyên gia máy tính, nhưng vẫn muốn hiểu trí tuệ nhân tạo, sử dụng nó tự tin hơn và theo dõi tương lai đang đến gần.
Tìm thấy lỗi hoặc điều gì đó cần được sửa chữa? Hãy cho chúng tôi biết.