Những nhà nghiên cứu được cả thế giới trích dẫn — và lý do họ quan trọng
Những kiến trúc sư thầm lặng của tư duy hiện đại
Các cuộc thảo luận công khai về trí tuệ nhân tạo (AI) thường xoay quanh một vài CEO đầy sức hút và các tỷ phú đầu tư. Những nhân vật này chiếm sóng truyền thông với những dự đoán táo bạo về tương lai nhân loại và nền kinh tế. Tuy nhiên, hướng đi thực sự của ngành công nghiệp lại được quyết định bởi một nhóm nhỏ, thầm lặng hơn gồm các nhà nghiên cứu mà tên tuổi hiếm khi xuất hiện trên các tiêu đề báo lớn. Đây chính là những người viết nên các bài báo nền tảng mà mọi phòng thí nghiệm lớn cuối cùng đều phải áp dụng. Tầm ảnh hưởng của họ không được đo bằng số người theo dõi trên mạng xã hội, mà bằng số lượt trích dẫn và những thay đổi mang tính cấu trúc mà họ buộc ngành công nghệ phải thực hiện. Khi một nhà nghiên cứu công bố bước đột phá về hiệu suất transformer hoặc các quy luật mở rộng mạng thần kinh, toàn bộ lĩnh vực này sẽ thay đổi trọng tâm chỉ trong vài tuần. Hiểu được họ là ai và cách họ làm việc là điều cần thiết cho bất kỳ ai muốn nhìn thấu qua lớp vỏ bọc marketing hào nhoáng của thời đại này.
Sự khác biệt giữa người nổi tiếng và người có tầm ảnh hưởng trong lĩnh vực này rất rõ rệt. Một người nổi tiếng có thể công bố một sản phẩm mới, nhưng một nhà nghiên cứu có tầm ảnh hưởng lại cung cấp bằng chứng toán học giúp sản phẩm đó trở nên khả thi ngay từ đầu. Sự khác biệt này rất quan trọng vì các nhà nghiên cứu là người đặt ra chương trình nghị sự cho những gì khả thi về mặt kỹ thuật. Họ xác định giới hạn của tư duy máy móc và chi phí tính toán. Nếu bạn muốn biết phần mềm trong ba năm tới sẽ trông như thế nào, đừng nhìn vào các thông cáo báo chí từ các tập đoàn lớn. Hãy nhìn vào các máy chủ pre-print, nơi thế hệ logic tiếp theo đang được tranh luận trong thời gian thực. Đây mới là nơi quyền lực thực sự trú ngụ.
Cách các bài báo nghiên cứu trở thành sản phẩm thực tế
Con đường từ một bài báo lý thuyết đến một công cụ trên smartphone của bạn ngắn hơn bao giờ hết. Trong những thập kỷ trước, một bước đột phá trong khoa học máy tính có thể mất mười năm để đạt được ứng dụng thương mại. Ngày nay, khoảng thời gian đó đã rút ngắn xuống còn vài tháng. Sự tăng tốc này được thúc đẩy bởi tính chất mở của việc chia sẻ nghiên cứu trên các nền tảng như arxiv.org, nơi các phát hiện mới được đăng tải hàng ngày. Khi một nhà nghiên cứu tại phòng thí nghiệm như Google DeepMind hoặc Anthropic khám phá ra cách hiệu quả hơn để xử lý bộ nhớ dài hạn trong một model, thông tin đó thường được công khai trước khi mực trên các báo cáo nội bộ kịp khô. Điều này tạo ra một môi trường độc đáo, nơi những tiếng nói thầm lặng nhất trong phòng lại là người điều hướng dòng vốn đầu tư mạo hiểm trị giá hàng tỷ đô la.
Tầm ảnh hưởng trong bối cảnh này được xây dựng dựa trên khả năng tái lập và tính hữu dụng. Một bài báo được coi là có tầm ảnh hưởng nếu các nhà nghiên cứu khác có thể lấy mã nguồn và xây dựng thứ gì đó tốt hơn dựa trên đó. Đây là lý do tại sao một số cái tên xuất hiện trong tài liệu tham khảo của mọi dự án AI quan trọng. Những nhà nghiên cứu này không cố gắng bán gói đăng ký. Họ đang cố gắng giải quyết một vấn đề cụ thể, chẳng hạn như cách giảm năng lượng cần thiết để huấn luyện một model hoặc cách làm cho hệ thống trở nên trung thực hơn. Công trình của họ tạo thành nền tảng của ngành công nghiệp. Nếu không có những đóng góp của họ, các model lớn mà chúng ta sử dụng ngày nay sẽ quá đắt đỏ để vận hành và quá thất thường để tin tưởng. Họ cung cấp các rào chắn và động cơ mà phần còn lại của thế giới coi là điều hiển nhiên.
Sự chuyển dịch từ sự tò mò học thuật sang cường quốc công nghiệp đã thay đổi bản chất của nghiên cứu này. Nhiều nhân vật được trích dẫn nhiều nhất đã chuyển từ các trường đại học sang các phòng thí nghiệm tư nhân, nơi họ có quyền truy cập vào các tài nguyên tính toán khổng lồ. Sự di cư này đã tập trung tầm ảnh hưởng vào một vài địa điểm chính. Mặc dù tên các công ty rất nổi tiếng, nhưng các nhóm cụ thể bên trong họ mới là những người thực hiện công việc nặng nhọc. Họ là những người quyết định kiến trúc nào đáng theo đuổi và kiến trúc nào nên bị loại bỏ. Sự tập trung nhân tài này có nghĩa là vài chục người đang thực sự thiết kế cơ sở hạ tầng nhận thức của tương lai. Những lựa chọn của họ về tập dữ liệu và ưu tiên thuật toán sẽ ảnh hưởng đến mọi người dùng công nghệ trong nhiều thập kỷ tới.
Sự dịch chuyển toàn cầu về vốn trí tuệ
Tác động của những nhà nghiên cứu này vượt xa biên giới của Silicon Valley. Các chính phủ và cơ quan quốc tế hiện đang theo dõi sự di chuyển của nhân tài AI hàng đầu như một vấn đề an ninh quốc gia và chính sách kinh tế. Khả năng của một quốc gia trong việc thu hút và giữ chân các tác giả của những bài báo có tác động cao là chỉ số hàng đầu về khả năng cạnh tranh trong tương lai. Điều này là do logic được phát triển bởi những cá nhân này quyết định hiệu quả của các ngành công nghiệp quốc gia, từ logistics đến chăm sóc sức khỏe. Khi một nhà nghiên cứu phát triển một phương pháp mới để gập protein hoặc dự báo thời tiết, họ không chỉ thúc đẩy khoa học. Họ đang mang lại lợi thế cạnh tranh cho bất kỳ thực thể nào có thể triển khai nghiên cứu đó trước tiên. Điều này đã dẫn đến một cuộc cạnh tranh toàn cầu về vốn trí tuệ khốc liệt không kém cuộc đua giành tài nguyên vật chất.
Chúng ta đang thấy một xu hướng nơi các công trình có tầm ảnh hưởng nhất ngày càng mang tính hợp tác xuyên quốc gia, nhưng việc triển khai vẫn mang tính địa phương. Một nhà nghiên cứu ở Montreal có thể hợp tác với một nhóm ở London để tạo ra một bài báo, sau đó được một startup ở Tokyo sử dụng. Sự kết nối này khiến việc xác định nguồn gốc của một tiến bộ cụ thể trở nên khó khăn, nhưng tầm ảnh hưởng của các tác giả cốt lõi vẫn rất rõ ràng. Họ là những người định nghĩa từ vựng của lĩnh vực này. Khi họ nói về những thứ như parameter-efficient fine-tuning hoặc constitutional AI, những thuật ngữ đó trở thành tiêu chuẩn cho toàn bộ cộng đồng toàn cầu. Ngôn ngữ chung này cho phép tiến bộ nhanh chóng nhưng cũng tạo ra một nền văn hóa đơn nhất, nơi một số ý tưởng được ưu tiên hơn những ý tưởng khác.
Tác động toàn cầu cũng có thể thấy rõ trong cách các khu vực khác nhau chuyên môn hóa. Một số trung tâm nghiên cứu tập trung vào đạo đức và sự an toàn của các hệ thống này, trong khi những trung tâm khác ưu tiên hiệu suất thô và quy mô. Các nhà nghiên cứu dẫn đầu các trung tâm này đóng vai trò là người gác cổng trí tuệ cho khu vực của họ. Họ ảnh hưởng đến các quy định địa phương và hướng dẫn đầu tư của các gã khổng lồ công nghệ khu vực. Khi ngày càng nhiều quốc gia cố gắng xây dựng năng lực AI có chủ quyền của riêng mình, họ nhận ra rằng họ không thể chỉ đơn giản là mua công nghệ. Họ cần những người hiểu logic cơ bản. Điều này đã biến những nhà nghiên cứu được trích dẫn nhiều nhất thành những cá nhân quyền lực nhất trong nền kinh tế toàn cầu, ngay cả khi họ chưa bao giờ bước chân vào phòng họp hay thực hiện một cuộc phỏng vấn trên truyền hình.
Từ toán học trừu tượng đến quy trình làm việc hàng ngày
Để thấy tầm ảnh hưởng này ảnh hưởng đến người bình thường như thế nào, hãy xem xét một ngày điển hình của một quản lý marketing tên là Sarah. Sarah bắt đầu buổi sáng bằng cách sử dụng một công cụ AI để tóm tắt hàng tá báo cáo dài. Độ chính xác của các bản tóm tắt đó không phải là kết quả của thương hiệu trên phần mềm. Đó là kết quả của nghiên cứu về sparse attention mechanisms, cho phép model xử lý hàng ngàn từ mà không mất mạch logic. Một nhà nghiên cứu mà cô chưa từng nghe tên đã giải quyết một nút thắt toán học cụ thể ba năm trước, và giờ đây Sarah tiết kiệm được hai giờ mỗi sáng nhờ điều đó. Đây là hậu quả hữu hình, hàng ngày của nghiên cứu cấp cao. Nó không phải là một khái niệm trừu tượng. Đó là một công cụ thay đổi cách Sarah làm công việc của mình.
Cuối ngày, Sarah sử dụng một công cụ tạo hình ảnh cho chiến dịch mạng xã hội. Tốc độ và chất lượng của những hình ảnh đó là kết quả trực tiếp của công việc thực hiện trên diffusion models và latent spaces. Các nhà nghiên cứu tiên phong trong những phương pháp này không tìm cách tạo ra một công cụ marketing. Họ quan tâm đến hình học cơ bản của dữ liệu. Tuy nhiên, tầm ảnh hưởng của họ hiện được cảm nhận bởi mọi người sáng tạo sử dụng các hệ thống này. Sarah không cần phải hiểu toán học để hưởng lợi từ nó, nhưng toán học quyết định những gì cô ấy có thể và không thể làm. Nếu các nhà nghiên cứu quyết định ưu tiên một loại tạo hình ảnh này hơn loại khác, các tùy chọn sáng tạo của Sarah sẽ khác đi. Các nhà nghiên cứu là những đối tác thầm lặng trong quá trình sáng tạo của cô.
Đến buổi chiều, Sarah sử dụng một trợ lý lập trình để giúp cô cập nhật trang web của công ty. Trợ lý này được cung cấp sức mạnh bởi nghiên cứu về large-scale code pre-training. Khả năng của máy móc trong việc hiểu ý định của cô và cung cấp mã nguồn chức năng là minh chứng cho công việc của các nhà nghiên cứu đã tìm ra cách ánh xạ ngôn ngữ tự nhiên sang cú pháp lập trình. Mỗi khi trợ lý gợi ý một dòng mã chính xác, nó đang áp dụng logic được phát triển trong phòng thí nghiệm nhiều năm trước. Năng suất của Sarah là sự phản ánh trực tiếp chất lượng của nghiên cứu đó. Nếu nghiên cứu bị lỗi, mã của cô sẽ có lỗi. Nếu nghiên cứu bị thiên kiến, trang web của cô có thể gặp vấn đề về khả năng truy cập. Tầm ảnh hưởng của nhà nghiên cứu được nhúng vào từng dòng mã mà máy gợi ý.
Kịch bản này diễn ra trong mọi ngành công nghiệp. Các bác sĩ sử dụng công cụ chẩn đoán được xây dựng dựa trên nghiên cứu thị giác máy tính. Các công ty logistics sử dụng tối ưu hóa lộ trình được xây dựng dựa trên reinforcement learning. Ngay cả giải trí mà chúng ta tiêu thụ cũng ngày càng được định hình bởi các thuật toán được thiết kế bởi những kiến trúc sư thầm lặng này. Tầm ảnh hưởng là phổ biến và vô hình. Chúng ta tập trung vào giao diện và thương hiệu, nhưng giá trị thực sự nằm ở logic. Các nhà nghiên cứu là những người quyết định logic đó nên hoạt động như thế nào, nó nên coi trọng điều gì và giới hạn của nó là gì. Họ là những người thực sự đang định hình thế giới mà Sarah đang sống, từng bài báo một.
BotNews.today sử dụng các công cụ AI để nghiên cứu, viết, chỉnh sửa và dịch nội dung. Đội ngũ của chúng tôi xem xét và giám sát quy trình để giữ cho thông tin hữu ích, rõ ràng và đáng tin cậy.
Những câu hỏi chưa có lời giải về quyền lực thuật toán
Khi chúng ta dựa nhiều hơn vào công trình của một nhóm nhỏ các nhà nghiên cứu, chúng ta phải đặt ra những câu hỏi khó về cái giá của tầm ảnh hưởng này. Ai thực sự đang trả tiền cho sức mạnh tính toán khổng lồ cần thiết để kiểm tra các lý thuyết này? Hầu hết các nghiên cứu cấp cao hiện nay đều được tài trợ bởi một vài tập đoàn lớn nhất trên trái đất. Điều này đặt ra câu hỏi liệu nghiên cứu có đang được hướng tới lợi ích công cộng hay hướng tới việc tạo ra các lợi thế độc quyền. Nếu những bộ óc có tầm ảnh hưởng nhất đều làm việc sau những cánh cửa đóng kín, điều gì sẽ xảy ra với tinh thần tìm tòi cởi mở đã xây dựng nên lĩnh vực này? Chúng ta đang thấy một sự chuyển dịch sang nghiên cứu bí mật hơn, nơi kết quả cuối cùng được chia sẻ nhưng phương pháp và dữ liệu vẫn được giữ kín. Sự thiếu minh bạch này là một cái giá ẩn đáng kể.
Cũng có câu hỏi về quyền riêng tư và quyền sở hữu dữ liệu. Các nhà nghiên cứu cần một lượng dữ liệu khổng lồ để huấn luyện và xác thực các model của họ. Dữ liệu này đến từ đâu và ai đã cho phép sử dụng nó? Nhiều bài báo nền tảng trong lĩnh vực này dựa trên các tập dữ liệu được thu thập từ internet mà không có sự đồng ý rõ ràng của những người tạo ra. Điều này tạo ra một tình huống mà tầm ảnh hưởng của nhà nghiên cứu được xây dựng trên sự lao động không được trả công của hàng triệu người. Khi các hệ thống này trở nên mạnh mẽ hơn, sự căng thẳng giữa nhu cầu về dữ liệu và quyền riêng tư sẽ chỉ tăng lên. Chúng ta phải tự hỏi liệu lợi ích của nghiên cứu này có vượt trội hơn sự xói mòn các quyền kỹ thuật số cá nhân hay không.
Cuối cùng, chúng ta phải xem xét tác động môi trường. Việc huấn luyện các model được mô tả trong những bài báo có tầm ảnh hưởng này đòi hỏi một lượng điện năng khổng lồ. Một dự án nghiên cứu duy nhất có thể tiêu thụ năng lượng bằng cả một thị trấn nhỏ. Trong khi một số nhà nghiên cứu đang tập trung vào hiệu suất, xu hướng chung vẫn là hướng tới các hệ thống lớn hơn và tiêu tốn nhiều tài nguyên hơn. Ai chịu trách nhiệm cho dấu chân carbon của những bước đột phá này? Khi thế giới tiến tới một tương lai bền vững hơn, ngành công nghệ phải biện minh cho mức tiêu thụ năng lượng khổng lồ của các nghiên cứu tiên tiến nhất của mình. Liệu sự gia tăng trí tuệ có xứng đáng với cái giá phải trả cho hành tinh? Đây là một câu hỏi mà chính các nhà nghiên cứu mới chỉ bắt đầu giải quyết trong công việc của họ.
Các khung kỹ thuật cho người dùng chuyên nghiệp
Đối với những người muốn vượt ra ngoài bề mặt, việc hiểu cách triển khai kỹ thuật của nghiên cứu này là chìa khóa. Người dùng chuyên nghiệp không chỉ sử dụng các công cụ. Họ hiểu các kiến trúc cơ bản như LoRA (Low-Rank Adaptation) và cách chúng cho phép tinh chỉnh model hiệu quả. Những kỹ thuật này, được các nhà nghiên cứu phát triển để giải quyết vấn đề về số lượng tham số khổng lồ, cho phép các cá nhân tùy chỉnh các model lớn trên phần cứng tiêu dùng. Đây là một ví dụ hoàn hảo về cách tầm ảnh hưởng của nghiên cứu lan tỏa xuống người dùng cá nhân. Bằng cách hiểu toán học đằng sau LoRA, một lập trình viên có thể tạo ra một công cụ chuyên biệt hoạt động tốt như một hệ thống lớn hơn nhiều với chi phí chỉ bằng một phần nhỏ.
Một lĩnh vực quan trọng khác đối với người dùng chuyên nghiệp là nghiên cứu về giới hạn API và tối ưu hóa suy luận. Nghiên cứu có tầm ảnh hưởng nhất hiện nay thường tập trung vào cách tận dụng tối đa một model với lượng tính toán ít nhất. Điều này bao gồm các kỹ thuật như quantization, nơi độ chính xác của trọng số của model được giảm xuống để tiết kiệm bộ nhớ và tăng tốc độ xử lý. Đối với một lập trình viên đang xây dựng ứng dụng, những bước đột phá nghiên cứu này tạo ra sự khác biệt giữa một sản phẩm nhanh, giá cả phải chăng và một sản phẩm chậm, đắt đỏ. Theo kịp những thông tin chi tiết mới nhất của ngành về các chủ đề này là điều cần thiết cho bất kỳ ai đang cố gắng xây dựng các công cụ AI cấp chuyên nghiệp. Các nhà nghiên cứu đang cung cấp bản thiết kế cho những tối ưu hóa này.
Lưu trữ cục bộ và chủ quyền dữ liệu cũng đang trở thành những chủ đề chính trong nghiên cứu tiên tiến. Khi người dùng ngày càng lo ngại về quyền riêng tư, các nhà nghiên cứu đang phát triển các phương pháp cho federated learning và xử lý trên thiết bị. Điều này cho phép model học hỏi từ dữ liệu người dùng mà không cần dữ liệu đó rời khỏi thiết bị. Đối với người dùng chuyên nghiệp, điều này có nghĩa là khả năng chạy các quy trình AI phức tạp cục bộ, bỏ qua nhu cầu về các dịch vụ cloud đắt đỏ và có khả năng không an toàn. Tầm ảnh hưởng của những nhà nghiên cứu đang thúc đẩy các model phi tập trung này không thể bị đánh giá thấp. Họ đang cung cấp các phương tiện kỹ thuật để người dùng giành lại quyền kiểm soát dữ liệu của mình trong khi vẫn được hưởng lợi từ những tiến bộ mới nhất trong trí tuệ máy móc.
Lưu ý của biên tập viên: Chúng tôi tạo trang web này như một trung tâm tin tức và hướng dẫn AI đa ngôn ngữ dành cho những người không phải là chuyên gia máy tính, nhưng vẫn muốn hiểu trí tuệ nhân tạo, sử dụng nó tự tin hơn và theo dõi tương lai đang đến gần.
Bạn có câu chuyện, công cụ, xu hướng hoặc câu hỏi về AI mà bạn nghĩ chúng tôi nên đề cập không? Gửi cho chúng tôi ý tưởng bài viết của bạn — chúng tôi rất muốn nghe từ bạn.Tương lai của tầm ảnh hưởng trí tuệ
Những nhà nghiên cứu được cả thế giới trích dẫn không chỉ là những nhân vật học thuật. Họ là những người thúc đẩy chính của nền kinh tế hiện đại. Công trình của họ quyết định khả năng của các công cụ, hiệu quả của các doanh nghiệp và hướng đi của chính sách toàn cầu. Trong khi công chúng vẫn tập trung vào những gương mặt nổi tiếng của ngành, công việc thực sự đang diễn ra trong các phòng thí nghiệm và trên các máy chủ pre-print. Tầm ảnh hưởng này mang tính cấu trúc, sâu sắc và thường vô hình. Nó được xây dựng trên sự áp dụng nghiêm ngặt của logic và sự kiểm tra liên tục các ý tưởng mới. Khi chúng ta tiến về phía trước, khoảng cách giữa những người hiểu nghiên cứu này và những người chỉ sử dụng sản phẩm sẽ tiếp tục nới rộng.
Câu hỏi trung tâm vẫn chưa được giải quyết là vấn đề trách nhiệm giải trình. Nếu bài báo của một nhà nghiên cứu dẫn đến một hệ thống gây ra thiên kiến hệ thống hoặc gián đoạn kinh tế, trách nhiệm thuộc về ai? Là tác giả của các công thức toán học, công ty đã triển khai nó hay chính phủ đã quản lý nó? Khi tầm ảnh hưởng của những kiến trúc sư thầm lặng này tăng lên, nhu cầu về một khung kết nối đổi mới kỹ thuật với trách nhiệm xã hội cũng tăng theo. Chúng ta đang bước vào một kỷ nguyên mà những người quan trọng nhất trong phòng là những người có thể giải thích toán học, và chúng ta phải đảm bảo rằng tầm ảnh hưởng của họ được sử dụng vì lợi ích của tất cả mọi người. Bạn có thể tìm thấy phân tích khoa học chi tiết hơn về cách các vai trò này đang phát triển trong năm hiện tại.
Tìm thấy lỗi hoặc điều gì đó cần được sửa chữa? Hãy cho chúng tôi biết.