Liệu các mô hình mở có thực sự thách thức được các phòng lab lớn?
Sự phi tập trung hóa trí tuệ vĩ đại
Khoảng cách giữa các hệ thống đóng độc quyền và các mô hình công cộng đang thu hẹp nhanh hơn dự đoán của hầu hết các chuyên gia. Chỉ một năm trước, mọi người đều đồng thuận rằng các phòng lab khổng lồ với nguồn vốn hàng tỷ đô sẽ duy trì vị thế dẫn đầu vĩnh viễn. Ngày nay, khoảng cách đó chỉ còn tính bằng tháng thay vì bằng năm. Các mô hình open weights hiện nay có hiệu suất ngang ngửa với những hệ thống đóng tiên tiến nhất trong việc lập trình, suy luận và viết lách sáng tạo. Sự thay đổi này không chỉ là một tò mò kỹ thuật. Nó đại diện cho một bước ngoặt căn bản trong việc ai là người kiểm soát tương lai của điện toán. Khi một lập trình viên có thể chạy một mô hình hiệu năng cao trên phần cứng của riêng mình, quyền lực sẽ dịch chuyển khỏi các nhà cung cấp tập trung. Xu hướng này cho thấy kỷ nguyên của mô hình “hộp đen” đang đối mặt với thách thức thực sự đầu tiên từ một cộng đồng toàn cầu phi tập trung.
Sự trỗi dậy của các hệ thống dễ tiếp cận này đã buộc chúng ta phải đánh giá lại thế nào là người dẫn đầu trong lĩnh vực này. Không còn đủ nếu chỉ sở hữu cụm chip lớn nhất nếu mô hình tạo ra bị khóa sau một giao diện đắt đỏ và hạn chế. Các lập trình viên đang bỏ phiếu bằng thời gian và tài nguyên tính toán của họ. Họ chọn những mô hình mà họ có thể kiểm tra, sửa đổi và triển khai mà không cần xin phép. Phong trào này đang lấy đà vì nó giải quyết được các nhu cầu cốt lõi về quyền riêng tư và tùy biến mà các mô hình đóng thường bỏ qua. Kết quả là một môi trường cạnh tranh hơn, nơi trọng tâm đã chuyển từ quy mô đơn thuần sang hiệu quả và khả năng tiếp cận. Đây là khởi đầu của một kỷ nguyên mới, nơi các công cụ mạnh mẽ nhất cũng chính là những công cụ dễ dùng nhất.
Ba bộ tộc phát triển
Để hiểu công nghệ này đang đi về đâu, bạn phải nhìn vào ba loại tổ chức khác nhau đang xây dựng nó. Đầu tiên là các phòng lab tiên phong (frontier labs). Đây là những gã khổng lồ như OpenAI và Google. Mục tiêu của họ là đạt đến cấp độ cao nhất có thể của trí tuệ tổng quát. Họ ưu tiên quy mô và sức mạnh thô trên hết. Đối với họ, sự cởi mở thường bị xem là rủi ro cho sự an toàn hoặc làm mất lợi thế cạnh tranh. Họ xây dựng các hệ sinh thái đóng khổng lồ, cung cấp hiệu suất cao nhưng đòi hỏi sự phụ thuộc hoàn toàn vào hạ tầng cloud của họ. Các mô hình của họ là tiêu chuẩn vàng về hiệu suất, nhưng đi kèm với những ràng buộc về chính sách sử dụng và chi phí định kỳ.
Thứ hai là các phòng lab học thuật. Những tổ chức như Stanford Institute for Human-Centered AI tập trung vào tính minh bạch và khả năng tái lập. Mục tiêu của họ không phải là bán sản phẩm mà là hiểu cách các hệ thống này vận hành. Họ công bố các phát hiện, bộ dữ liệu và phương pháp huấn luyện của mình. Dù mô hình của họ không phải lúc nào cũng đạt sức mạnh thô như các phòng lab tiên phong, họ cung cấp nền tảng cho phần còn lại của ngành. Họ đặt ra những câu hỏi mà các phòng lab thương mại có thể tránh né, như cách định kiến hình thành hoặc làm thế nào để việc huấn luyện tiết kiệm năng lượng hơn. Công việc của họ đảm bảo rằng khoa học trong lĩnh vực này vẫn là tài sản công thay vì bí mật doanh nghiệp.
Cuối cùng là các phòng lab sản phẩm và những người ủng hộ open weights trong doanh nghiệp. Meta và Mistral thuộc nhóm này. Họ phát hành mô hình ra công chúng để xây dựng hệ sinh thái. Bằng cách cung cấp trọng số (weights), họ khuyến khích hàng ngàn lập trình viên tối ưu hóa code và xây dựng các công cụ tương thích. Đây là một nước đi chiến lược để chống lại sự thống trị của các nền tảng đóng. Nếu mọi người đều xây dựng trên kiến trúc của bạn, bạn sẽ trở thành tiêu chuẩn ngành. Cách tiếp cận này thu hẹp khoảng cách giữa nghiên cứu thuần túy và sản phẩm thương mại. Nó cho phép mức độ triển khai mà các phòng lab học thuật không thể đạt được, đồng thời duy trì sự tự do mà các phòng lab tiên phong không cho phép.
Ảo tưởng về sự cởi mở trong phần mềm hiện đại
Thuật ngữ open source thường được sử dụng một cách lỏng lẻo trong ngành này, dẫn đến sự nhầm lẫn đáng kể. Phần mềm open source thực thụ, theo định nghĩa của Open Source Initiative, yêu cầu mã nguồn, hướng dẫn xây dựng và dữ liệu phải được cung cấp miễn phí. Hầu hết các mô hình hiện đại không đáp ứng tiêu chí này. Thay vào đó, chúng ta thấy sự gia tăng của các mô hình open weights. Trong thiết lập này, công ty cung cấp kết quả cuối cùng của quá trình huấn luyện nhưng giữ bí mật dữ liệu huấn luyện và công thức. Đây là một sự khác biệt quan trọng. Bạn có thể chạy mô hình và xem nó hoạt động thế nào, nhưng bạn không thể dễ dàng tạo lại nó từ đầu hoặc biết chính xác thông tin nào đã được nạp vào trong quá trình tạo ra nó.
Ngôn ngữ tiếp thị thường làm phức tạp thêm vấn đề này bằng cách sử dụng các thuật ngữ như giấy phép “permissive” hoặc “cộng đồng”. Các giấy phép này thường bao gồm các điều khoản hạn chế cách mô hình được sử dụng bởi các công ty rất lớn hoặc cho các tác vụ cụ thể. Mặc dù các mô hình này dễ tiếp cận hơn nhiều so với API đóng, chúng không phải lúc nào cũng miễn phí theo nghĩa truyền thống. Điều này tạo ra một phổ cởi mở. Ở một đầu, bạn có các mô hình hoàn toàn đóng như GPT-4. Ở giữa, bạn có các mô hình open weights như Llama 3. Ở đầu xa, bạn có các dự án phát hành mọi thứ, bao gồm cả dữ liệu. Hiểu được vị trí của một mô hình trên phổ này là rất quan trọng đối với bất kỳ doanh nghiệp hay lập trình viên nào đang lập kế hoạch dài hạn.
Lợi ích của cách tiếp cận bán mở này vẫn rất to lớn. Nó cho phép lưu trữ cục bộ (local hosting), một yêu cầu đối với nhiều ngành công nghiệp có quy định nghiêm ngặt về chủ quyền dữ liệu. Nó cũng cho phép tinh chỉnh (fine-tuning), nơi một mô hình được huấn luyện trên một lượng nhỏ dữ liệu cụ thể để trở thành chuyên gia trong một lĩnh vực nhất định. Mức độ kiểm soát này là không thể với một API đóng. Tuy nhiên, chúng ta phải chính xác về những gì thực sự mở. Nếu một công ty có thể thu hồi giấy phép của bạn hoặc nếu dữ liệu huấn luyện là một bí ẩn, bạn vẫn đang vận hành trong một hệ thống do người khác thiết kế. Xu hướng hiện tại đang hướng tới sự minh bạch hơn, nhưng chúng ta chưa đạt đến điểm mà các mô hình mạnh mẽ nhất thực sự là open source.
Kiểm soát cục bộ trong kỷ nguyên của các gã khổng lồ Cloud
Đối với một lập trình viên làm việc trong môi trường bảo mật cao, sự chuyển dịch sang open weights là một nhu cầu thực tế. Hãy tưởng tượng một kỹ sư trưởng tại một công ty tài chính quy mô vừa. Trước đây, họ sẽ phải gửi dữ liệu khách hàng nhạy cảm đến một máy chủ của bên thứ ba để có được lợi ích của một mô hình ngôn ngữ lớn. Điều này tạo ra rủi ro bảo mật khổng lồ và sự phụ thuộc vào thời gian hoạt động của nhà cung cấp bên ngoài. Ngày nay, kỹ sư đó có thể tải xuống một mô hình hiệu năng cao và chạy nó trên máy chủ nội bộ. Họ có toàn quyền kiểm soát luồng dữ liệu. Họ có thể sửa đổi mô hình để hiểu các thuật ngữ chuyên môn và quy tắc tuân thủ cụ thể của công ty. Đây không chỉ là sự tiện lợi. Đó là sự thay đổi căn bản trong cách công ty quản lý tài sản giá trị nhất của mình: dữ liệu.
Một ngày làm việc của kỹ sư này đã thay đổi đáng kể. Thay vì quản lý các API key và lo lắng về giới hạn tốc độ, họ dành thời gian tối ưu hóa suy luận cục bộ (local inference). Họ có thể sử dụng một công cụ như Hugging Face để tìm phiên bản mô hình đã được nén để phù hợp với phần cứng sẵn có. Họ có thể chạy thử nghiệm lúc 3 giờ sáng mà không lo lắng về chi phí cho mỗi token được tạo ra. Nếu mô hình mắc lỗi, họ có thể xem xét các trọng số và cố gắng hiểu lý do, hoặc họ có thể sử dụng fine-tuning để sửa lỗi. Mức độ tự chủ này là điều không tưởng đối với hầu hết các doanh nghiệp chỉ hai năm trước. Nó cho phép chu kỳ lặp nhanh hơn và sản phẩm cuối cùng mạnh mẽ hơn.
Sự tự do này cũng mở rộng đến người dùng cá nhân. Một nhà văn hoặc nhà nghiên cứu có thể chạy một mô hình trên laptop của mình mà không có bộ lọc do một ủy ban ở Silicon Valley thiết kế. Họ có thể khám phá ý tưởng và tạo nội dung mà không cần người trung gian quyết định cái gì là phù hợp. Đây là sự khác biệt giữa việc thuê một công cụ và sở hữu nó. Trong khi các gã khổng lồ cloud cung cấp trải nghiệm bóng bẩy, dễ sử dụng, hệ sinh thái mở cung cấp thứ giá trị hơn: quyền chủ động. Khi phần cứng trở nên mạnh mẽ hơn và các mô hình trở nên hiệu quả hơn, số lượng người chạy các hệ thống này cục bộ sẽ chỉ tăng lên. Cách tiếp cận phi tập trung này đảm bảo rằng lợi ích của công nghệ này không bị giới hạn cho những người có khả năng chi trả các gói đăng ký hàng tháng đắt đỏ.
BotNews.today sử dụng các công cụ AI để nghiên cứu, viết, chỉnh sửa và dịch nội dung. Đội ngũ của chúng tôi xem xét và giám sát quy trình để giữ cho thông tin hữu ích, rõ ràng và đáng tin cậy.
Các doanh nghiệp cũng nhận thấy rằng các mô hình mở là một biện pháp phòng ngừa rủi ro nền tảng. Nếu một nhà cung cấp đóng thay đổi giá cả hoặc điều khoản dịch vụ, một công ty xây dựng trên API đó sẽ gặp rắc rối. Bằng cách sử dụng open weights, một công ty có thể chuyển đổi nhà cung cấp phần cứng hoặc chuyển toàn bộ stack của họ sang một cloud khác mà không làm mất trí tuệ cốt lõi. Sự linh hoạt này đang thúc đẩy phần lớn sự chấp nhận mà chúng ta thấy ngày nay. Không còn là việc mô hình nào tốt hơn một chút trên bảng xếp hạng benchmark. Đó là về việc mô hình nào mang lại cho doanh nghiệp sự ổn định dài hạn nhất. Những cải tiến gần đây trong hệ sinh thái AI mã nguồn mở đã biến đây thành một chiến lược khả thi cho các công ty ở mọi quy mô.
Cái giá đắt của các mô hình miễn phí
Bất chấp sự phấn khích, chúng ta phải đặt ra những câu hỏi khó về các chi phí ẩn của sự cởi mở. Chạy một mô hình lớn cục bộ không hề miễn phí. Nó đòi hỏi đầu tư đáng kể vào phần cứng, cụ thể là các GPU cao cấp với bộ nhớ lớn. Đối với nhiều doanh nghiệp nhỏ, chi phí mua và bảo trì phần cứng này có thể vượt quá chi phí đăng ký API trong vài năm. Ngoài ra còn có chi phí điện năng và nhu cầu về nhân tài chuyên môn để quản lý việc triển khai. Liệu chúng ta có đang đơn giản là đổi một gói đăng ký phần mềm lấy hóa đơn phần cứng và năng lượng? Thực tế kinh tế của AI cục bộ phức tạp hơn những gì các tiêu đề báo chí gợi ý.
Bạn có câu chuyện, công cụ, xu hướng hoặc câu hỏi về AI mà bạn nghĩ chúng tôi nên đề cập không? Gửi cho chúng tôi ý tưởng bài viết của bạn — chúng tôi rất muốn nghe từ bạn.Quyền riêng tư là một lĩnh vực khác cần sự hoài nghi. Mặc dù chạy mô hình cục bộ tốt hơn cho bảo mật dữ liệu, bản thân các mô hình thường được huấn luyện trên dữ liệu thu thập từ internet mà không có sự đồng ý. Việc sử dụng một mô hình mở có khiến bạn đồng lõa trong hành vi này không? Hơn nữa, nếu một mô hình là mở, nó cũng mở với những kẻ xấu. Những công cụ cho phép bác sĩ tóm tắt ghi chú y tế có thể bị hacker sử dụng để tự động hóa các cuộc tấn công phishing. Làm thế nào để chúng ta cân bằng giữa lợi ích của việc dân chủ hóa với rủi ro bị lạm dụng? Các phòng lab phát hành trọng số thường tuyên bố rằng cộng đồng sẽ cung cấp các kiểm tra an toàn cần thiết, nhưng đây là một tuyên bố khó kiểm chứng. Chúng ta phải xem xét liệu việc thiếu sự giám sát tập trung là một tính năng hay một lỗ hổng.
Cuối cùng, chúng ta phải xem xét tính bền vững của mô hình mở. Huấn luyện các hệ thống này tốn hàng triệu đô la. Nếu các công ty như Meta hoặc Mistral quyết định rằng việc phát hành trọng số không còn mang lại lợi ích cho họ, sự tiến bộ của cộng đồng mở có thể bị đình trệ. Chúng ta hiện đang hưởng lợi từ một chiến lược doanh nghiệp ưu tiên sự cởi mở để giành thị phần. Nếu chiến lược đó thay đổi, cộng đồng có thể thấy mình tụt hậu nhiều năm so với các phòng lab tiên phong một lần nữa. Liệu có thể xây dựng một mô hình hiệu năng cao, thực sự độc lập mà không cần sự hỗ trợ của một tập đoàn đa tỷ đô? Sự phụ thuộc hiện tại vào sự hào phóng của doanh nghiệp là một điểm yếu tiềm ẩn cho toàn bộ phong trào.
Bên trong bộ máy suy luận cục bộ
Đối với người dùng chuyên nghiệp (power user), công việc thực sự nằm ở việc tích hợp các mô hình này vào các quy trình làm việc hiện có. Một trong những thách thức lớn nhất là yêu cầu phần cứng. Để chạy một mô hình với 70 tỷ tham số, bạn thường cần ít nhất hai GPU tiêu dùng cao cấp hoặc một card chuyên nghiệp với 48GB VRAM. Điều này dẫn đến sự trỗi dậy của các kỹ thuật lượng tử hóa (quantization). Bằng cách giảm độ chính xác của trọng số mô hình từ 16-bit xuống 4-bit hoặc thậm chí 2-bit, các lập trình viên có thể nhồi nhét các mô hình lớn hơn nhiều vào phần cứng rẻ hơn. Quá trình này bao gồm một sự đánh đổi nhỏ về độ chính xác, nhưng đối với hầu hết các tác vụ, sự khác biệt là không đáng kể. Các công cụ như Llama.cpp đã giúp việc chạy các mô hình này trên CPU tiêu chuẩn và phần cứng Mac trở nên khả thi, giảm đáng kể rào cản gia nhập.
Một yếu tố quan trọng khác là giới hạn API. Khi sử dụng nhà cung cấp đóng, bạn thường bị giới hạn bởi số lượng yêu cầu mỗi phút. Với một mô hình cục bộ, giới hạn duy nhất của bạn là tốc độ phần cứng. Điều này cho phép các quy trình làm việc phức tạp nơi mô hình được gọi hàng trăm lần trong một tiến trình duy nhất. Ví dụ, một lập trình viên có thể sử dụng mô hình để phân tích hàng ngàn dòng code hoặc tạo ra toàn bộ bộ dữ liệu tổng hợp để thử nghiệm. Những tác vụ này sẽ cực kỳ đắt đỏ và chậm chạp trên một API cloud. Lưu trữ cục bộ cũng cho phép sử dụng các cửa sổ ngữ cảnh (context windows) khổng lồ. Bạn có thể nạp toàn bộ thư viện tài liệu vào một mô hình mà không cần lo lắng về chi phí của các token đầu vào.
Việc tích hợp quy trình làm việc cũng đang trở nên tinh vi hơn. Các lập trình viên đang sử dụng các framework cho phép họ thay đổi mô hình ra vào chỉ với một dòng code. Điều này có nghĩa là một hệ thống có thể sử dụng một mô hình nhỏ, nhanh cho các tác vụ đơn giản và một mô hình lớn, chậm cho các suy luận phức tạp. Cách tiếp cận lai này tối ưu hóa cả chi phí và hiệu suất. Tuy nhiên, vẫn còn những trở ngại. Các mô hình cục bộ thường thiếu các bộ lọc an toàn bóng bẩy và tài liệu phong phú như các đối tác đóng của chúng. Thiết lập một môi trường cục bộ mạnh mẽ đòi hỏi sự hiểu biết sâu sắc về Linux, Python và driver GPU. Đối với những người có thể quản lý được, phần thưởng là mức hiệu suất và quyền riêng tư mà không nhà cung cấp cloud nào có thể sánh kịp.
Tiêu chuẩn mới cho công nghệ công cộng
Cuộc cạnh tranh giữa các mô hình mở và đóng là câu chuyện quan trọng nhất trong công nghệ hiện nay. Đó là một cuộc chiến về kiến trúc cơ bản của internet. Nếu các mô hình đóng thắng, tương lai của AI sẽ giống như các kho ứng dụng di động hiện nay, với hai hoặc ba gã khổng lồ kiểm soát những gì có thể làm được. Nếu các mô hình mở tiếp tục quỹ đạo hiện tại, tương lai sẽ giống như chính web, một mạng lưới phi tập trung nơi bất kỳ ai cũng có thể xây dựng và đổi mới. Sự chuyển dịch gần đây sang open weights chất lượng cao là một dấu hiệu mạnh mẽ cho thấy khả năng thứ hai đang trở nên khả thi hơn. Đó là một tầm nhìn đầy thuyết phục về một thế giới nơi trí tuệ là một tiện ích thay vì một món hàng xa xỉ.
Khi chúng ta bước vào năm nay, trọng tâm có thể sẽ chuyển từ hiệu suất mô hình thô sang hệ sinh thái xung quanh các mô hình này. Người chiến thắng sẽ không phải là công ty có điểm benchmark cao nhất, mà là công ty giúp người khác xây dựng dễ dàng nhất. Khoảng cách giữa một bài báo nghiên cứu và một sản phẩm hữu ích vẫn còn lớn, nhưng cộng đồng mở đang xây dựng những cây cầu cần thiết để vượt qua nó. Đây là thời điểm của sự thay đổi nhanh chóng, và những lựa chọn của các lập trình viên và doanh nghiệp ngày nay sẽ định hình môi trường công nghệ trong thập kỷ tới. Kỷ nguyên của chiếc hộp đóng đang kết thúc, và kỷ nguyên của open weight chỉ mới bắt đầu.
Lưu ý của biên tập viên: Chúng tôi tạo trang web này như một trung tâm tin tức và hướng dẫn AI đa ngôn ngữ dành cho những người không phải là chuyên gia máy tính, nhưng vẫn muốn hiểu trí tuệ nhân tạo, sử dụng nó tự tin hơn và theo dõi tương lai đang đến gần.
Tìm thấy lỗi hoặc điều gì đó cần được sửa chữa? Hãy cho chúng tôi biết.