Tại sao AI mô hình mở lại cực quan trọng dù bạn không dùng tới?
“Thanh chắn” vô hình của thế giới máy tính hiện đại
Các mô hình mở (open models) chính là hạ tầng thầm lặng của thế giới hiện đại. Dù bạn chẳng bao giờ tải một file nào từ Hugging Face hay tự chạy server riêng, những mô hình này vẫn âm thầm quyết định cái giá bạn trả cho các dịch vụ trả phí và tốc độ ra mắt các tính năng mới. Chúng đóng vai trò như một “mức sàn” cạnh tranh. Nếu không có chúng, một vài ông lớn sẽ nắm giữ thế độc quyền hoàn toàn đối với công nghệ quan trọng nhất thế kỷ này. Các mô hình mở tạo ra một tiêu chuẩn năng lực cơ bản, buộc các “tay chơi” lớn phải liên tục đổi mới và giữ mức giá hợp lý. Đây không chỉ là thú vui của dân chuyên hay ngách nhỏ của giới nghiên cứu đâu nhé. Đó là một sự thay đổi căn bản trong cách phân chia quyền lực trong làng tech. Khi một mô hình như Llama ra mắt, nó thiết lập một tiêu chuẩn mới cho những gì phần cứng cá nhân có thể làm được. Áp lực này đảm bảo rằng các mô hình đóng (closed models) mà bạn dùng hàng ngày luôn sắc bén và vừa túi tiền. Hiểu rõ những sắc thái của sự “mở” này là bước đầu tiên để thấy được ngành công nghiệp đang đi về đâu.
Giải mã những lời quảng cáo “có cánh” về sự cởi mở
Có rất nhiều sự nhầm lẫn về việc “mở” thực sự có nghĩa là gì. Phần mềm mã nguồn mở (open source) thực thụ cho phép bất kỳ ai cũng có thể xem code, chỉnh sửa và phân phối nó. Trong thế giới của các mô hình ngôn ngữ lớn, định nghĩa này bắt đầu trở nên nhập nhằng. Đa số các mô hình mà mọi người gọi là mã nguồn mở thực chất là các mô hình open weight (mở trọng số). Điều này có nghĩa là công ty đã công bố các tham số (parameters) đã được huấn luyện xong xuôi, nhưng họ không hề tung ra các bộ dữ liệu khổng lồ dùng để huấn luyện hay các script làm sạch dữ liệu. Không có dữ liệu, bạn không thể thực sự tái tạo mô hình từ con số không. Bạn chỉ có trong tay thành phẩm thôi. Rồi còn cả các loại giấy phép (licenses) nữa. Một số công ty dùng các giấy phép tùy chỉnh trông thì có vẻ mở nhưng lại hạn chế sử dụng thương mại hoặc có các điều khoản ngăn cản đối thủ cạnh tranh. Ví dụ, một mô hình có thể miễn phí cho cá nhân nhưng bắt buộc phải mua license nếu công ty của bạn có hơn 700 triệu người dùng hàng tháng. Khác xa với các giấy phép GPL hay MIT truyền thống đã xây dựng nên internet. Chúng ta cũng thấy ngôn ngữ marketing dùng từ “mở” để mô tả một API có thể truy cập công khai nhưng lại bị kiểm soát hoàn toàn bởi một công ty duy nhất. Đó không phải là mở đâu, đó chỉ là một sản phẩm có cửa vào công cộng thôi. Các mô hình thực sự mở cho phép bạn tải các file về và chạy trên phần cứng của riêng mình mà không cần kết nối internet. Sự khác biệt này cực kỳ quan trọng vì nó quyết định ai là người nắm giữ “nút thắt” cuối cùng. Nếu bạn phụ thuộc vào một API, nhà cung cấp có thể đổi luật hoặc ngắt kết nối bất cứ lúc nào. Nếu bạn có weights trên ổ cứng, bạn sở hữu năng lực đó.
Tại sao các quốc gia lại đặt cược vào trọng số công khai
Tác động toàn cầu của những mô hình này là không thể bàn cãi. Với nhiều quốc gia, việc phụ thuộc vào một vài công ty Mỹ cho toàn bộ hạ tầng AI là một rủi ro lớn đối với **chủ quyền kỹ thuật số** (digital sovereignty). Các chính phủ ở châu Âu và châu Á đang ngày càng hướng tới các mô hình mở để xây dựng các phiên bản AI bản địa hóa. Điều này giúp họ đảm bảo các mô hình phản ánh đúng giá trị văn hóa và sắc thái ngôn ngữ của mình thay vì chỉ theo kiểu Thung lũng Silicon. Nó cũng giúp giữ dữ liệu trong biên giới quốc gia, một mối quan tâm lớn về quyền riêng tư và bảo mật. Các doanh nghiệp vừa và nhỏ cũng được hưởng lợi. Họ có thể xây dựng các công cụ chuyên biệt mà không sợ công nghệ cốt lõi bị “rút củi đáy nồi”. Mô hình mở cũng hạ thấp rào cản gia nhập cho các lập trình viên ở các thị trường mới nổi. Một ai đó ở Lagos hay Jakarta có thể tiếp cận công nghệ đỉnh cao tương tự như ở San Francisco, miễn là họ có phần cứng để chạy. Điều này tạo ra một sân chơi bình đẳng mà các API độc quyền không bao giờ làm được. Sự tồn tại của các mô hình này cũng tạo ra một hệ sinh thái khổng lồ các công cụ phụ trợ. Các lập trình viên tạo ra cách để mô hình chạy nhanh hơn hoặc tốn ít bộ nhớ hơn. Sự đổi mới tập thể này diễn ra nhanh hơn bất kỳ công ty đơn lẻ nào. Nó tạo ra một vòng lặp phản hồi, nơi những cải tiến mở cuối cùng sẽ tìm đường quay trở lại các mô hình đóng mà chúng ta vẫn dùng.
Một ngày không có Cloud
Hãy xem điều này diễn ra như thế nào trong một ngày làm việc bình thường của Sarah, một lập trình viên phần mềm. Sarah làm việc cho một startup y tế xử lý dữ liệu bệnh nhân nhạy cảm. Công ty cô không thể dùng AI dựa trên cloud vì rủi ro rò rỉ dữ liệu quá cao và các rào cản pháp lý quá khắt khe. Thay vào đó, Sarah dùng một mô hình open weight chạy trên server nội bộ bảo mật. Buổi sáng, cô dùng mô hình để giúp cô tái cấu trúc (refactor) một đoạn code phức tạp. Vì mô hình chạy local, cô không phải lo lắng về việc code độc quyền của mình bị dùng để huấn luyện phiên bản AI thương mại trong tương lai. Sau đó, cô dùng một phiên bản mô hình đã được fine-tuned để tóm tắt bệnh án. Mô hình cụ thể này đã được huấn luyện về thuật ngữ y khoa, giúp nó chính xác hơn cho nhu cầu của cô so với một mô hình đa năng. Trong giờ nghỉ trưa, Sarah đọc một bài blog về phân tích ngành AI về các xu hướng mới nhất trong local inference. Cô nhận ra mình có thể tối ưu hóa quy trình làm việc hơn nữa. Buổi chiều, cô thử nghiệm một kỹ thuật quantization mới cho phép cô chạy một mô hình lớn hơn trên phần cứng hiện có. Đây chính là vẻ đẹp của hệ sinh thái mở. Cô không cần đợi một ông lớn công nghệ ra mắt tính năng mới. Cô có thể tự triển khai bằng các công cụ do cộng đồng tạo ra. Đến cuối ngày, cô đã cải thiện độ chính xác của công cụ tóm tắt thêm 15%. Kịch bản này đang trở nên phổ biến trong nhiều ngành công nghiệp. Từ các công ty luật đến các agency sáng tạo, mọi người đang thấy rằng sự kiểm soát và quyền riêng tư mà mô hình mở mang lại rất xứng đáng với công sức thiết lập. Họ đang xây dựng các công cụ được “đo ni đóng giày” cho nhu cầu riêng thay vì cố gắng nhét vấn đề của mình vào cái hộp của một trợ lý AI chung chung. Sự chuyển dịch này cũng thấy rõ trong lĩnh vực giáo dục. Các trường đại học đang dùng mô hình mở để dạy sinh viên cách AI hoạt động bên dưới “nắp ca-pô”. Họ có thể kiểm tra weights và thử nghiệm các kỹ thuật huấn luyện khác nhau. Điều này tạo ra một lực lượng lao động am hiểu và năng lực hơn cho tương lai. Khả năng chạy các hệ thống này offline cũng có nghĩa là các nhà nghiên cứu ở vùng sâu vùng xa có thể tiếp tục công việc mà không cần kết nối internet ổn định.
Cái giá đắt của phần mềm miễn phí
Mặc dù lợi ích đã rõ ràng, chúng ta cũng phải đặt ra những câu hỏi hóc búa về cái giá thực sự của sự cởi mở này. Ai thực sự đang trả tiền cho sức mạnh tính toán khổng lồ cần thiết để huấn luyện các mô hình này? Nếu một công ty như Meta chi hàng trăm triệu đô để huấn luyện một mô hình rồi tặng không weights, thì nước đi dài hạn của họ là gì? Liệu đây có phải là cách để triệt tiêu các đối thủ nhỏ hơn, những người không đủ lực để cho không sản phẩm của mình? Chúng ta cũng phải cân nhắc các rủi ro an toàn. Nếu một mô hình thực sự mở, điều đó có nghĩa là các “thanh chắn” an toàn có thể bị gỡ bỏ. Điều này có thể cho phép những kẻ xấu lợi dụng công nghệ cho mục đích độc hại như tạo deepfakes hoặc tạo mã độc. Làm thế nào để cân bằng giữa nhu cầu đổi mới mở và nhu cầu an toàn công cộng?
BotNews.today sử dụng các công cụ AI để nghiên cứu, viết, chỉnh sửa và dịch nội dung. Đội ngũ của chúng tôi xem xét và giám sát quy trình để giữ cho thông tin hữu ích, rõ ràng và đáng tin cậy.
Bên dưới “nắp ca-pô” của Local Inference
Với những ai muốn tích hợp các mô hình này vào quy trình làm việc chuyên nghiệp, các chi tiết kỹ thuật rất quan trọng. Cách phổ biến nhất để chạy các mô hình này local là thông qua các framework chuyên dụng. Các công cụ này sử dụng quantization để giảm kích thước mô hình, cho phép chúng vừa vặn với VRAM của các GPU phổ thông. Ví dụ, một mô hình ban đầu yêu cầu 40GB bộ nhớ có thể được nén xuống còn 8GB với chất lượng giảm sút rất ít. Điều này được thực hiện bằng cách thay đổi độ chính xác của weights từ 16-bit xuống 4-bit hoặc thấp hơn nữa. Khi nói đến API, nhiều mô hình mở có sẵn thông qua các nhà cung cấp như Hugging Face hoặc Together AI. Các dịch vụ này cung cấp rate limits cao hơn nhiều so với các nhà cung cấp độc quyền, khiến chúng trở nên lý tưởng cho các ứng dụng có lưu lượng lớn. Tuy nhiên, sức mạnh thực sự nằm ở việc lưu trữ local và fine-tuning. Bằng cách sử dụng các kỹ thuật như LoRA, bạn có thể huấn luyện một mô hình trên dữ liệu của riêng mình chỉ trong vài giờ trên một GPU duy nhất. Điều này tạo ra một công cụ chuyên biệt hóa cao, vượt trội hơn các mô hình lớn hơn nhiều trong các tác vụ cụ thể. Bạn cũng cần cân nhắc đến context window. Nhiều mô hình mở hiện nay hỗ trợ context window lên tới 32k hoặc thậm chí 128k tokens, cho phép bạn xử lý toàn bộ tài liệu cùng lúc. Việc tích hợp các mô hình này vào phần mềm hiện có đang trở nên dễ dàng hơn nhờ các API tiêu chuẩn hóa. Điều này có nghĩa là bạn thường có thể chuyển từ mô hình đóng sang mô hình mở chỉ bằng cách thay đổi một dòng code trong ứng dụng của mình. Trong tương lai, chúng tôi kỳ vọng những công cụ này sẽ còn dễ tiếp cận hơn nữa với các lập trình viên bình thường.
- Llama.cpp để chạy inference trên CPU và GPU đa nền tảng
- Ollama để quản lý mô hình local một cách đơn giản hơn
Lời kết về sự lựa chọn
Sự lựa chọn giữa mô hình mở và đóng không phải là chuyện “một mất một còn”. Đa số mọi người sẽ tiếp tục sử dụng kết hợp cả hai. Các mô hình đóng từ các công ty như Meta AI hoặc các bên khác mang lại sự tiện lợi, trau chuốt và hiệu năng đỉnh cao cho các tác vụ chung. Mô hình mở mang lại sự kiểm soát, quyền riêng tư và khả năng chuyên biệt hóa. Ngay cả khi bạn chẳng bao giờ tự mình tải một mô hình nào về, thì việc những người khác có thể làm điều đó chính là thứ giữ cho toàn bộ ngành công nghiệp này luôn minh bạch. Nó đảm bảo rằng AI vẫn là một công cụ dành cho tất cả mọi người chứ không phải là một bí mật được canh giữ cẩn mật của một số ít người. Sự cạnh tranh được thúc đẩy bởi cộng đồng mở là lực lượng mạnh mẽ nhất cho sự tiến bộ trong thế giới công nghệ ngày nay. Nó buộc sự minh bạch phải lên ngôi và dân chủ hóa quyền tiếp cận những công cụ mạnh mẽ nhất từng được tạo ra.
Bạn có câu chuyện, công cụ, xu hướng hoặc câu hỏi về AI mà bạn nghĩ chúng tôi nên đề cập không? Gửi cho chúng tôi ý tưởng bài viết của bạn — chúng tôi rất muốn nghe từ bạn.
Lưu ý của biên tập viên: Chúng tôi tạo trang web này như một trung tâm tin tức và hướng dẫn AI đa ngôn ngữ dành cho những người không phải là chuyên gia máy tính, nhưng vẫn muốn hiểu trí tuệ nhân tạo, sử dụng nó tự tin hơn và theo dõi tương lai đang đến gần.
Tìm thấy lỗi hoặc điều gì đó cần được sửa chữa? Hãy cho chúng tôi biết.