Chúng ta thực sự đang xây dựng loại trí tuệ nào?
Chúng ta không hề xây dựng các bộ não nhân tạo. Chúng ta đang tạo ra những cỗ máy thống kê tinh vi, chuyên dự đoán mảnh thông tin khả dĩ tiếp theo trong một chuỗi dữ liệu. Các cuộc thảo luận hiện nay thường đối xử với các mô hình ngôn ngữ lớn (LLM) như thể chúng là những bộ não sinh học sơ khai, nhưng đây là một sai lầm cơ bản về bản chất. Những hệ thống này không hiểu khái niệm; chúng xử lý các token thông qua toán học đa chiều. Bài học cốt lõi cho bất kỳ ai quan sát là chúng ta đã công nghiệp hóa việc bắt chước biểu đạt của con người. Đây là công cụ để tổng hợp, không phải công cụ để nhận thức. Khi bạn tương tác với một mô hình hiện đại, bạn đang truy vấn một phiên bản nén của internet công cộng. Nó cung cấp câu trả lời có xác suất cao nhất, chứ không nhất thiết là câu trả lời đúng. Sự khác biệt này xác định ranh giới giữa những gì công nghệ có thể làm và những gì chúng ta tưởng tượng nó có thể làm. Khi tích hợp các công cụ này vào mọi ngóc ngách của cuộc sống, rủi ro sẽ chuyển từ sự mới lạ về kỹ thuật sang sự phụ thuộc thực tế. Chúng ta phải ngừng hỏi liệu máy móc có đang suy nghĩ hay không và bắt đầu tự hỏi điều gì sẽ xảy ra khi chúng ta phó mặc khả năng phán đoán của mình cho một đường cong xác suất. Bạn có thể tìm hiểu thêm về những thay đổi này trong các thông tin chuyên sâu về AI mới nhất của chúng tôi tại [Insert Your AI Magazine Domain Here] khi chúng tôi theo dõi sự tiến hóa của các hệ thống này.
Kiến trúc của dự đoán xác suất
Để hiểu trạng thái công nghệ hiện tại, người ta phải nhìn vào kiến trúc transformer. Đây là khung toán học cho phép mô hình cân nhắc tầm quan trọng của các từ khác nhau trong một câu. Nó không sử dụng cơ sở dữ liệu về sự thật. Thay vào đó, nó sử dụng các trọng số và độ chệch để xác định mối quan hệ giữa các điểm dữ liệu. Khi người dùng nhập một prompt, hệ thống sẽ chuyển đổi văn bản đó thành các con số gọi là vector. Các vector này tồn tại trong một không gian với hàng ngàn chiều. Sau đó, mô hình tính toán quỹ đạo của từ tiếp theo dựa trên các mẫu mà nó đã học trong quá trình đào tạo. Quá trình này hoàn toàn mang tính toán học. Không có độc thoại nội tâm hay suy ngẫm có ý thức nào ở đây cả. Đó là một phép tính song song khổng lồ diễn ra trong vài mili giây.
Quá trình đào tạo bao gồm việc nạp cho mô hình hàng nghìn tỷ từ từ sách, bài báo và code. Mục tiêu rất đơn giản: dự đoán token tiếp theo. Theo thời gian, mô hình trở nên rất giỏi việc này. Nó học được cấu trúc ngữ pháp, tông giọng của các phong cách viết khác nhau và các liên kết phổ biến giữa các ý tưởng. Tuy nhiên, về cốt lõi, đây vẫn là khớp mẫu ở quy mô công nghiệp. Nếu dữ liệu đào tạo chứa một định kiến hoặc lỗi cụ thể, mô hình có khả năng sẽ lặp lại nó vì lỗi đó có ý nghĩa thống kê trong tập dữ liệu của nó. Đây là lý do tại sao các mô hình có thể tự tin đưa ra những thông tin sai lệch. Chúng không nói dối vì nói dối đòi hỏi ý định. Chúng chỉ đơn giản là đi theo con đường khả dĩ nhất của các từ ngữ, ngay cả khi con đường đó dẫn đến ngõ cụt. Các nhà nghiên cứu tại những tổ chức như tạp chí Nature đã chỉ ra rằng việc thiếu một mô hình thế giới là rào cản chính đối với khả năng suy luận thực sự. Hệ thống biết các từ liên quan với nhau như thế nào, nhưng nó không biết các từ đó liên quan đến thế giới vật lý ra sao.
Động lực kinh tế và những thay đổi toàn cầu
Cuộc đua toàn cầu để xây dựng các hệ thống này được thúc đẩy bởi mong muốn giảm chi phí nhân công. Trong nhiều thập kỷ, chi phí tính toán đã giảm trong khi chi phí cho chuyên môn của con người lại tăng lên. Các công ty coi những mô hình này là cách để thu hẹp khoảng cách đó. Tại Hoa Kỳ, Châu Âu và Châu Á, trọng tâm là tự động hóa việc sản xuất nội dung, code và các tác vụ hành chính. Điều này gây ra những hậu quả tức thì cho thị trường lao động toàn cầu. Chúng ta đang chứng kiến sự thay đổi nơi giá trị của một người lao động không còn gắn liền với khả năng tạo ra văn bản cơ bản hoặc các đoạn script đơn giản. Thay vào đó, giá trị đang chuyển dịch sang khả năng xác minh và kiểm định những gì máy móc tạo ra. Đây là một thay đổi cơ bản trong nền kinh tế cổ cồn trắng.
Các chính phủ cũng đang phản ứng với tốc độ phát triển này. Có một sự căng thẳng giữa mong muốn thúc đẩy đổi mới và nhu cầu bảo vệ công dân khỏi những tác động tiêu cực của việc ra quyết định tự động. Luật sở hữu trí tuệ hiện đang trong tình trạng biến động. Nếu một mô hình được đào tạo trên các tác phẩm có bản quyền để tạo ra nội dung mới, ai là người sở hữu đầu ra đó? Đây không chỉ là những câu hỏi mang tính học thuật. Chúng đại diện cho hàng tỷ đô la trách nhiệm pháp lý và doanh thu tiềm năng. Tác động toàn cầu không chỉ nằm ở bản thân phần mềm, mà còn ở các cấu trúc pháp lý và xã hội mà chúng ta xây dựng xung quanh nó. Chúng ta đang thấy sự phân hóa trong cách các khu vực khác nhau xử lý những vấn đề này. Một số nơi đang tiến tới quy định nghiêm ngặt, trong khi những nơi khác lại áp dụng cách tiếp cận cởi mở hơn để thu hút đầu tư. Điều này tạo ra một môi trường phân mảnh, nơi các quy tắc thay đổi tùy thuộc vào nơi bạn đang ở.
Hệ quả thực tế trong cuộc sống hàng ngày
Hãy xem xét thói quen hàng ngày của Sarah, một quản lý dự án tại một công ty quy mô vừa. Cô bắt đầu ngày mới bằng việc sử dụng một trợ lý để tóm tắt ba mươi email chưa đọc. Công cụ này làm khá tốt việc rút ra các điểm chính, nhưng nó bỏ lỡ tông giọng thất vọng tinh tế trong một tin nhắn từ một khách hàng quan trọng. Sarah, tin tưởng vào bản tóm tắt, đã gửi một phản hồi ngắn gọn, tự động khiến khách hàng càng thêm khó chịu. Sau đó, cô sử dụng một mô hình để soạn thảo đề xuất dự án. Nó tạo ra năm trang văn bản nghe rất chuyên nghiệp chỉ trong vài giây. Cô dành một giờ để chỉnh sửa, sửa các lỗi nhỏ và thêm các chi tiết cụ thể mà máy móc không thể biết. Đến cuối ngày, cô làm việc hiệu quả hơn về mặt khối lượng, nhưng lại cảm thấy một cảm giác ngắt kết nối dai dẳng với công việc của mình. Cô không còn là người sáng tạo, cô là biên tập viên của những suy nghĩ tổng hợp.
Kịch bản này làm nổi bật những gì mọi người thường đánh giá quá cao và đánh giá thấp. Chúng ta đánh giá quá cao khả năng hiểu sắc thái, ý định và cảm xúc con người của máy móc. Chúng ta nghĩ rằng nó có thể thay thế một cuộc trò chuyện nhạy cảm hoặc một cuộc đàm phán phức tạp. Đồng thời, chúng ta đánh giá thấp việc tốc độ của các công cụ này thay đổi kỳ vọng của chúng ta như thế nào. Vì Sarah có thể tạo ra một đề xuất trong một giờ, sếp của cô hiện mong đợi ba đề xuất vào cuối tuần. Công nghệ không nhất thiết mang lại cho chúng ta nhiều thời gian rảnh hơn. Nó thường chỉ nâng cao mức cơ bản cho sản lượng kỳ vọng. Đây là cái bẫy ẩn giấu của sự hiệu quả. Nó tạo ra một chu kỳ mà chúng ta phải làm việc nhanh hơn để theo kịp các công cụ mà chúng ta đã tạo ra để giúp mình làm việc ít hơn.
BotNews.today sử dụng các công cụ AI để nghiên cứu, viết, chỉnh sửa và dịch nội dung. Đội ngũ của chúng tôi xem xét và giám sát quy trình để giữ cho thông tin hữu ích, rõ ràng và đáng tin cậy.
Những câu hỏi khó cho kỷ nguyên tổng hợp
Chúng ta phải áp dụng sự hoài nghi kiểu Socrates vào quỹ đạo hiện tại của công nghệ này. Nếu chúng ta đang tiến tới một thế giới nơi hầu hết nội dung kỹ thuật số đều là tổng hợp, thì giá trị của thông tin sẽ ra sao? Nếu mọi câu trả lời đều là mức trung bình thống kê, liệu tư duy gốc có trở thành một thứ xa xỉ? Chúng ta cũng cần xem xét các chi phí ẩn mà các công ty hiếm khi thảo luận. Năng lượng cần thiết để đào tạo và vận hành các mô hình này là rất lớn. Mỗi truy vấn tiêu tốn một lượng điện và nước đáng kể để làm mát. Liệu sự tiện lợi của một email tóm tắt có xứng đáng với dấu chân môi trường đó không? Đây là những sự đánh đổi mà chúng ta đang thực hiện mà không có sự bỏ phiếu công khai.
Quyền riêng tư là một lĩnh vực khác mà các câu hỏi quan trọng hơn câu trả lời. Hầu hết các mô hình được đào tạo trên dữ liệu chưa bao giờ được dự định cho mục đích này. Các bài blog cũ, bình luận công khai trên mạng xã hội và mã nguồn mở của bạn đều là một phần của cỗ máy bây giờ. Chúng ta đã thực sự chấm dứt kỷ nguyên quyền riêng tư kỹ thuật số bằng cách biến mọi mẩu dữ liệu thành tài liệu đào tạo. Liệu chúng ta có bao giờ thực sự thoát khỏi hệ thống này không? Ngay cả khi bạn không sử dụng các công cụ này, dữ liệu của bạn có khả năng đã nằm trong đó rồi. Chúng ta cũng đang đối mặt với vấn đề hộp đen. Ngay cả những kỹ sư xây dựng các hệ thống này cũng không phải lúc nào cũng giải thích được tại sao một mô hình lại đưa ra câu trả lời cụ thể. Chúng ta đang triển khai các công cụ mà chúng ta không hoàn toàn hiểu rõ trong các lĩnh vực quan trọng như y tế, luật pháp và tài chính. Liệu có trách nhiệm không khi sử dụng một hệ thống cho các quyết định rủi ro cao khi chúng ta không thể truy xuất logic của nó? Những câu hỏi này không có câu trả lời dễ dàng, nhưng chúng phải được đặt ra trước khi công nghệ trở nên quá sâu sắc để thay đổi.
Bạn có câu chuyện, công cụ, xu hướng hoặc câu hỏi về AI mà bạn nghĩ chúng tôi nên đề cập không? Gửi cho chúng tôi ý tưởng bài viết của bạn — chúng tôi rất muốn nghe từ bạn.
Rào cản kỹ thuật cho người dùng chuyên nghiệp
Đối với những người xây dựng trên nền tảng các hệ thống này, thực tế được định nghĩa bởi các rào cản thay vì khả năng. Người dùng chuyên nghiệp phải đối mặt với giới hạn API, cửa sổ ngữ cảnh (context window) và chi phí suy luận cao. Cửa sổ ngữ cảnh là lượng thông tin mà một mô hình có thể giữ trong bộ nhớ hoạt động tại một thời điểm. Mặc dù một số mô hình hiện tự hào có cửa sổ hơn một trăm nghìn token, hiệu suất thường giảm sút khi cửa sổ đầy. Đây được gọi là hiện tượng lạc lối ở giữa (lost in the middle), nơi mô hình quên thông tin được đặt ở giữa một prompt dài. Các nhà phát triển phải sử dụng các kỹ thuật như Retrieval-Augmented Generation để chỉ cung cấp cho mô hình dữ liệu liên quan nhất từ cơ sở dữ liệu cục bộ.
Lưu trữ và triển khai cục bộ đang trở nên phổ biến hơn đối với những người ưu tiên quyền riêng tư và chi phí. Chạy một mô hình như Llama 3 trên phần cứng cục bộ đòi hỏi VRAM đáng kể, nhưng nó loại bỏ sự phụ thuộc vào các API của bên thứ ba. Đây là thực tế của giới công nghệ mà hầu hết người dùng bình thường không bao giờ thấy. Quy trình làm việc bao gồm:
- Lượng tử hóa các mô hình để vừa với bộ nhớ GPU cấp tiêu dùng.
- Thiết lập các cơ sở dữ liệu vector như Pinecone hoặc Milvus cho bộ nhớ dài hạn.
- Tinh chỉnh trọng số trên các tập dữ liệu cụ thể để cải thiện độ chính xác trong một thị trường ngách.
- Quản lý giới hạn tốc độ và độ trễ trong môi trường sản xuất.
Việc tích hợp các công cụ này vào quy trình làm việc hiện có không chỉ là việc nhấn một nút. Nó đòi hỏi sự hiểu biết sâu sắc về cách cấu trúc dữ liệu để mô hình có thể xử lý hiệu quả. Các nền tảng như Hugging Face cung cấp cơ sở hạ tầng cho việc này, nhưng việc triển khai vẫn là một thách thức kỹ thuật phức tạp. Bạn về cơ bản đang cố gắng bao bọc một cái lồng có thể dự đoán được xung quanh một cỗ máy không thể dự đoán. Blog nghiên cứu của OpenAI thường xuyên thảo luận về những hạn chế này, lưu ý rằng việc mở rộng quy mô đơn thuần không phải là giải pháp cho mọi rào cản kỹ thuật. Phần công nghệ của ngành này tập trung vào việc làm cho các hệ thống nhỏ hơn, nhanh hơn và đáng tin cậy hơn, thay vì chỉ làm cho chúng lớn hơn.
Phán quyết cuối cùng
Trí tuệ mà chúng ta đang xây dựng là sự phản ánh của chính dữ liệu của chúng ta, *không phải* là một dạng sống mới. Nó là một công cụ mạnh mẽ để tổng hợp có thể giúp chúng ta xử lý thông tin ở quy mô trước đây không thể thực hiện được. Tuy nhiên, nó vẫn là một công cụ đòi hỏi sự giám sát của con người và tư duy phản biện. Chúng ta không nên bị lóa mắt bởi văn phong bóng bẩy hay những câu trả lời nhanh chóng. Các rủi ro thực tế liên quan đến công việc, quyền riêng tư và môi trường của chúng ta. Chúng ta phải giữ thái độ hoài nghi về sự cường điệu trong khi vẫn thừa nhận tính hữu ích của công nghệ. Mục tiêu nên là sử dụng các hệ thống này để nâng cao khả năng của chúng ta mà không từ bỏ khả năng phán đoán của mình cho máy móc. Chúng ta đang ở thời điểm mà những lựa chọn hôm nay sẽ định hình mối quan hệ của chúng ta với công nghệ trong nhiều thập kỷ tới. Tốt hơn là tiến về phía trước với những câu hỏi sắc bén thay vì niềm tin mù quáng vào một dự đoán thống kê.
Lưu ý của biên tập viên: Chúng tôi tạo trang web này như một trung tâm tin tức và hướng dẫn AI đa ngôn ngữ dành cho những người không phải là chuyên gia máy tính, nhưng vẫn muốn hiểu trí tuệ nhân tạo, sử dụng nó tự tin hơn và theo dõi tương lai đang đến gần.
Tìm thấy lỗi hoặc điều gì đó cần được sửa chữa? Hãy cho chúng tôi biết.