Chúng ta đã đến đây như thế nào: Lịch sử ngắn gọn về cơn sốt AI
Làn sóng trí tuệ nhân tạo (AI) hiện nay không bắt đầu từ một chatbot lan truyền vào cuối năm 2022. Nó bắt đầu với một bài báo nghiên cứu cụ thể được các kỹ sư Google công bố vào năm 2017 có tiêu đề “Attention Is All You Need”. Tài liệu này đã giới thiệu kiến trúc Transformer, thay đổi cách máy móc xử lý ngôn ngữ con người. Trước thời điểm này, máy tính gặp khó khăn trong việc duy trì ngữ cảnh của một câu dài. Chúng thường quên phần đầu của đoạn văn khi đọc đến cuối. Transformer đã khắc phục điều này bằng cách cho phép mô hình cân nhắc tầm quan trọng của các từ khác nhau cùng một lúc. Sự thay đổi kỹ thuật đơn lẻ này là lý do chính khiến các công cụ hiện đại mang lại cảm giác mạch lạc thay vì máy móc. Chúng ta hiện đang sống trong những hệ quả đã được mở rộng từ quyết định chuyển đổi khỏi xử lý tuần tự đó. Lịch sử này không chỉ nói về mã nguồn tốt hơn. Nó nói về một sự thay đổi cơ bản trong cách chúng ta tương tác với thông tin ở cấp độ toàn cầu. Việc chuyển từ tìm kiếm câu trả lời sang tạo ra chúng đã thay đổi những kỳ vọng cơ bản của mọi người dùng internet ngày nay.
Dự đoán thống kê thay vì logic
Để hiểu trạng thái hiện tại của công nghệ, người ta phải loại bỏ ý tưởng rằng các hệ thống này đang suy nghĩ. Chúng không hề suy nghĩ. Chúng là những cỗ máy thống kê khổng lồ dự đoán phần tiếp theo của một chuỗi. Khi bạn nhập một prompt, hệ thống sẽ xem xét dữ liệu huấn luyện của nó để xác định từ nào có khả năng xuất hiện sau đầu vào của bạn nhất. Đây là một sự khác biệt so với lập trình dựa trên logic trong quá khứ. Trong những thập kỷ trước, phần mềm tuân theo các quy tắc if-then nghiêm ngặt. Nếu người dùng nhấp vào một nút, phần mềm sẽ thực hiện một hành động cụ thể. Ngày nay, kết quả đầu ra mang tính xác suất. Điều này có nghĩa là cùng một đầu vào có thể dẫn đến các kết quả khác nhau tùy thuộc vào cài đặt của mô hình. Sự thay đổi này đã tạo ra một loại phần mềm mới linh hoạt nhưng cũng dễ mắc các lỗi mà một máy tính truyền thống không bao giờ mắc phải.
Quy mô của việc huấn luyện này là thứ khiến kết quả mang lại cảm giác như trí thông minh. Các công ty đã quét gần như toàn bộ internet công cộng để cung cấp dữ liệu cho các mô hình này. Điều này bao gồm sách, bài báo, kho lưu trữ mã nguồn và các bài đăng trên diễn đàn. Bằng cách phân tích hàng tỷ tham số, các mô hình học được cấu trúc tư duy của con người mà không bao giờ hiểu được ý nghĩa của các từ. Sự thiếu hiểu biết này là lý do tại sao một mô hình có thể viết một bản tóm tắt pháp lý hoàn hảo nhưng lại thất bại ở một bài toán đơn giản. Nó không tính toán. Nó đang bắt chước các mô hình của những người đã làm toán trước đó. Hiểu được sự khác biệt này là rất quan trọng đối với bất kỳ ai sử dụng các công cụ này trong công việc chuyên môn. Nó làm rõ lý do tại sao các hệ thống lại tự tin đến vậy ngay cả khi chúng hoàn toàn sai.
BotNews.today sử dụng các công cụ AI để nghiên cứu, viết, chỉnh sửa và dịch nội dung. Đội ngũ của chúng tôi xem xét và giám sát quy trình để giữ cho thông tin hữu ích, rõ ràng và đáng tin cậy.
Cuộc chạy đua vũ trang toàn cầu về silicon
Tác động của sự thay đổi công nghệ này vượt xa phần mềm. Nó đã kích hoạt một cuộc tranh giành phần cứng địa chính trị quy mô lớn. Cụ thể, thế giới hiện đang phụ thuộc vào các đơn vị xử lý đồ họa (GPU) cao cấp. Những con chip này ban đầu được thiết kế cho trò chơi điện tử, nhưng khả năng thực hiện nhiều phép tính nhỏ cùng lúc khiến chúng trở nên hoàn hảo cho AI. Một công ty duy nhất, NVIDIA, hiện giữ vai trò trung tâm trong nền kinh tế toàn cầu vì họ sản xuất các con chip cần thiết để huấn luyện các mô hình này. Các quốc gia hiện đang coi những con chip này như dầu mỏ hoặc vàng. Chúng là những tài sản chiến lược quyết định quốc gia nào sẽ dẫn đầu trong thập kỷ tăng trưởng kinh tế tiếp theo.
Sự phụ thuộc này đã tạo ra sự phân hóa giữa những người có đủ khả năng chi trả cho sức mạnh tính toán khổng lồ và những người không thể. Việc huấn luyện một mô hình hàng đầu hiện nay tiêu tốn hàng trăm triệu đô la tiền điện và phần cứng. Rào cản gia nhập cao này có nghĩa là một vài tập đoàn lớn ở Hoa Kỳ và Trung Quốc nắm giữ phần lớn quyền lực. Sự tập trung ảnh hưởng này là mối quan tâm lớn đối với các nhà quản lý trên khắp thế giới. Nó ảnh hưởng đến mọi thứ, từ cách lưu trữ dữ liệu đến số tiền mà một startup phải trả để truy cập các công cụ cơ bản. Trọng tâm kinh tế của ngành đã chuyển sang các chủ sở hữu trung tâm dữ liệu. Đây là một sự thay đổi đáng kể so với kỷ nguyên internet sơ khai, nơi một nhóm nhỏ có thể xây dựng một sản phẩm đẳng cấp thế giới với ngân sách eo hẹp. Trong 2026, chi phí gia nhập cao hơn bao giờ hết.
Khi điều trừu tượng trở thành công việc buổi chiều
Đối với hầu hết mọi người, lịch sử của công nghệ này ít quan trọng hơn tiện ích hàng ngày của nó. Hãy xem xét một quản lý tiếp thị tên là Sarah. Vài năm trước, ngày làm việc của cô bao gồm hàng giờ nghiên cứu và soạn thảo thủ công. Cô sẽ tìm kiếm các xu hướng, đọc hàng chục bài báo, sau đó tổng hợp chúng thành một báo cáo. Ngày nay, quy trình làm việc của cô đã khác. Cô sử dụng một mô hình để tóm tắt các xu hướng hàng đầu và soạn thảo một dàn ý ban đầu. Cô không còn là người viết nữa. Cô là biên tập viên của nội dung do máy tạo ra. Sự thay đổi này đang diễn ra trên mọi ngành nghề liên quan đến bàn phím. Nó không chỉ nói về tốc độ. Nó nói về việc loại bỏ trang giấy trắng. Máy móc cung cấp bản nháp đầu tiên, và con người cung cấp định hướng.
Sự thay đổi này có những tác động thực tế đối với an ninh việc làm và phát triển kỹ năng. Nếu một nhà phân tích cấp dưới hiện có thể làm công việc của ba người bằng cách sử dụng các công cụ này, điều gì sẽ xảy ra với thị trường việc làm cấp độ đầu vào? Chúng ta đang thấy sự chuyển dịch sang mô hình “siêu người dùng”, nơi một người quản lý nhiều AI agent để hoàn thành các tác vụ phức tạp. Điều này có thể thấy rõ trong kỹ thuật phần mềm, nơi các công cụ như GitHub Copilot gợi ý toàn bộ các khối mã. Nhà phát triển dành ít thời gian gõ phím hơn và nhiều thời gian hơn để kiểm tra. Thực tế mới này đòi hỏi một bộ kỹ năng khác. Bạn không còn cần phải nhớ mọi quy tắc cú pháp. Bạn cần biết cách đặt câu hỏi đúng và cách phát hiện một lỗi tinh vi trong một biển văn bản trông có vẻ hoàn hảo. Một ngày làm việc của một chuyên gia trong 2026 hiện là một chu kỳ liên tục của việc đặt câu hỏi (prompting) và xác minh. Dưới đây là một số ví dụ thực tế:
- Các nhà phát triển phần mềm sử dụng các mô hình để viết các bài kiểm tra đơn vị (unit tests) lặp đi lặp lại và mã boilerplate.
- Các trợ lý pháp lý sử dụng chúng để quét hàng nghìn trang tài liệu nhằm tìm kiếm các từ khóa cụ thể.
- Các nhà nghiên cứu y học sử dụng chúng để dự đoán cách các cấu trúc protein khác nhau có thể tương tác.
- Các nhóm dịch vụ khách hàng sử dụng chúng để xử lý các yêu cầu thông thường mà không cần sự can thiệp của con người.