AI tìm kiếm có thể là thảm họa

Microsoft và Google đang tạo ra niềm tin rằng chatbot sẽ tạo ra cuộc cách mạng với những công cụ tìm kiếm. Tuy nhiên, đó rất có thể chỉ là sự cường điệu quá mức.

Từ chỗ bị hoài nghi về tính phổ cập cho người dùng cơ bản, trí tuệ nhân tạo (AI) thế hệ mới đã trở thành niềm đam mê đối với hàng triệu người dùng cách đây hai tháng khi startup OpenAI phát hành một chatbot có tên ChatGPT.

Thay vì đưa ra phản hồi về danh sách hàng chục trang các kết quả tìm kiếm, ChatGPT trả lời các truy vấn theo phong cách hội thoại, giúp người dùng dễ dàng kéo dài cuộc trò chuyện với hàng loạt câu hỏi liên quan tiếp theo.

ChatGPT trả lời các truy vấn theo phong cách hội thoại, giúp người dùng dễ dàng kéo dài cuộc trò chuyện với hàng loạt câu hỏi liên quan tiếp theo. Ảnh: The Atlantic.

Những ông lớn tìm kiếm như Microsoft và Google đều thông báo rằng họ sẽ tích hợp chatbot AI như ChatGPT vào công cụ tìm kiếm của mình, với tham vọng thay đổi cách người dùng truy vấn thông tin. Tuy nhiên, có một vấn đề lớn rằng những mô hình ngôn ngữ này có thể đang bị thổi phồng quá mức.

Những lỗ hổng hiện hữu

Chỉ vài giây sau khi Microsoft giới thiệu AI tìm kiếm mới tích hợp trên Bing, dựa trên nền tảng công nghệ của ChatGPT, nhiều người dùng bắt đầu nhận thấy chatbot AI đưa ra các câu trả lời không chính xác hoặc vô nghĩa, hoặc các thuyết âm mưu.

Tương tự, ngay trong video quảng cáo, AI tìm kiếm của Google có tên là Bard đã đưa thông tin sai về Kính viễn vọng không gian James Webb khi được hỏi. Google chịu thiệt hại 100 tỷ USD vì giá cổ phiếu giảm ngay sau khi lỗi này bị phát hiện.

Trong vài tháng qua, nhiều người đã tin rằng cuối cùng thì trí tuệ nhân tạo cũng được công nhận đúng với khả năng của nó.

Chatbot AI thường xuyên đưa thông tin sai lệch. Ảnh: New York Times.

Tuy nhiên, những giới hạn cơ bản đối với công nghệ này cho thấy AI thực sự chỉ nằm ở đâu đó giữa cuộc khủng hoảng như Google Glass và bản cập nhật iPhone.

Trong trường hợp tệ nhất, AI có lẽ chỉ là sản phẩm khoa học viễn tưởng bị cường điệu quá mức. Còn trong trường hợp tốt nhất, trí tuệ nhân tạo chỉ là một cải tiến gia tăng không hơn không kém, kèm theo một loạt các lỗi.

Rắc rối nảy sinh khi người dùng đang kỳ vọng vào chatbot AI không chỉ là công cụ tìm kiếm mà còn có khả năng tư duy như bộ não con người.

Ví dụ tiêu biểu nhất là các công ty có xu hướng đặt niềm tin vào các công cụ tương tự như ChatGPT để phân tích tài chính, lên kế hoạch đi lại và ăn uống hoặc thậm chí sẵn sàng cung cấp thông tin cơ bản cho nó.

Thay vì buộc người dùng phải đọc các trang web khác, Microsoft và Google đề xuất một tương lai nơi các công cụ tìm kiếm sử dụng chatbot AI để tổng hợp thông tin và đóng gói thành những đoạn văn xuôi cơ bản, giống như lời tiên tri bằng máy móc.

Microsoft và Google đề xuất một tương lai nơi các công cụ tìm kiếm sử dụng chatbot AI để tổng hợp thông tin và đóng gói thành những đoạn văn xuôi cơ bản. Ảnh: Phương Lâm.

Tuy nhiên, tầm nhìn đó có thể là một mục tiêu xa vời, với con đường đến đó nhiều quanh co và mây mù. Thứ được gọi là “các mô hình ngôn ngữ lớn” như ChatGPT, rất giỏi trong việc tạo ra các câu đơn giản, nhưng lại khá tệ ở mọi thứ khác .

AI tìm kiếm vẫn còn rất nhiều thứ phải cải thiện

Tên đầy đủ của ChatGPT là Chat Generative Pre-trained Transformer. “Về cơ bản nhiệm vụ của các mô hình ngôn ngữ như ChatGPT là đoán từ tiếp theo dựa trên các từ đằng trước. Khi người dùng đưa vào một câu hỏi, nó dựa vào câu đó để phát sinh thành văn bản, và lại dựa vào văn bản nó đã phát sinh để phát sinh tiếp”, TS Nguyễn Xuân Hoài, nhà nghiên cứu học máy AI Academy, chia sẻ với Zing.

Các mô hình này hoạt động bằng cách xác định và lặp lại các mẫu trong ngôn ngữ, giống như một công cụ tự động sửa lỗi siêu mạnh.

Trước tiên, ChatGPT sẽ phân tích một lượng lớn văn bản từ sách, Wikipedia, báo chí, bài đăng trên mạng xã hội.

Từ việc sử dụng những dữ liệu đó, các công cụ AI như ChatGPT sẽ dự đoán những từ và cụm từ nào có nhiều khả năng đi cùng nhau nhất.

Các mô hình ngôn ngữ lớn như ChatGPT không sử dụng toàn bộ văn bản đằng trước làm ngữ cảnh, mà dùng một kỹ thuật để chọn ra một vài từ quan trọng nhất định và dự đoán dựa trên những từ đó. Ảnh: Unsplash

Thực tế các chương trình chỉ mô hình hóa ngôn ngữ hiện có, có nghĩa là chúng không thể đưa ra ý tưởng mới nào cả.

Ngoài ra, sự phụ thuộc vào các quy tắc thống kê đồng nghĩa rằng chatbot AI chỉ có xu hướng tạo ra các phiên bản rẻ tiền, xuống cấp hơn từ thông tin gốc, như một bản sao không hoàn chỉnh.

Ngay cả khi ChatGPT hay những phần mềm tiền nhiệm sau này có học được cách dự đoán từ một cách hoàn hảo, nó vẫn thiếu những kỹ năng cơ bản khác.

Chẳng hạn như AI không hiểu thế giới vật chất hoặc cách sử dụng logic. Việc tính toán của nó cũng rất tệ và hầu như không thể tự tìm kiếm trên Internet và còn thiếu đi khả năng kiểm tra tính xác thực của thông tin. Thậm chí ChatGPT còn từng trả lời rằng có 6 chữ cái trong tên của nó.

Ngoài ra, ChatGPT được biết đến với số liệu thống kê gợi ý từ các nguồn bịa đặt. “Khi tôi hỏi ChatGPT về tài liệu tham khảo, chatbot viết ra tên nghiên cứu, xuất bản ở tạp chí nào, số nào, trang nào, nhưng thực tế đó là nghiên cứu do nó bịa ra. Chatbot thậm chí còn tóm tắt nội dung của nghiên cứu ‘tưởng tượng’ đó”, TS Nguyễn Việt Cường, nhà nghiên cứu kinh tế, chia sẻ trên trang cá nhân.

Nói cách khác, những người sáng tạo thừa biết rằng Bing thế hệ mới hay chatbot Bard vẫn chưa sẵn sàng để được áp dụng rộng rãi, mặc cho những lời tâng bốc về nó được cường điệu hóa.

Để khắc phục tình trạng đưa thông tin sai, với chatbot tích hợp trên Bing, bên dưới câu trả lời là các đường dẫn liên quan.

Tuy nhiên phản ánh từ người dùng cho thấy đường dẫn không phải lúc nào cũng liên quan đến thông tin trong câu trả lời. Hóa ra, “cuộc cách mạng” này không khác biệt nhiều so với việc nhập thông tin và truy vấn trên Wikipedia.

AI Bard của Google đưa ra kết quả sai lệch, khiến cổ phiếu của hãng giảm giá mạnh. Ảnh: Google.

Nếu thông tin sai lệch và ngôn ngữ là chưa đủ, hãy nhớ rằng việc đào tạo một mô hình AI cần một lượng dữ liệu và thời gian huấn luyện khổng lồ.

ChatGPT có nền tảng từ mô hình ngôn ngữ đời cũ GPT-3,5 - một chatbot nâng cấp nhẹ từ mô hình GPT-3 ra mắt năm 2020. Do đó, chatbot này hoàn toàn không có kiến thức về bất kỳ thứ gì sau năm 2021. Việc cập nhật bất kỳ mô hình nào với tin tức mỗi phút sẽ là không thực tế, nếu không muốn nói là không thể.

Để cung cấp thêm những thông tin nóng, chẳng hạn như các sự kiện thể thao sắp tới, Bing thế hệ mới được cho là chạy truy vấn của người dùng thông qua công cụ tìm kiếm Bing truyền thống.

Từ các kết quả đó, kết hợp với AI, sẽ tạo nên câu trả lời cho người dùng. Bản chất thật sự bên dưới vẻ ngoài lấp lánh của chatbot này vẫn là một công cụ tìm kiếm lỗi thời như Bing.

Chưa đầy một thập kỷ trước, thế giới đã phải vỡ mộng rằng Facebook không phải là một mạng xã hội thú vị như nó từng được kỳ vọng.

Chatbot AI cũng sẽ là một trường hợp tương tự nếu Google hay Microsoft không thể khắc phục được những điểm yếu cố hữu trong hệ thống.