Việt Nam đang làm tốt việc bản địa hóa các mô hình ngôn ngữ lớn
Cuộc sống số - Ngày đăng : 06:58, 06/06/2024
Trí tuệ nhân tạo tạo sinh hay Generative AI (AI tạo sinh) đang là tâm điểm của giới công nghệ toàn cầu. Đây là loại AI có khả năng sinh ra các nội dung như văn bản, hình ảnh, âm thanh và video, thông qua việc dự đoán dựa trên lượng dữ liệu khổng lồ đã được đào tạo.
Mô hình ngôn ngữ lớn là công nghệ cơ bản giúp AI tạo sinh nắm bắt ngôn ngữ tự nhiên và tạo ra sản phẩm mới từ dữ liệu. Các mô hình này là cơ sở để hình thành những trợ lý ảo như ChatGPT của OpenAI và Cortana của Microsoft. Tuy nhiên, hầu hết các mô hình ngôn ngữ lớn phổ biến trên thế giới đều chưa hỗ trợ tiếng Việt.
Các mô hình ngôn ngữ lớn nước ngoài chỉ trả lời câu hỏi bằng tiếng Anh, rồi dịch ra tiếng Việt. Điều này khiến chất lượng câu trả lời không hoàn hảo do phải xử lý qua một ngôn ngữ trung gian.
Sự xuất hiện của các mô hình ngôn ngữ lớn tiếng Việt có thể cải thiện khả năng dịch máy, nhận dạng giọng nói, tóm tắt văn bản. Do vậy, dù gặp nhiều thách thức, một số doanh nghiệp trong nước đã và đang phát triển các mô hình ngôn ngữ lớn tiếng Việt để đón đầu làn sóng công nghệ mới và phục vụ người dùng Việt Nam.
Trong một chia sẻ mới đây với VietNamNet, ông Robert Hallock, Phó Chủ tịch kiêm Tổng Giám đốc khối AI và Tiếp thị Kỹ thuật của Intel cho hay, để thúc đẩy chuyển đổi số, các quốc gia có thể tự mình phát triển các mô hình ngôn ngữ lớn của riêng mình, với Việt Nam là mô hình ngôn ngữ lớn Tiếng Việt.
Theo Phó Chủ tịch Intel, trong quá trình làm việc với một vài mô hình AI đa ngôn ngữ, Việt Nam và Trung Quốc được đánh giá là 2 quốc gia đang bản địa hóa tốt các mô hình ngôn ngữ lớn bằng việc đưa vào đó yếu tố ngôn ngữ địa phương.
"Các mô hình ngôn ngữ lớn hiện khá phổ biến và các bạn có thể sử dụng bất cứ ngôn ngữ nào. Những mô hình ngôn ngữ lớn tiếng Việt có thể chạy trên các sản phẩm phần cứng của Intel trong tương lai", ông Robert Hallock nói.
Khi được đặt câu hỏi về việc làm cách nào để triển khai các ứng dụng AI hiệu quả trong khu vực công, ông Robert Hallock cho rằng, các mô hình ngôn ngữ lớn cần được huấn luyện trong một khoảng thời gian dài, với lượng dữ liệu nhất định.
Hành lang pháp lý của các chính phủ là môi trường tuyệt hảo cho trí tuệ nhân tạo. Một văn bản luật có thể có độ dài lên tới hàng trăm trang, khó ai có thể nắm bắt được hết mọi thông tin, quy định trong đó. Đây là lúc cần tới một mô hình ngôn ngữ lớn với trợ lý ảo hỏi đáp về các nội dung cụ thể.
"Trong khi chúng ta nói rất nhiều về các kịch bản sử dụng AI của người dù phổ thông, việc sử dụng trí tuệ nhân tạo cho mục đích thương mại và khối Chính phủ sẽ đến sớm hơn. Kịch bản sử dụng này thậm chí có lẽ còn hữu ích hơn nhiều bởi con người rất khó xử lý được nhiều thông tin như vậy", Phó Chủ tịch Intel chia sẻ.
Trên thực tế, các doanh nghiệp trong nước đang phát triển một số trợ lý ảo phục vụ người Việt Nam. Trong đó, Bộ TT&TT hiện đang chỉ đạo các doanh nghiệp xây dựng 3 trợ lý ảo hỗ trợ cán bộ công chức, phát hiện mâu thuẫn văn bản và hỗ trợ giải đáp pháp luật cho người dân. Nhiều cơ quan, đơn vị trong Bộ TT&TT cũng đang trong quá trình xây dựng trợ lý ảo nhằm nâng cao hiệu suất và tăng hiệu quả công việc.
Khảo sát của Finastra cho thấy, Việt Nam hiện dẫn đầu trong các thị trường về mối quan tâm tới AI tạo sinh. Theo kết quả khảo sát, 91% người Việt thể hiện sự hưởng ứng với những giá trị tích cực mà AI tạo sinh mang lại.