Trợ lý ảo tiếng Việt giải bài toán chủ quyền trên không gian số
Cuộc sống số - Ngày đăng : 10:41, 18/01/2024
Bộ TT&TT mới đây vừa phê duyệt việc nghiên cứu, thử nghiệm phát triển mô hình ngôn ngữ lớn tiếng Việt và trợ lý ảo cho cán bộ, công chức.
Nền tảng trợ lý ảo này cần đáp ứng các yêu cầu cơ bản như có thể sử dụng trên website và mobile, hỗ trợ giao diện điều khiển bằng giọng nói tiếng Việt, tích hợp dễ dàng vào website, Zalo OA… các kênh ứng dụng OTT phổ biến khác tại Việt Nam và có thể cá nhân hóa dữ liệu.
Đối với bộ công cụ huấn luyện trợ lý ảo, yêu cầu đặt ra là phải đáp ứng việc nhập dữ liệu văn bản để huấn luyện. Công cụ này phải bóc được nội dung tiếng Việt từ file hình ảnh, có thể bóc băng nội dung tiếng Việt từ file ghi âm cuộc họp, file video báo chí, truyền thông...
Đây là bước đi mang tính định hướng của Bộ TT&TT để thúc đẩy các doanh nghiệp công nghệ Việt Nam tham gia vào việc nghiên cứu, phát triển thử nghiệm trợ lý ảo và mô hình ngôn ngữ lớn tiếng Việt.
Sản phẩm công nghệ số của riêng mình
Trao đổi với VietNamNet, ông Nguyễn Chí Thanh - Phó Tổng giám đốc Tổng công ty Giải pháp Viettel (Viettel Solutions) cho hay, sự phát triển của trợ lý ảo đã trở thành một xu thế công nghệ không thể đảo ngược.
“Ngay từ khi mới ra đời, ChatGPT đã tạo ra một xu hướng sử dụng trợ lý ảo, nhanh hơn cả sự phổ biến của Facebook và các ứng dụng số khác. Hiệu ứng và sự phát triển nhanh chóng đó cho thấy nhu cầu cần thiết về việc sử dụng trợ lý ảo của xã hội. Trong bối cảnh đó, việc phát triển các trợ lý ảo Việt Nam đương nhiên rất cần thiết”, ông Thanh nói.
Theo Phó Tổng giám đốc Viettel Solutions, ChatGPT hiện đã len lỏi vào mọi ngóc ngách của đời sống. Nếu không tự phát triển và làm chủ được nền tảng trợ lý ảo quốc gia, dữ liệu của người Việt sẽ nằm trong tay người nước ngoài.
“Thông qua trợ lý ảo, các công ty nước ngoài sẽ biết hết được suy nghĩ, thói quen, sở thích của người Việt. Đây là một nguy cơ cần phải giải quyết”, ông Thanh đặt vấn đề.
Đóng góp thêm góc nhìn, ông Đoàn Hữu Hậu - Giám đốc Tư vấn chuyển đổi số FPT Digital cho rằng, nhắc đến trợ lý ảo tiếng Việt, không thể không nhắc tới Make in Viet Nam - slogan được Bộ TT&TT tạo ra với mục đích thúc đẩy ngành công nghiệp ICT trong nước.
Sự ra đời của các trợ lý ảo Make in Viet Nam sẽ thúc đẩy sự tự hào, tự tôn dân tộc, khẳng định Việt Nam dù đã bỏ lỡ các cuộc cách mạng công nghiệp trước, nhưng ở giai đoạn này, với sự trưởng thành về kiến thức, kỹ năng, người Việt đã sẵn sàng để xây dựng một sản phẩm công nghệ số của riêng mình.
Làm sao để biến “giấc mơ” trợ lý ảo tiếng Việt thành sự thực?
Đang có hàng tỷ USD nguồn lực đầu tư trên thế giới được đổ dồn về các công ty nghiên cứu, phát triển công nghệ AI. Sau sự nổi lên của ChatGPT, Microsoft đã bỏ ra 10 tỷ USD để mua lại 49% cổ phần của OpenAI - công ty xây dựng nên trợ lý ảo số 1 thế giới. Không chịu thua kém, Google cũng đã đổ tiền tấn vào việc phát triển Bard AI với tham vọng cạnh tranh vị trí số 1 về trợ lý ảo.
Trên thực tế, các trợ lý ảo như ChatGPT hay Bard AI sẽ tiêu tốn của doanh nghiệp phát triển hàng tỷ USD chi phí trước khi các công ty này có thể kiếm lời. “Cha đẻ” Sam Altman của ChatGPT từng cho biết, các chatbot có khả năng soạn thảo văn bản và trả lời các câu hỏi của người dùng sẽ tiêu tốn vài xu chi phí tính toán cho mỗi cuộc trò chuyện.
Chi phí tìm kiếm bằng AI thường đắt hơn hẳn các truy vấn thông thường do phải đầu tư cho hạ tầng sức mạnh tính toán. Theo ước tính của Morgan Stanley, với 3,3 tỷ truy vấn Google nhận được trong năm 2022, "gã khổng lồ" tìm kiếm sẽ tiêu tốn thêm 6 tỷ USD chi phí tính toán nếu một nửa số truy vấn đó được trả lời bằng công cụ trợ lý ảo.
Khi các Big Tech đã bỏ ra rất nhiều nguồn lực, thời gian để phát triển AI, việc cạnh tranh với những "gã khổng lồ" công nghệ này không phải chuyện dễ dàng. Vậy đâu là con đường đi đúng đắn để các trợ lý ảo Make in Viet Nam phát triển?
Trước câu hỏi của VietNamNet, Phó Tổng giám đốc Viettel Solutions - ông Nguyễn Chí Thanh cho rằng, việc phát triển trợ lý ảo tiếng Việt hoàn toàn khả thi và không hề muộn. Theo ông Thanh, người Việt có thể tận dụng các nghiên cứu của thế giới thay vì tự làm lại nền tảng từ đầu. Việc của các công ty công nghệ là cần đưa tri thức Việt vào nền tảng.
Để làm trợ lý ảo, điều quan trọng nhất là dữ liệu. Lấy dẫn chứng, ông Thanh nêu ví dụ về việc Viettel có thể tự đào tạo ra một trợ lý ảo về viễn thông rất tốt, nhưng khó có thể tạo ra trợ lý ảo ngân hàng vì không có tri thức về lĩnh vực này.
“Nếu mỗi doanh nghiệp đứng riêng một góc để làm sẽ rất khó. Ví thế, nên có một liên minh cùng làm, bởi mỗi doanh nghiệp đều có những tri thức riêng. Nếu tất cả các tri thức đó cùng được tập hợp lại thành một kho dữ liệu thì chúng ta sẽ tạo ra một trợ lý ảo đa dạng”, Phó Tổng giám đốc Viettel Solutions đưa ra đề xuất.
Theo ông Nguyễn Đức Kiên - Phó Tổng giám đốc Công ty CNTT VNPT, những trợ lý ảo như ChatGPT được phát triển dựa trên các dữ liệu công khai. Do đó, khi phục vụ những nhu cầu đặc thù của doanh nghiệp và chính quyền, ChatGPT sẽ không thể tiếp cận kho dữ liệu chuyên ngành để đưa ra câu trả lời chính xác.
“Các doanh nghiệp có ý định phát triển trợ lý ảo nên tập trung vào những gì thị trường cần. ChatGPT đã làm quá tốt trong việc phát triển một trợ lý ảo đại trà, kể cả cho việc tìm kiếm và giải các bài toán bằng tiếng Việt. Do vậy, trợ lý ảo Việt Nam nên tập trung vào phần dư địa còn lại của thị trường. Đó là các mảng dữ liệu đặc thù riêng của doanh nghiệp, chính quyền, Chính phủ”, ông Kiên nói.
Ở góc nhìn của mình, Giám đốc Tư vấn chuyển đổi số FPT Digital Đoàn Hữu Hậu cho rằng, người Việt hiểu sâu hơn về văn hóa Việt, do vậy, hệ thống ngôn ngữ lớn tiếng Việt sẽ cho ra câu trả lời thỏa đáng nhất, đúng ngữ nghĩa, đúng bối cảnh nhất. Đó là một lợi thế của các trợ lý ảo Việt Nam.
Khảo sát, đánh giá của FPT cho thấy, các doanh nghiệp công nghệ Việt Nam đâu đó đều đã phát triển các sản phẩm trợ lý ảo của riêng mình. Theo ông Hậu, thay vì việc phát minh lại từng cái bánh xe, con ốc, các trợ lý ảo Make in Viet Nam cần tận dụng ưu thế của các nền tảng mở đã có sẵn và đóng góp thêm vào đó dữ liệu của người Việt để tạo ra một bộ công cụ hiệu quả.