Bộ TT&TT thúc đẩy phát triển nền tảng công nghệ mô hình ngôn ngữ lớn tiếng Việt

Xe - Công nghệ - Ngày đăng : 18:42, 14/08/2023

Bộ TT&TT đặt mục tiêu đến năm 2025 Việt Nam có ít nhất 1 nền tảng công nghệ mô hình ngôn ngữ lớn tiếng Việt, có khả năng cung cấp dịch vụ cho các nền tảng ứng dụng trí tuệ nhân tạo khác.

Trợ lý ảo giúp giảm gánh nặng, giảm rủi ro pháp lý cho cán bộ, công chức

Chương trình chuyển đổi số quốc gia được Thủ tướng Chính phủ phê duyệt tháng 6/2020 đã xác định một nhiệm vụ, giải pháp tạo nền móng chuyển đổi số là lựa chọn ưu tiên nghiên cứu một số công nghệ cốt lõi mà Việt Nam có thể đi tắt đón đầu cũng như có khả năng tạo bứt phá mạnh mẽ như trí tuệ nhân tạo (AI), chuỗi khối (blockchain) và thực tế ảo/thực tế tăng cường (VR/AR); xây dựng hệ thống điện toán có năng lực đủ mạnh để xử lý, phân tích dữ liệu, huy động được sự tham gia của cộng đồng, cho phép các tổ chức, doanh nghiệp cùng khai thác phục vụ phát triển hệ sinh thái sản phẩm sáng tạo ứng dụng AI.

Các chiến lược quốc gia về phát triển Chính phủ điện tử hướng tới Chính phủ số, phát triển kinh tế số và xã hội số đã tiếp tục xác định nhiệm vụ, giải pháp trọng tâm là xây dựng nền tảng trợ lý ảo để phục vụ cán bộ, công chức, viên chức và người dân.

Một nhiệm vụ, giải pháp trọng tâm trong phát triển chính phủ số, kinh tế số và xã hội số là xây dựng nền tảng trợ lý ảo để phục vụ cán bộ, công chức, viên chức và người dân. (Ảnh minh họa: Internet)

Nhấn mạnh tầm quan trọng của việc phát triển trợ lý ảo cho công chức viên chức nhà nước, trong chỉ đạo tại hội nghị sơ kết 6 tháng đầu năm 2023 và triển khai nhiệm vụ 6 tháng cuối năm 2023 ngày 30/6, Bộ trưởng Bộ TT&TT Nguyễn Mạnh Hùng chỉ rõ: Một trong những ứng dụng hiệu quả nhất mà AI mang lại, nhất là khi xuất hiện “Generative AI” dựa trên mô hình ngôn ngữ lớn, là trợ lý ảo.

Trợ lý ảo là đặc biệt hữu dụng với các loại lao động dựa trên quy định, như các công chức nhà nước chỉ được phép làm những gì mà pháp luật quy định. Với cả một “rừng” các quy định thì trợ lý ảo sẽ giảm tải, giảm gánh nặng, giảm rủi ro pháp lý, tăng chất lượng, tăng năng suất lao động cho các công viên chức nhà nước.

“Trợ lý ảo đã được phát triển từ rất lâu, nhưng chỉ khi xuất hiện mô hình ngôn ngữ lớn thì mới có sự phát triển mang tính đột phá. Trợ lý ảo cho hệ thống công viên chức nhà nước là một bước tiến lớn của Chính phủ số. Việc xây dựng trợ lý ảo công viên chức nhà nước sẽ đi cùng với phát triển mô hình ngôn ngữ lớn tiếng Việt. Mô hình ngôn ngữ lớn tiếng Việt cũng sẽ là nền tảng để các doanh nghiệp khác phát triển các loại trợ lý ảo tiếng Việt, thí dụ trợ lý ảo hỗ trợ pháp lý cho mọi người dân”, Bộ trưởng Nguyễn Mạnh Hùng nhấn mạnh.

Bộ TT&TT lên kế hoạch phát triển nền tảng mô hình ngôn ngữ lớn tiếng Việt

Để triển khai một cách thực chất, hiệu quả việc phát triển nền tảng công nghệ mô hình ngôn ngữ lớn tiếng Việt, Bộ TT&TT mới đây đã ban hành kế hoạch thúc đẩy, với mục tiêu đặt ra là đến năm 2025, Việt Nam có ít nhất 1 nền tảng công nghệ mô hình ngôn ngữ lớn tiếng Việt, có khả năng cung cấp dịch vụ cho các nền tảng ứng dụng trí tuệ nhân tạo khác; 100% cơ quan nhà nước có trợ lý ảo giúp cán bộ, công chức phục vụ hoạt động của mình.

Bộ TT&TT đặt mục tiêu đến năm 2025, 100% cơ quan nhà nước có trợ lý ảo giúp cán bộ, công chức phục vụ hoạt động của mình. (Ảnh minh họa: Minh Quyết)

Kế hoạch của Bộ TT&TT cũng nêu rõ: Việc nghiên cứu, phát triển, đưa vào ứng dụng mô hình ngôn ngữ lớn tiếng Việt là một nhiệm vụ quan trọng, cần thiết và ý nghĩa. Mô hình ngôn ngữ lớn tiếng Việt sử dụng tri thức, dữ liệu huấn luyện đã được sàng lọc của Việt Nam, với chi phí thấp cho người dân, doanh nghiệp, tổ chức tại Việt Nam sử dụng để phát triển các ứng dụng mới.

Việc phát triển mô hình ngôn ngữ lớn tiếng Việt phải giải quyết hai thách thức chủ yếu, đó là: Thu thập, xử lý các nguồn dữ liệu tiếng Việt ở dạng thô để hình thành nên bộ dữ liệu đầy đủ tiếng Việt và bộ dữ liệu chỉ dẫn tiếng Việt; Thiết lập một hạ tầng tính toán cho phép thực hiện huấn luyện mô hình ngôn ngữ lớn.

Tại kế hoạch ban hành cuối tháng 7/2023, Bộ TT&TT cũng đã đưa ra 4 nhóm nhiệm vụ chính để thúc đẩy phát triển nền tảng công nghệ mô hình ngôn ngữ lớn tiếng Việt cùng tiến độ, thời gian gần hoàn thành, bao gồm: Xây dựng thể chế; Xây dựng bộ dữ liệu lớn tiếng Việt để phát triển mô hình ngôn ngữ lớn của Việt Nam; Nghiên cứu, thử nghiệm và phát triển mô hình ngôn ngữ lớn tiếng Việt; Xây dựng nền tảng trợ lý ảo cho cán bộ, công chức.

Bộ TT&TT giao Cục Chuyển đổi số quốc gia chủ trì, phối hợp với các đơn vị có liên quan triển khai cụ thể từng nội dung của kế hoạch. Các đơn vị thuộc, trực thuộc Bộ TT&TT có trách nhiệm phối hợp thực hiện kế hoạch, xây dựng dữ liệu, triển khai sử dụng, đánh giá, nhận xét hoàn thiện sản phẩm.

Ngay trước đó, trung tuần tháng 7/2023, Bộ TT&TT đã phê duyệt việc lựa chọn tập đoàn Viettel là đơn vị nghiên cứu, thử nghiệm phát triển mô hình ngôn ngữ lớn tiếng Việt và trợ lý ảo cho cán bộ, công chức tại Bộ TT&TT.

Với thời gian nghiên cứu, thử nghiệm là trong năm 2023, mục tiêu Bộ TT&TT đặt ra cho đơn vị được lựa chọn là cần xây dựng bộ dữ liệu chung bằng ngôn ngữ Tiếng Việt có chất lượng tốt, độ phủ rộng để phục vụ huấn luyện khả năng giao tiếp nhuần nhuyễn cho mô hình ngôn ngữ lớn Tiếng Việt.

Cùng với đó, nghiên cứu, thử nghiệm nền tảng dịch vụ mô hình ngôn ngữ lớn tiếng Việt với các thành phần cơ bản bao gồm công cụ phục vụ thu thập, xử lý, dán nhãn dữ liệu và các giao diện lập trình ứng dụng (API) phục vụ phát triển trợ lý ảo; trợ lý ảo phiên bản cơ bản dành cho cán bộ, công chức nhà nước và ứng dụng trợ lý ảo phiên bản dành cho Bộ TT&TT.