LLM Trung Quốc thâu tóm top 10 mô hình AI nguồn mở hàng đầu thế giới
Chuyển đổi số - Ngày đăng : 13:56, 28/06/2024
Theo bảng xếp hạng của nền tảng phát triển AI và học máy Hugging Face, 3 trong tổng số 4 mô hình ngôn ngữ lớn (LLM) Trung Quốc nằm top 10 thế giới thuộc nền tảng Tongyi Qianwen (Qwen) do Alibaba phát triển.
Qwen-72B-Instruct LLM, với 72 tỷ tham số của Alibaba đứng đầu danh sách với số điểm trung bình là 43,02 trên 6 tiêu chí.
“Qwen-72B-Instruct đang dẫn đầu các mô hình mở của Trung Quốc với điểm số tổng quát”, đồng sáng lập và Giám đốc điều hành Hugging Face, Clement Delangue cho biết trong một bài đăng trên mạng xã hội X (Twitter).
Theo đó, mô hình nền tảng Qwen nêu trên được ghi nhận đạt “hiệu suất toán học, lý luận sâu và kiến thức”.
Trong khi đó, các mẫu Qwen-72B và Qwen1.5-110B của Alibaba lần lượt đứng ở vị trí thứ 3 và thứ 10. Theo Hugging Face, thứ hạng dự kiến sẽ thay đổi theo thời gian vì ngày càng có nhiều LLM được đánh giá.
Mẫu Yi-1.5-34B-Chat của công ty khởi nghiệp 01.AI có trụ sở tại Bắc Kinh được xếp hạng thứ 7. Công ty được thành lập vào năm 2023 bởi nhà đầu tư mạo hiểm nổi tiếng Lee Kai-fu, người trước đây là Chủ tịch Google Trung Quốc.
Bảng xếp hạng cho thấy sự tiến bộ nhanh chóng của Alibaba trong lĩnh vực AI nguồn mở. Các nhà phát triển bên thứ ba được truy cập công khai vào mã nguồn chương trình, cho phép sửa đổi hoặc chia sẻ thiết kế của LLM. Các công nghệ nguồn mở đã đóng góp rất lớn cho ngành công nghệ đang phát triển mạnh mẽ của Trung Quốc trong vài thập kỷ qua.
Mô hình AI của Meta Platforms, công ty mẹ của Facebook, chiếm vị trí thứ 2 sau Alibaba trong danh sách top 10 của Hugging Face. LLM của Microsoft, đứng thứ 6.
Hugging Face cho biết phương pháp xếp hạng các mô hình AI của họ đã bổ sung thêm nhiều số liệu hơn, chẳng hạn như khả năng xử lý các vấn đề phức tạp có độ dài khoảng 1.000 từ mà “hiệu suất vẫn ổn định”.
Bảng xếp hạng của Hugging Face chỉ tập trung vào các chương trình mã nguồn mở, không tính đến những LLM nâng cao được phát triển độc quyền như GPT từ OpenAI.
Theo một xếp hạng khác do Đại học California, Berkeley và Tổ chức Hệ thống Mô hình lớn tiến hành (LMSYS Chatbot Arena), GPT-4o đang đứng đầu thế giới, trong khi Qwen2-72B-Instruct của Alibaba xếp hạng thứ 19.
(Theo SCMP)