Công nghệ giọng nói nhân tạo không còn quá xa lạ với người dùng, đặc biệt là giọng nói chị “Google” trên Google Dịch để hỗ trợ đọc ngôn ngữ hay các trợ lý ảo như Siri (Apple), Google Assistant (Google), Alexa (Amazon), Cortana (Microsoft) ứng dụng giọng nói ảo để giao tiếp với người dùng.
Từ ứng dụng AI của những ông lớn trong giới công nghệ về ngôn ngữ nhân tạo trên thế giới, ngày nay chúng ta có thể ứng dụng giọng nói nhân tạo vào đa dạng các ngành nghề như kinh doanh, tiếp thị, giải trí, giáo dục,... Tuy nhiên, việc tìm kiếm một phần mềm mang đậm thanh âm và ngữ điệu tiếng Việt những năm về trước khá ít ỏi. Hiện nay, Vbee tự hào là một trong những đơn vị tiên phong phát triển thành công giọng nói nhân tạo tiếng Việt đa vùng miền với sản phẩm Vbee Text To Speech.
Vbee Text To Speech được biết đến là giải pháp công nghệ sử dụng trí tuệ nhân tạo ứng dụng công nghệ Conversational AI để chuyển đổi văn bản thành giọng nói tự nhiên và cảm xúc giống với giọng điệu của con người, tạo điều kiện cho cộng đồng sáng tạo nội dung có thể dễ dàng phát triển nội dung ngôn ngữ nói. Đặc biệt, Vbee Text To Speech đóng vai trò quan trọng trong việc tạo cơ hội cho người khuyết tật có thể tiếp cận thông tin như mọi người bình thường.
"Chúng tôi mang những đặc trưng của tiếng Việt như ngữ âm học, thanh điệu, ngữ điệu vào các nghiên cứu để tạo ra những giọng nói đầy cảm xúc, cuộc hội thoại ảo nhưng rất con người", TS. Nguyễn Thị Thu Trang, Founder - CTO của Vbee, giảng viên chính trường Công nghệ thông tin và Truyền thông - Đại học Bách Khoa Hà Nội chia sẻ.
Trước đây, khi các phần mềm giọng nói nhân tạo chưa phổ biến, các nhà sáng tạo nội dung thường quen thuộc với việc làm nội dung truyền thống như là tạo nội dung và tự thu âm lồng tiếng cho video của mình. Điều này không chỉ tốn nhiều thời gian bởi thu âm lỗi, âm thanh không đạt tiêu chuẩn, giọng nói không thu hút người nghe, và nếu có sử dụng giọng nói nhân tạo từ các phần mềm nước ngoài thì cũng khá là khô cứng, không được tự nhiên, chưa kể đến thời gian lồng ghép từng âm thanh trong quá trình chỉnh sửa video. Đồng thời, chi phí để mua thiết bị thu âm cũng như thuê phòng thu cũng tương đối cao.
Giờ đây, thay vì phải sử dụng phương pháp thu âm truyền thống, công nghệ của Vbee AIVoice mang lại trải nghiệm hoàn toàn mới trong việc sản xuất tin tức và nội dung, áp dụng công nghệ máy học (Machine Learning) để chuyển đổi văn bản thành giọng nói một cách hiệu quả. Chỉ cần vài thao tác đơn giản như cung cấp nội dung văn bản, chọn giọng đọc theo mong muốn và chuyển đổi sang audio, các nhà sáng tạo nội dung có thể tạo ra file âm thanh chỉ trong vài giây với chất lượng tương tự trong phòng thu chuyên nghiệp.
Mới đây, sản phẩm Vbee Text To Speech đã được bổ sung tính năng “Chuyển đổi file phụ đề SRT sang audio” dành riêng cho những nhà sản xuất nội dung video có thời lượng và phụ đề dài. Đối với các nhà sáng tạo nội dung, đặc biệt là trong quá trình làm việc với video dài, việc chỉnh sửa âm thanh và phụ đề thường gặp nhiều khó khăn khi phải xử lý khối lượng phụ đề lớn. Đáng chú ý hơn nữa, với tính năng mới của Vbee Text To Speech, bạn có thể hoàn thành một bản audio lồng tiếng khớp hoàn toàn với chữ phụ đề trên video chỉ trong thời gian ngắn chưa đầy 5 phút.
Xuất phát điểm từ một đề tài nghiên cứu khoa học của giảng viên và sinh viên trường trường Công nghệ thông tin và Truyền thông - Đại học Bách Khoa Hà Nội, Vbee AIVoice Studio là một trong những sản phẩm hiếm hoi có thể thương mại hóa thành công.
Tính đến thời điểm hiện tại, sản phẩm đã chinh phục hơn 1 triệu người sử dụng bằng việc phát triển hơn 200 MC ảo với hơn 40 ngôn ngữ khác nhau, được tối ưu đa dạng vùng miền. Điểm đặc biệt của Vbee Text To Speech không chỉ dừng lại ở sự tối ưu hóa sâu về ngôn ngữ mà còn là khả năng hỗ trợ cá nhân, doanh nghiệp tiết kiệm thời gian trong việc sản xuất nội dung âm thanh cho video, quảng cáo, phát thanh cơ sở, hoạt động giảng dạy, tăng trải nghiệm đọc và nghe với hệ thống báo nói, sách nói,...
Vbee Text To Speech không chỉ đem tới sự tiện lợi, tiết kiệm về mặt thời gian mà còn là một công cụ hiệu quả giúp tạo ra nội dung chất lượng cao, phù hợp với nhu cầu đa dạng của người dùng trong thị trường ngày càng cạnh tranh hiện nay.