Sản phẩm mới của Meta gồm hai mô hình chính là MovieGen Video và MovieGen Audio. Cả hai đều có khả năng nâng cao hứa hẹn sẽ cách mạng hóa việc tạo nội dung đa phương tiện.
Tạo video với MovieGen Video
MovieGen Video là một bước tiến công nghệ ấn tượng với 30 tỷ thông số giúp người dùng tạo ra video và hình ảnh chất lượng cao chỉ từ một đoạn văn bản đơn giản. Với khả năng sản xuất video dài tới 16 giây và tốc độ 16 khung hình mỗi giây, MovieGen mang đến trải nghiệm xem mượt mà và sắc nét.
Điều đặc biệt ở MovieGen là tính năng chỉnh sửa video hiện có khi người dùng có thể dễ dàng thay đổi nội dung video bằng cách sử dụng các lệnh văn bản. Ví dụ, nếu có một video về một người đang ném bóng, người dùng có thể thay thế bóng bằng một quả dưa hấu mà không làm ảnh hưởng đến các yếu tố khác trong video.
Khả năng thực hiện các chỉnh sửa chi tiết hoặc tổng thể (chẳng hạn như thay đổi bối cảnh hoặc phong cách hình ảnh) của MovieGen Video mở ra nhiều cơ hội sáng tạo cho các nhà sản xuất nội dung. Đó không chỉ là một công cụ tạo video mà còn là một nền tảng sáng tạo mạnh mẽ hứa hẹn thay đổi cách sản xuất và tiêu thụ nội dung số trong tương lai.
Đồng bộ hóa âm thanh với MovieGen Audio
Trong khi đó, MovieGen Audio là một mô hình âm thanh đột phá với 13 tỷ thông số được thiết kế để tạo ra âm thanh chân thực và hoàn toàn đồng bộ với video. Với khả năng sản xuất âm thanh kéo dài lên đến 45 giây, MovieGen Audio có thể tạo ra mọi thứ từ hiệu ứng âm thanh xung quanh cho đến nhạc cụ và âm thanh Foley.
Đặc biệt, mô hình này còn cho phép người sáng tạo tùy chỉnh âm thanh dựa trên nội dung video hoặc thông qua các tín hiệu văn bản bổ sung, từ đó mở ra nhiều cơ hội sáng tạo mới. Theo Meta, MovieGen Audio không chỉ dẫn đầu về chất lượng âm thanh mà còn về khả năng đồng bộ hóa giữa video và âm thanh, đồng thời mang đến sự kết nối giữa văn bản và âm thanh, điều này hứa hẹn sẽ thay đổi cách thức sản xuất nội dung trong ngành công nghiệp giải trí.
Một trong những tính năng nổi bật nhất của MovieGen là khả năng tạo video được cá nhân hóa. Bằng cách sử dụng hình ảnh của một người cùng với văn bản, hệ thống có thể tạo video trong khi vẫn duy trì danh tính và chuyển động tự nhiên của đối tượng. Meta khẳng định rằng kết quả của những mô hình này rất xuất sắc trong việc bảo tồn các chi tiết và chuyển động mượt mà trong video.
Meta cũng nhấn mạnh rằng các mô hình MovieGen của họ vượt trội hơn các giải pháp hiện có khác trên thị trường, chẳng hạn như OpenAI Sora và Runway Gen-3 khi xem xét về chất lượng video được tạo ra. Mặc dù họ vẫn đang nỗ lực hoàn thiện mô hình với sự cộng tác của các chuyên gia sáng tạo, MovieGen được kỳ vọng sẽ là một công cụ mạnh mẽ một khi nó được cung cấp cho công chúng.