Camb AI ra mắt Mars5, mô hình AI tạo giọng nói với độ chân thực cao, hỗ trợ 140 ngôn ngữ, vượt trội so với ElevenLabs

- Camb AI, một startup tại Dubai chuyên nghiên cứu công nghệ nội địa hóa nội dung dựa trên AI, đã công bố ra mắt Mars5, một mô hình AI mạnh mẽ cho việc tạo giọng nói nhân tạo.
- Mars5 nổi bật với khả năng tái tạo giọng nói với mức độ chân thực cao, bao gồm các thông số phức tạp như nhịp điệu, cảm xúc và ngữ điệu.
- Mars5 hỗ trợ hơn 140 ngôn ngữ, gấp gần 3 lần so với ElevenLabs, bao gồm cả các ngôn ngữ ít tài nguyên như Icelandic và Swahili.
- Phiên bản mã nguồn mở của Mars5 chỉ hỗ trợ tiếng Anh, trong khi phiên bản hỗ trợ nhiều ngôn ngữ hơn có sẵn trên nền tảng trả phí của công ty.
- Mars5 kết hợp khả năng tạo giọng nói và chuyển đổi văn bản thành giọng nói trong một nền tảng duy nhất, cho phép người dùng tải lên tệp âm thanh và văn bản để tạo giọng nói nhân tạo.
- Mô hình này có thể tái tạo các tông giọng và cảm xúc đa dạng, phù hợp cho các nội dung khó chuyển đổi thành giọng nói như bình luận thể thao, phim ảnh và anime.
- Mars5 sử dụng mô hình autoregressive ~750M tham số và mô hình non-autoregressive multinomial diffusion ~450M tham số, hoạt động trên các mã hóa encodec 6kbps.
- Các thử nghiệm ban đầu cho thấy Mars5 hoạt động tốt hơn so với các mô hình tổng hợp giọng nói khác, bao gồm cả Metavoice và ElevenLabs.
- Camb AI cũng đang lên kế hoạch phát hành mã nguồn mở cho một mô hình khác tên là Boli, được thiết kế để dịch thuật với hiểu biết ngữ cảnh, ngữ pháp chính xác và ngôn ngữ thông tục.
- Boli vượt trội hơn các công cụ dịch thuật truyền thống như Google Translate và DeepL, đặc biệt trong các ngôn ngữ ít đến trung bình tài nguyên.
- Camb AI cung cấp các khả năng của Mars5 và Boli dưới dạng API cho các doanh nghiệp, SMEs và nhà phát triển.
- Công ty đang hợp tác với các tổ chức lớn như Major League Soccer, Tennis Australia, Maple Leaf Sports & Entertainment, các hãng phim và âm nhạc hàng đầu, cũng như nhiều cơ quan chính phủ.
- Camb AI đã thực hiện dịch trực tiếp một trận đấu của Major League Soccer sang 4 ngôn ngữ trong hơn 2 giờ liên tục, và dịch các cuộc họp báo sau trận đấu của Australian Open sang nhiều ngôn ngữ.

📌 Camb AI ra mắt Mars5, mô hình AI tạo giọng nói với độ chân thực cao, hỗ trợ 140 ngôn ngữ, vượt trội so với ElevenLabs. Mars5 kết hợp khả năng tạo giọng nói và chuyển đổi văn bản thành giọng nói, phù hợp cho nhiều nội dung phức tạp. Công ty cũng đang phát triển mô hình dịch thuật Boli với hiệu suất vượt trội.

https://venturebeat.com/ai/exclusive-camb-takes-on-elevenlabs-with-open-voice-cloning-ai-model-mars5-offering-higher-realism-support-for-140-languages/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo