Các nhà nghiên cứu của Google ra mắt 'VLOGGER', một AI có thể mang lại sự sống cho ảnh tĩnh

- VLOGGER là một hệ thống AI mới do các nhà nghiên cứu Google phát triển, có thể tạo ra video giống như thật về người nói, cử chỉ và di chuyển chỉ từ một bức ảnh tĩnh.
- Công nghệ này dựa trên các mô hình học máy tiên tiến gọi là mô hình khuếch tán để tổng hợp cảnh quay thực tế đáng kinh ngạc.
- VLOGGER sử dụng một tập dữ liệu mới khổng lồ có tên MENTOR, chứa hơn 800.000 danh tính đa dạng và 2.200 giờ video, cho phép nó học cách tạo video về người với các sắc tộc, độ tuổi, trang phục, tư thế và môi trường xung quanh khác nhau mà không bị sai lệch.
- Công nghệ này mở ra nhiều trường hợp sử dụng hấp dẫn như tự động lồng tiếng video sang ngôn ngữ khác, chỉnh sửa liền mạch và điền vào các khung hình bị thiếu trong video, tạo ra video đầy đủ của một người từ một bức ảnh duy nhất.
- VLOGGER có thể được sử dụng để tạo ra các diễn viên ảo chân thực cho thực tế ảo và trò chơi, cũng như các trợ lý ảo và chatbot hấp dẫn và sinh động hơn.
- Tuy nhiên, công nghệ này cũng có khả năng bị lạm dụng, chẳng hạn như tạo ra deepfake, gây ra thách thức về thông tin sai lệch và giả mạo kỹ thuật số.
- Mặc dù ấn tượng, VLOGGER vẫn có những hạn chế như video được tạo ra tương đối ngắn, có nền tĩnh, cá nhân không di chuyển trong môi trường 3D và cử chỉ, giọng nói chưa hoàn toàn giống người thật.
- VLOGGER đại diện cho một bước tiến đáng kể và cho thấy sự tiến bộ nhanh chóng đang diễn ra trong lĩnh vực trí tuệ nhân tạo.

📌 VLOGGER của Google có thể tạo ra video chân thực về người nói và cử chỉ chỉ từ một bức ảnh tĩnh, dựa trên mô hình khuếch tán và tập dữ liệu khổng lồ MENTOR với hơn 800.000 danh tính và 2.200 giờ video. Công nghệ này mở ra nhiều ứng dụng tiềm năng nhưng cũng đặt ra thách thức về deepfake và thông tin sai lệch trong tương lai.

https://venturebeat.com/ai/google-researchers-unveil-vlogger-an-ai-that-can-bring-still-photos-to-life/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo