• Các công ty AI đã khai thác dữ liệu trên internet một cách ồ ạt để huấn luyện mô hình, dẫn đến phản ứng từ chủ sở hữu dữ liệu và các vụ kiện đòi bồi thường.
• Ba hãng thu âm lớn Sony Music, Warner Music Group và Universal Music Group vừa kiện các công ty AI âm nhạc Suno và Udio về cáo buộc vi phạm bản quyền ở quy mô lớn.
• Vụ kiện này có thể tạo tiền lệ quan trọng cho toàn bộ ngành AI tạo sinh, khi gửi thông điệp rõ ràng rằng dữ liệu huấn luyện chất lượng cao không miễn phí.
• OpenAI đã bắt đầu ký thỏa thuận với các nhà xuất bản tin tức như Politico, Atlantic, Time, Financial Times để đổi lấy dữ liệu tin tức và trích dẫn nguồn.
• YouTube cũng thông báo sẽ cung cấp thỏa thuận cấp phép cho các hãng thu âm hàng đầu để đổi lấy âm nhạc phục vụ huấn luyện AI.
• Tuy nhiên, các thỏa thuận này cũng gây lo ngại. Các mô hình ngôn ngữ vốn không thể hoàn toàn chính xác và thường tạo ra các trích dẫn ảo, khiến OpenAI khó có thể thực hiện lời hứa trích dẫn nguồn.
• Xu hướng này có thể dẫn đến việc các công ty AI xây dựng các mô hình nhỏ hơn, hiệu quả hơn. Hoặc họ sẽ phải chi một khoản tiền lớn để tiếp cận dữ liệu ở quy mô cần thiết.
• Chỉ những công ty có nhiều tiền mặt hoặc có sẵn bộ dữ liệu lớn (như Meta với 20 năm dữ liệu mạng xã hội) mới có thể làm được điều này. Điều này có nguy cơ tập trung quyền lực hơn nữa vào tay các "ông lớn".
• Mặt tích cực là việc đưa sự đồng thuận vào quá trình này là một ý tưởng tốt - không chỉ cho chủ sở hữu quyền, mà cho tất cả chúng ta. Mọi người nên có quyền quyết định cách sử dụng dữ liệu của mình.
• Một nền kinh tế dữ liệu công bằng hơn sẽ có lợi cho tất cả mọi người, không chỉ riêng các công ty công nghệ lớn.
📌 Vụ kiện của ngành âm nhạc đánh dấu bước ngoặt trong cuộc chiến dữ liệu AI. Các công ty buộc phải trả tiền cho dữ liệu chất lượng, có thể dẫn đến tập trung quyền lực vào "ông lớn" nhưng cũng mở ra cơ hội xây dựng nền kinh tế dữ liệu công bằng hơn cho tất cả.
https://www.technologyreview.com/2024/07/02/1094508/ai-companies-are-finally-being-forced-to-cough-up-for-training-data/
#MIT