- Ủy ban Thương mại Liên bang Mỹ (FTC) trao giải thưởng cho 4 tổ chức phát triển công nghệ phân biệt giọng nói thật và giọng nói do AI tạo ra (deepfake âm thanh).
- Giải thưởng nhằm nâng cao nhận thức của người tiêu dùng về các vụ lừa đảo sử dụng giọng nói do AI tạo ra và lo ngại về ảnh hưởng của deepfake trong cuộc bầu cử năm nay.
- OriginStory, một đội ngũ gồm các nhà nghiên cứu tại Đại học Arizona State, sử dụng cảm biến để phát hiện các hoạt động của con người như hơi thở, chuyển động và nhịp tim, từ đó xác minh giọng nói có phải từ con người hay không.
- DeFake, của Ning Zhang từ Đại học Washington ở St. Louis, đưa dữ liệu vào bản ghi âm giọng nói thật để các bản sao giọng nói do AI tạo ra không giống với giọng thật.
- AI Detect, của startup Omni Speech, sử dụng AI để phát hiện AI bằng cách trích xuất các đặc điểm như ngữ điệu từ clip âm thanh và huấn luyện mô hình phân biệt giọng thật và giả.
- Pindrop Security cũng được vinh danh cho công trình của họ nhưng không nhận tiền thưởng do quy mô tổ chức lớn hơn.
- Các công cụ phát hiện thương mại hiện có dựa trên machine learning có thể kém tin cậy do chất lượng âm thanh, định dạng media và cần liên tục được huấn luyện trên các bộ tạo deepfake mới.
- Theo Berisha, việc sử dụng AI để phát hiện AI sẽ ngày càng kém hiệu quả theo thời gian, tương tự như các công cụ phát hiện văn bản do AI tạo ra trước đây.
📌 FTC trao giải cho 4 tổ chức phát triển công nghệ phân biệt giọng nói thật và deepfake, bao gồm OriginStory, DeFake, AI Detect và Pindrop Security. Giải thưởng nhằm nâng cao nhận thức về deepfake âm thanh trước thềm bầu cử Mỹ. Tuy nhiên, việc sử dụng AI để phát hiện AI được dự báo sẽ ngày càng kém hiệu quả trong tương lai.
https://www.npr.org/2024/04/10/1243772203/deepfake-audio-testing-contest-winners