Nghiên cứu mới của BBC: AI mắc lỗi khi tóm tắt tin tức trên 50% trường hợp

  • BBC tiến hành nghiên cứu về độ chính xác khi tóm tắt tin tức của 4 chatbot AI hàng đầu: ChatGPT của OpenAI, Copilot của Microsoft, Gemini của Google và Perplexity AI

  • Nghiên cứu đánh giá 100 bài báo từ trang web BBC, yêu cầu mỗi chatbot tạo bản tóm tắt

  • 51% câu trả lời được tạo bởi AI có lỗi nghiêm trọng, bao gồm:

  • 19% có sai sót về dữ liệu, ngày tháng và thông tin

  • 13% trích dẫn sai hoặc không tồn tại trong bài gốc

  • Google Gemini có tỷ lệ lỗi cao nhất với 46% câu trả lời có vấn đề về độ chính xác

  • Các lỗi điển hình:

  • Gemini đưa thông tin sai về hướng dẫn của NHS về vaping

  • ChatGPT và Copilot cung cấp thông tin lỗi thời về các chức danh chính trị tại Anh

  • Perplexity trích dẫn sai về tình hình Trung Đông

  • Tỷ lệ câu trả lời có vấn đề nghiêm trọng theo từng chatbot:

  • Gemini: trên 60%

  • Copilot: trên 50%

  • ChatGPT và Perplexity: khoảng 40%

  • Deborah Turness, CEO BBC News bày tỏ lo ngại về kết quả nghiên cứu và kêu gọi các nhà phát triển AI tạm dừng công cụ tóm tắt tin tức

  • Pete Archer, Giám đốc chương trình AI tạo sinh của BBC, nhấn mạnh vai trò kiểm soát nội dung của các nhà xuất bản và yêu cầu minh bạch từ các công ty AI

📌 Nghiên cứu của BBC phát hiện 51% bản tóm tắt tin tức từ chatbot AI có lỗi nghiêm trọng. Gemini dẫn đầu với tỷ lệ sai sót trên 60%, trong khi ChatGPT và Perplexity thể hiện tốt hơn với khoảng 40% lỗi. Các chuyên gia kêu gọi cải thiện độ chính xác và minh bạch trong xử lý tin tức của AI.

 

https://www.tomsguide.com/ai/damning-new-ai-study-shows-that-chatbots-make-errors-summarizing-the-news-over-50-percent-of-the-time-and-this-is-the-worst-offender

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo