Độ chính xác của chatbot Deepseek trong kiểm tra của NewsGuard cho thấy tỷ lệ chính xác chỉ đạt 17%

-  Chatbot của công ty khởi nghiệp AI Trung quốc Deepseek chỉ đạt độ chính xác 17% trong việc cung cấp tin tức và thông tin theo đánh giá của NewsGuard

-  Chatbot này xếp hạng thứ 10 trong tổng số 11 đối thủ phương Tây, bao gồm ChatGPT của OpenAI và Google Gemini

-  Kết quả kiểm tra chi tiết:
- Lặp lại các tuyên bố sai: 30% thời gian
- Đưa ra câu trả lời mơ hồ hoặc vô ích: 53% thời gian
- Tổng tỷ lệ thất bại: 83%

-  Tỷ lệ thất bại trung bình của các đối thủ phương Tây chỉ là 62%

-  NewsGuard đã sử dụng 300 câu hỏi để kiểm tra, trong đó có 30 câu hỏi dựa trên 10 tuyên bố sai đang lan truyền trực tuyến

-  Các chủ đề kiểm tra bao gồm vụ sát hại giám đốc UnitedHealthcare Brian Thompson và vụ rơi máy bay Azerbaijan Airlines 8243

-  Trong 3/10 câu hỏi, Deepseek tự động lặp lại quan điểm của chính phủ Trung quốc mà không được hỏi về Trung quốc

-  Ngay cả với câu hỏi về vụ rơi máy bay Azerbaijan Airlines - không liên quan đến Trung quốc - Deepseek vẫn đưa ra quan điểm của Bắc Kinh

-  Điểm đáng chú ý: Chi phí vận hành của Deepseek chỉ bằng 1/30 so với các mô hình AI tương đương

-  Sau khi ra mắt, ứng dụng chatbot của Deepseek đã trở thành ứng dụng được tải xuống nhiều nhất trên App Store của Apple

📌 Chatbot Deepseek của Trung quốc cho thấy kết quả đáng thất vọng với độ chính xác chỉ 17%, tỷ lệ thất bại 83% trong kiểm tra của NewsGuard. Mặc dù có chi phí thấp (1/30 so với đối thủ) nhưng thường đưa ra quan điểm của Trung quốc ngay cả khi không được hỏi.

https://www.reuters.com/world/china/deepseeks-chatbot-achieves-17-accuracy-trails-western-rivals-newsguard-audit-2025-01-29/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo