- Chatbot của công ty khởi nghiệp AI Trung quốc Deepseek chỉ đạt độ chính xác 17% trong việc cung cấp tin tức và thông tin theo đánh giá của NewsGuard
- Chatbot này xếp hạng thứ 10 trong tổng số 11 đối thủ phương Tây, bao gồm ChatGPT của OpenAI và Google Gemini
- Kết quả kiểm tra chi tiết:
- Lặp lại các tuyên bố sai: 30% thời gian
- Đưa ra câu trả lời mơ hồ hoặc vô ích: 53% thời gian
- Tổng tỷ lệ thất bại: 83%
- Tỷ lệ thất bại trung bình của các đối thủ phương Tây chỉ là 62%
- NewsGuard đã sử dụng 300 câu hỏi để kiểm tra, trong đó có 30 câu hỏi dựa trên 10 tuyên bố sai đang lan truyền trực tuyến
- Các chủ đề kiểm tra bao gồm vụ sát hại giám đốc UnitedHealthcare Brian Thompson và vụ rơi máy bay Azerbaijan Airlines 8243
- Trong 3/10 câu hỏi, Deepseek tự động lặp lại quan điểm của chính phủ Trung quốc mà không được hỏi về Trung quốc
- Ngay cả với câu hỏi về vụ rơi máy bay Azerbaijan Airlines - không liên quan đến Trung quốc - Deepseek vẫn đưa ra quan điểm của Bắc Kinh
- Điểm đáng chú ý: Chi phí vận hành của Deepseek chỉ bằng 1/30 so với các mô hình AI tương đương
- Sau khi ra mắt, ứng dụng chatbot của Deepseek đã trở thành ứng dụng được tải xuống nhiều nhất trên App Store của Apple
📌 Chatbot Deepseek của Trung quốc cho thấy kết quả đáng thất vọng với độ chính xác chỉ 17%, tỷ lệ thất bại 83% trong kiểm tra của NewsGuard. Mặc dù có chi phí thấp (1/30 so với đối thủ) nhưng thường đưa ra quan điểm của Trung quốc ngay cả khi không được hỏi.
https://www.reuters.com/world/china/deepseeks-chatbot-achieves-17-accuracy-trails-western-rivals-newsguard-audit-2025-01-29/