KnowHalu: Cách tiếp cận AI mới giúp phát hiện ảo giác trong văn bản AI với độ chính xác cao

- Nhóm nghiên cứu từ Đại học Illinois Urbana-Champaign, UChicago và UC Berkeley đã phát triển một phương pháp mới có tên là KnowHalu, nhằm phát hiện ảo giác trong văn bản do các mô hình ngôn ngữ lớn (LLMs) tạo ra.

- Ảo giác trong văn bản AI là vấn đề khi mô hình tạo ra nội dung có vẻ chính xác nhưng thực tế lại sai lệch hoặc không liên quan, điều này có thể gây rủi ro trong các ứng dụng đòi hỏi độ chính xác cao như y tế hay tài chính.
- KnowHalu sử dụng một quy trình hai giai đoạn để cải thiện độ chính xác trong phát hiện ảo giác. Giai đoạn đầu tiên kiểm tra các ảo giác không phải do sáng tạo, tức là các phản hồi kỹ thuật chính xác nhưng không phù hợp với truy vấn.
- Các phương pháp trước đây thường dựa vào kiểm tra tính nhất quán nội bộ hoặc sử dụng trạng thái ẩn và xác suất đầu ra của AI để xác định lỗi, nhưng những phương pháp này chỉ dựa vào thông tin có sẵn trong AI mà không luôn cập nhật hoặc toàn diện.
- Hiệu quả của KnowHalu đã được chứng minh qua các bài kiểm tra nghiêm ngặt trên nhiều nhiệm vụ khác nhau như trả lời câu hỏi và tóm tắt văn bản. Kết quả cho thấy sự cải thiện đáng kể trong việc phát hiện ảo giác, vượt trội so với các phương pháp tiên tiến nhất trước đây.
- Cụ thể, KnowHalu đã đạt được cải thiện 15,65% về độ chính xác trong các nhiệm vụ trả lời câu hỏi và tăng 5,50% độ chính xác trong tóm tắt văn bản so với các kỹ thuật tốt nhất trước đó.

📌 KnowHalu, phát triển bởi các nhà nghiên cứu từ Đại học Illinois Urbana-Champaign, UChicago và UC Berkeley, là một phương pháp mới giúp phát hiện ảo giác trong văn bản AI với hiệu quả cao, cải thiện độ chính xác lên đến 15,65% trong trả lời câu hỏi và 5,50% trong tóm tắt văn bản.

Citations:
[1] https://www.marktechpost.com/2024/05/12/knowhalu-a-novel-ai-approach-for-detecting-hallucinations-in-text-generated-by-large-language-models-llms/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo