8 trong số 12 mô hình ngôn ngữ lớn (LLM) phổ biến, bao gồm cả ChatGPT-4, đã trả lời sai câu hỏi so sánh 9,11 và 9,9

• 8 trong số 12 mô hình ngôn ngữ lớn (LLM) phổ biến, bao gồm cả ChatGPT-4, đã trả lời sai câu hỏi so sánh 9,11 và 9,9.

• Quá trình tính toán có thể của các LLM được tiết lộ trên một số trang web chuyên môn: sau khi nhận thấy 9 bằng 9, chúng chuyển sang so sánh 11 với 9 thay vì 0,11 với 0,9.

• Điều này trái ngược với nhận thức chung của công chúng đang sử dụng LLM cho hầu hết mọi thứ, nhưng phù hợp với bản chất của chúng như tên gọi - các mô hình xử lý và tạo ra văn bản dựa trên lượng lớn tài liệu ngôn ngữ.

• Một số phiên bản nâng cao có thể tạo ra hình ảnh hoặc video, nhưng về bản chất vẫn là mô hình ngôn ngữ, chỉ khác ở chỗ ngôn ngữ sử dụng là hình ảnh, lời nói hoặc văn bản.

• Toán học vẫn là một thách thức khó khăn đối với LLM. Nhiều mô hình xử lý các chữ số như từ, đơn giản so sánh 11 với 9 trong trường hợp 9,11 và 9,9 mà không quan tâm đến dấu thập phân.

• Nhiều LLM hầu như không hiểu logic phức tạp liên quan đến dấu thập phân.

• Toán học là nền tảng của mọi logic cấp cao hơn. Thất bại trong tính toán toán học cơ bản là điểm nghẽn đối với LLM.

• Đây là lý do chính khiến các văn bản do LLM tạo ra luôn tuân theo các phong cách tương tự, sử dụng nghiêm ngặt "bởi vì", "vì vậy" hoặc "thứ nhất, thứ hai, thứ ba", vì chỉ với những từ này được nêu rõ ràng, LLM mới có thể hiểu được logic.

• Tình hình đang được cải thiện. OpenAI, nhà phát triển ChatGPT, được báo cáo đang làm việc trên một phương pháp tiếp cận mới đối với AI của họ với tên mã Strawberry.

• Nhiều nhà phát triển AI khác cũng đang cải thiện logic của các mô hình của họ theo những cách tương tự.

• Luôn có con đường phía trước và người dùng AI chỉ cần kiên nhẫn.

📌 8/12 mô hình ngôn ngữ lớn, bao gồm ChatGPT-4, không phân biệt được 9,11 và 9,9. Toán học vẫn là thách thức lớn đối với AI. OpenAI và các nhà phát triển khác đang nỗ lực cải thiện logic của các mô hình, hứa hẹn tiến bộ trong tương lai.

https://www.chinadaily.com.cn/a/202407/18/WS66988e15a31095c51c50ebae.html

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo