Nghịch lý: AI không thể đánh vần từ "strawberry" nhưng có thể giải quyết các bài toán Olympic

• Các mô hình ngôn ngữ lớn (LLM) như GPT-4 và Claude thường không thể đếm chính xác số lần xuất hiện của chữ cái "r" trong từ "strawberry".

• Nguyên nhân là do cách hoạt động của kiến trúc transformer, nền tảng của hầu hết LLM. Transformer không thực sự "đọc" văn bản mà chuyển đổi nó thành mã hóa số học.

LLM có thể hiểu "strawberry" là ghép từ "straw" và "berry", nhưng không nhận biết được nó gồm các chữ cái riêng lẻ s-t-r-a-w-b-e-r-r-y.

Vấn đề này khó khắc phục vì nó nằm trong cốt lõi kiến trúc của LLM. Việc tokenization (phân đoạn từ) cũng gặp khó khăn với nhiều ngôn ngữ không dùng dấu cách giữa các từ.

• Các mô hình tạo hình ảnh như DALL-E sử dụng kiến trúc khác (mô hình khuếch tán), nhưng cũng gặp vấn đề tương tự khi tạo ra các chi tiết nhỏ như ngón tay hay chữ viết tay.

• Mặc dù vậy, AI đang có những tiến bộ đáng kể. OpenAI đang phát triển dự án có tên mã Strawberry, có khả năng tạo dữ liệu tổng hợp chính xác để cải thiện LLM.

• Google DeepMind gần đây công bố AlphaProof và AlphaGeometry 2, có thể giải 4/6 bài toán Olympic Toán quốc tế, đủ để giành huy chương bạc.

• Sự tương phản giữa việc AI không thể đánh vần "strawberry" nhưng lại giải được các bài toán phức tạp cho thấy cách hoạt động khác biệt của AI so với trí tuệ con người.

• Các nhà nghiên cứu đang nỗ lực cải thiện khả năng xử lý ngôn ngữ và hình ảnh của AI, nhưng vẫn còn nhiều thách thức cần vượt qua.

📌 AI hiện đại có thể giải quyết các vấn đề phức tạp nhưng lại gặp khó với những tác vụ đơn giản như đánh vần. Điều này cho thấy sự khác biệt cơ bản giữa cách xử lý thông tin của AI và con người, đồng thời nhấn mạnh nhu cầu cải tiến liên tục trong lĩnh vực này.

https://techcrunch.com/2024/08/27/why-ai-cant-spell-strawberry/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo