ChatGPT đã đọc gần như toàn bộ Internet: Điều đó vẫn chưa giải quyết được vấn đề về tính đa dạng của nó
- AI language models như ChatGPT phát triển mạnh mẽ, nhưng vẫn chưa thể suy luận như con người. Dr. Vered Shwartz và Mehar Bhatia từ UBC giải thích tầm quan trọng của việc đào tạo mô hình bằng dữ liệu đa dạng từ nhiều nền văn hóa.
- Khái niệm 'suy luận' trong AI được hiểu là khả năng sử dụng logic và thông thường để hiểu sâu hơn thông tin được nói ra. Điều này khác với cách mà AI hiện nay học, chủ yếu từ việc đọc và nhận dạng mẫu trên internet.
- AI hiện tại có thể phân biệt dựa trên ngữ cảnh, nhưng vẫn còn hạn chế trong suy luận thông thường và cần sự can thiệp của con người để cung cấp dữ liệu phù hợp.
- Mô hình AI dựa trên văn bản tiếng Anh thường có định kiến Bắc Mỹ do số liệu lớn từ khu vực này. Việc đào tạo mô hình bằng dữ liệu đa văn hóa đã cải thiện độ chính xác và nhận thức văn hóa.
- Ví dụ, mô hình khi được đào tạo bằng dữ liệu đa dạng đã xác định đúng một phụ nữ ở Somalia có hình xăm henna là sắp cưới, so với giả định cô ấy muốn mua henna trước đó.
- ChatGPT thiếu nhận thức văn hóa khi giả định rằng văn hóa tiền boa ở Bắc Mỹ áp dụng ở Tây Ban Nha, trong khi thực tế ở Tây Ban Nha không phổ biến việc tiền boa và 4% có thể là dấu hiệu của dịch vụ xuất sắc.
- Mô hình ngôn ngữ cần phản ánh đa dạng và không phân biệt đối xử, bởi chúng được sử dụng rộng rãi và có thể tạo ra thông tin không chính xác nếu chỉ dựa vào một văn hóa cụ thể. Nghiên cứu tiếp tục hướng đến sự bao trùm, đa dạng và nhạy cảm văn hóa trong phát triển và triển khai công nghệ AI.
📌 Mô hình AI như ChatGPT đã đọc gần như toàn bộ internet nhưng vẫn chưa giải quyết được vấn đề đa dạng văn hóa. Dù đã có cải thiện khi đào tạo bằng dữ liệu đa dạng, nhưng để đạt được suy luận như con người và hiểu biết sâu sắc về ngữ cảnh văn hóa, cần tiếp tục phát triển công nghệ. Dr. Vered Shwartz và Mehar Bhatia từ UBC nhấn mạnh tầm quan trọng của việc đào tạo mô hình bằng dữ liệu từ nhiều nền văn hóa khác nhau. Nghiên cứu và dữ liệu đa dạng sẽ giúp AI không chỉ chính xác hơn mà còn nhạy cảm với văn hóa và tránh định kiến, qua đó tạo ra công cụ mạnh mẽ hơn cho con người sử dụng.