Microsoft LASER loại bỏ sự thiếu chính xác của LLM

  • Microsoft áp dụng phương pháp Layer-Selective Rank Reduction (LASER) để cải thiện độ chính xác của các mô hình ngôn ngữ lớn (LLM).
  • LASER cho phép các nhà nghiên cứu thay thế ma trận trọng số lớn bằng một ma trận nhỏ hơn, gần đúng hơn, nhưng lại tăng độ chính xác của mô hình.
  • Trong quá trình nghiên cứu tại Microsoft Research Lab NYC, việc can thiệp bằng LASER không làm tăng mô hình loss (mất mát), ngược lại còn giảm nó đi, điều này nghịch lý so với kỳ vọng thông thường.
  • LASER đã được thử nghiệm thành công trên ba mô hình nguồn mở khác nhau: RoBERTa, Llama 2, và Eleuther’s GPT-J.
  • Cải thiện hiệu suất có thể lên đến 20-30 điểm phần trăm, ví dụ như độ chính xác của GPT-J trong dự đoán giới tính dựa trên tiểu sử tăng từ 70.9% lên 97.5% sau can thiệp LASER.
  • Mặc dù các mô hình AI thường mắc lỗi về sự thật, việc tăng cường độ chính xác của LLM vẫn là một vấn đề quan trọng để giảm thiểu tác hại có thể xảy ra.

📌 Phương pháp LASER của Microsoft đã chứng minh khả năng tối ưu hóa độ chính xác của các mô hình ngôn ngữ lớn (LLM) một cách đột phá, với việc giảm mô hình loss và tăng cường độ chính xác, nổi bật là sự cải thiện từ 70,9% lên 97,5% trong dự đoán giới tính dựa trên tiểu sử bởi GPT-J sau khi can thiệp LASER.

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo