AI nghiên cứu 2024-05-11 08:12:57

Nghiên cứu tác động của việc tinh chỉnh mô hình ngôn ngữ lớn với kiến thức mới đến khả năng tạo ra câu trả lời không chính xác.

- Mô hình ngôn ngữ lớn (LLMs) khi được tinh chỉnh với dữ liệu mới có thể không học được kiến thức một cách hiệu quả.
- Trong quá trình tinh chỉnh, LLMs thường gặp phải thông tin mới không có trong kiến thức đã học trước đó.
- Các mô hình này có xu hướng tạo ra câu trả lời không chính xác khi được huấn luyện với dữ liệu mới.
- Nghiên cứu đã thiết kế một thí nghiệm kiểm soát để đánh giá tác động của việc học từ các ví dụ tinh chỉnh mang thông tin mới.
- Kết quả cho thấy, việc học từ các ví dụ mang thông tin mới có mối liên hệ tuyến tính với xu hướng tạo sinh không chính xác của mô hình so với kiến thức đã có.
- Việc học từ các ví dụ có thông tin đã biết lại gắn liền với việc sử dụng hiệu quả hơn kiến thức sẵn có.
- Phát hiện này nhấn mạnh rủi ro khi giới thiệu kiến thức mới thông qua tinh chỉnh và ủng hộ quan điểm rằng LLMs chủ yếu thu nạp kiến thức thông qua quá trình tiền huấn luyện.
- Các mô hình được tinh chỉnh với các ví dụ có độ chắc chắn thấp trong kiến thức (MaybeKnown) lại cho kết quả tốt hơn trong thử nghiệm, cho thấy sự cần thiết của việc bao gồm các ví dụ này trong quá trình tinh chỉnh.
- Việc sử dụng sớm dừng (early-stopping) có thể giảm thiểu rủi ro của việc tạo sinh không chính xác do các ví dụ không biết gây ra, vì chúng thường xuất hiện ở giai đoạn sau của quá trình tinh chỉnh.

📌 Nghiên cứu chỉ ra rằng việc tinh chỉnh mô hình ngôn ngữ lớn với kiến thức mới có thể dẫn đến tạo sinh không chính xác, đặc biệt là khi mô hình học các ví dụ mang thông tin mới. Việc học từ các ví dụ có thông tin đã biết lại gắn liền với việc sử dụng hiệu quả hơn kiến thức sẵn có.

Citations:
[1] https://arxiv.org/pdf/2405.05904

Nguồn tham khảo

Thảo luận

12,345 Fans 12,345 Followers 12,345 Subscribers

Tin phổ biến

AI so sánh

OpenAI hay tự xây dựng: so sánh chi phí thực tế của việc tự lưu trữ các mô hình ngôn ngữ lớn

AI prompts

Google đã phát hành hướng dẫn 45 trang về cách viết lệnh tốt nhất cho AI Gemini

AI ảnh-video-music-âm thanh AI so sánh

Gã khổng lồ công nghệ Trung Quốc Alibaba tiết lộ công cụ video AI mới

AI pháp lý-quản trị-chủ quyền

Hãy coi chừng những chi phí tiềm ẩn của AI trước khi chúng làm phá sản sự đổi mới

AMD Disrupts AI Accelerator Market with New MI300 Offerings

Researchers from Johns Hopkins and UC Santa Cruz Unveil D-iGPT: A Groundbreaking Advance in Image-Based AI Learning

Unlocking the potential of generative AI: Three key questions for government agencies

AI giáo dục

UNESCO ra mắt 2 khung năng lực AI mới cho học sinh và giáo viên

Demystifying AI PCs: What is an NPU

The AI Frenzy, Fed Meets, Hunter Biden: Your Sunday US Briefing

TAG

AI giáo dục AI sinh-y-duoc AI nghệ thuật AI pháp lý-quản trị-chủ quyền AI models AI xã hội AI prompts AI kiến thức-khóa học AI video AI công nghiệp-lĩnh vực AI edge AI viễn thông AI tools AI chính phủ AI GPT Store AI cybersecurity AI so sánh AI đạo đức AI tips AI market AI relations AI quân sự AI an toàn-an ninh-techwar AI việc làm AGI AI doanh nghiệp AI No-Low Code OpenAI ChatGPT AI môi trường-năng lượng AI skill-talent AI & công nghệ khác AI nghiên cứu AI chips-hardware-compute AI vs con người AI coding assistant AI mở-nguồn mở AI năng suất AI startup-M&A AI tương lai AI báo chí AI data AI bản quyền AI PC AI riêng tư AI deepfake-ảo giác-ANTT AI ảnh-video-music-âm thanh AI detect-test AI minh bạch AI nhỏ AI hồi sinh AI kiếm tiền AI nông nghiệp-thực phẩm AI ngân hàng-tài chính AI giao thông AI marketing-kinh doanh AI smartphone AI robotics-auto-agents AI consumer devices AI ecosystem AI manufacturing AI benchmark Telecom AI thành công-thất bại National AI links Digital Semi-Cloud-DC-Green Cybersecurity Digital Legal HTS

SongAI

Tin nóng

Nghiên cứu tác động của việc tinh chỉnh mô hình ngôn ngữ lớn với kiến thức mới đến khả năng tạo ra câu trả lời không chính xác.

Thảo luận

Follow Us

Tin phổ biến

TAG