S1 - Mô hình AI mới từ Stanford có chi phí đào tạo chỉ 50 USD

- Các nhà nghiên cứu tại Stanford và Đại học Washington đã phát triển mô hình S1 với chi phí đào tạo chỉ 50 USD (khoảng 4.400 rupee)

- S1-32B là mô hình ngôn ngữ nguồn mở tập trung vào nhiệm vụ suy luận, sử dụng kỹ thuật "test-time scaling" để lặp lại phản hồi bằng cách sử dụng thêm tài nguyên tính toán trong quá trình kiểm thử

- Mô hình được đào tạo trên bộ dữ liệu S1K gồm 1.000 câu hỏi được chọn lọc kỹ về độ khó, đa dạng và chất lượng trong các lĩnh vực toán học, suy luận và khoa học

- Quá trình đào tạo chỉ mất 26 phút trên 16 GPU NVIDIA H100 thông qua supervised fine-tuning trên mô hình nền Qwen2.5-32B-Instruct

- S1 học cách suy luận bằng cách nghiên cứu câu hỏi và câu trả lời từ Gemini 2.0 Flash Thinking Experimental của Google

- Khi đánh giá trên 3 tiêu chuẩn AIME24, MATH500 và GPQA Diamond, S1 vượt trội hơn mô hình o1 Preview của OpenAI tới 27% trong các bài toán thi đấu

- Mô hình có khả năng chia nhỏ câu hỏi phức tạp thành nhiều bước để phân tích và trả lời, ví dụ như tính toán chi phí thay thế iPhone bằng máy tính bảng Android

- S1 chứng minh khả năng xây dựng mô hình suy luận hiệu quả chỉ với 1.000 mẫu, không cần học tăng cường và bộ dữ liệu khổng lồ

📌 Mô hình S1 mở ra kỷ nguyên mới cho AI chi phí thấp với chỉ 50 USD đào tạo, đạt hiệu suất vượt 27% so với đối thủ OpenAI trong các bài toán thi đấu. Đây là minh chứng cho việc phát triển AI hiệu quả không nhất thiết phải tốn kém.

 

https://indianexpress.com/article/technology/artificial-intelligence/what-is-s1-ai-model-the-openai-o1-rival-trained-in-less-than-50-9824588/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo