Các nhà nghiên cứu Hugging Face đang cố gắng xây dựng một phiên bản mở hơn của mô hình 'lý luận' AI của DeepSeek

- Hugging Face đang nỗ lực xây dựng phiên bản nguồn mở của mô hình AI lập luận R1 của DeepSeek, chỉ một tuần sau khi DeepSeek phát hành mô hình này

- Dự án Open-R1 được dẫn dắt bởi Leandro von Werra (trưởng nhóm nghiên cứu Hugging Face) cùng nhiều kỹ sư, với mục tiêu tạo bản sao hoàn chỉnh của R1 và công khai mọi thành phần

- DeepSeek, phòng thí nghiệm AI Trung quốc, phát hành R1 với hiệu suất ngang bằng và vượt trội so với mô hình lập luận o1 của OpenAI trong nhiều tiêu chuẩn đánh giá

- Mô hình R1 có khả năng tự kiểm tra sự thật, giúp tránh được các lỗi thường gặp. Mặc dù tốn nhiều thời gian xử lý hơn (từ vài giây đến vài phút) nhưng độ tin cậy cao hơn trong các lĩnh vực vật lý, khoa học và toán học

- Ứng dụng chatbot của DeepSeek sử dụng R1 đã vươn lên dẫn đầu bảng xếp hạng App Store của Apple

- Hugging Face sử dụng Science Cluster với 768 GPU Nvidia H100 để tạo các bộ dữ liệu tương tự DeepSeek

- Dự án Open-R1 nhận được sự quan tâm lớn từ cộng đồng với 10.000 star trên GitHub chỉ trong 3 ngày

- Elie Bakouch, kỹ sư Hugging Face, nhấn mạnh tầm quan trọng của việc kiểm soát bộ dữ liệu và quy trình để triển khai mô hình một cách có trách nhiệm

- Mục tiêu của dự án là hoàn thành trong vài tuần, tạo nền tảng cho thế hệ mô hình lập luận nguồn mở tiếp theo

📌 Hugging Face khởi động dự án Open-R1 với 768 GPU Nvidia H100, nhắm tới việc tạo bản sao nguồn mở của mô hình AI lập luận R1 trong vài tuần. Dự án thu hút 10.000 star trên GitHub sau 3 ngày, hứa hẹn mở ra kỷ nguyên mới cho phát triển AI nguồn mở.

https://techcrunch.com/2025/01/28/hugging-face-researchers-are-trying-to-build-a-more-open-version-of-deepseeks-ai-reasoning-model/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo