DeepSeek R1 tạo đột phá trong công nghệ AI với chi phí chỉ bằng 3% OpenAI

- DeepSeek R1 ra mắt vào thứ hai, đạt hiệu suất ngang bằng OpenAI o1 với chi phí chỉ 3-5%, thu hút 109.000 lượt tải về trên HuggingFace

- Tính năng tìm kiếm của DeepSeek vượt trội hơn OpenAI và Perplexity, chỉ đứng sau Google Gemini Deep Research

- DeepSeek là công ty spin-off từ quỹ đầu tư High-Flyer Quant của Trung Quốc vào năm 2023

- Công ty sở hữu hơn 10.000 GPU Nvidia và mở rộng lên 50.000 GPU, nhỏ hơn nhiều so với 500.000 GPU của các đối thủ như OpenAI, Google và Anthropic

- Chi phí đào tạo mô hình cơ sở V3 là 5,58 triệu USD trong 2 tháng

- Đột phá chính: Bỏ qua quy trình supervised fine-tuning (SFT) truyền thống, tập trung vào học tăng cường thuần túy

- Mô hình trung gian DeepSeek-R1-Zero phát triển khả năng tự suy luận và phân bổ thời gian xử lý dựa trên độ phức tạp của vấn đề

- Phiên bản cuối cùng DeepSeek-R1 kết hợp một lượng nhỏ SFT để khắc phục các vấn đề về khả năng đọc và trộn ngôn ngữ

- ByteDance cũng vừa công bố Doubao-1.5-pro với chế độ "Deep Thinking" vượt trội hơn OpenAI o1 trên AIME benchmark

- Dự án Stargate 500 tỷ USD của OpenAI đang bị đặt câu hỏi về khả năng sinh lời khi DeepSeek chứng minh có thể đạt hiệu suất tương đương với chi phí thấp hơn nhiều

📌 DeepSeek R1 tạo bước ngoặt trong phát triển AI với chi phí chỉ bằng 3-5% OpenAI thông qua phương pháp học tăng cường thuần túy, thu hút 109.000 lượt tải về và thách thức chiến lược đầu tư 500 tỷ USD của OpenAI vào dự án Stargate.

https://venturebeat.com/ai/deepseek-r1s-bold-bet-on-reinforcement-learning-how-it-outpaced-openai-at-3-of-the-cost/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo