ByteDance ra mắt Doubao-1.5-pro cạnh tranh với GPT-4o và Claude 3.5 Sonnet nhưng rẻ hơn 50 lần

- ByteDance vừa giới thiệu mô hình AI Doubao-1.5-pro với tính năng "Deep Thinking", nhằm giải quyết thách thức về chi phí cao và khả năng suy luận trong phát triển AI

- Chi phí vận hành của Doubao-1.5-pro cực kỳ cạnh tranh:
  * 0,022 USD/triệu token đầu vào đã lưu cache
  * 0,11 USD/triệu token đầu vào
  * 0,275 USD/triệu token đầu ra

- Mô hình sử dụng framework sparse Mixture-of-Experts (MoE):
  * Chỉ kích hoạt một phần tham số trong quá trình suy luận
  * 20 tỷ tham số kích hoạt cho hiệu suất tương đương mô hình 140 tỷ tham số

- Hiệu suất ấn tượng:
  * Ngang bằng GPT-4o trong các bài test suy luận
  * Vượt trội so với deepseek-v3 và llama3.1-405B trong nhiều tiêu chí đánh giá
  * Chi phí vận hành thấp hơn 5 lần so với DeepSeek và 200 lần so với OpenAI O1

- Tính năng kỹ thuật nổi bật:
  * Cửa sổ ngữ cảnh mở rộng từ 32.000 đến 256.000 token
  * Thiết kế hệ thống không đồng nhất cho các tác vụ prefill-decode và attention-FFN
  * Tối ưu hóa thông lượng và độ trễ

📌 ByteDance đã tạo bước đột phá với Doubao-1.5-pro, mô hình có chi phí thấp hơn 50 lần nhưng hiệu suất ngang GPT-4o. Với 20 tỷ tham số kích hoạt, mô hình cho hiệu năng tương đương hệ thống 140 tỷ tham số, mở ra cơ hội tiếp cận AI cho nhiều tổ chức hơn.

https://www.marktechpost.com/2025/01/25/bytedance-ai-introduces-doubao-1-5-pro-language-model-with-a-deep-thinking-mode-and-matches-gpt-4o-and-claude-3-5-sonnet-benchmarks-at-50x-cheaper/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo