Alibaba ra mắt AI Qwen2.5-Max vượt trội về hiệu suất, thách thức các đối thủ Mỹ

- Alibaba Cloud vừa công bố mô hình Qwen2.5-Max, đánh dấu bước đột phá AI thứ hai từ Trung quốc trong vòng chưa đầy một tuần, gây chấn động thị trường công nghệ Mỹ

- Mô hình mới vượt trội so với DeepSeek R1 trong nhiều tiêu chuẩn quan trọng:
  + Arena-Hard: đạt 89,4%
  + Kiểm tra lập luận toán học: đạt 94,5%
  + LiveCodeBench: đạt 38,7%

- Qwen2.5-Max được huấn luyện trên hơn 20 nghìn tỷ token, sử dụng kiến trúc mixture-of-experts giúp tiết kiệm tài nguyên tính toán đáng kể

- Kiến trúc hiệu quả có thể giúp doanh nghiệp giảm 40-60% chi phí cơ sở hạ tầng so với triển khai mô hình ngôn ngữ lớn truyền thống

- Thông báo này làm giảm 17% giá cổ phiếu Nvidia vào thứ Hai, gây lo ngại về vị thế dẫn đầu AI của Mỹ

- Mô hình đã có sẵn thông qua API của Alibaba Cloud, cung cấp khả năng tương tự như các mô hình hàng đầu của Mỹ với chi phí thấp hơn

- Bộ Thương mại Mỹ đã bắt đầu đánh giá cả DeepSeek và Qwen2.5-Max về tác động an ninh quốc gia

- Trong khi các công ty Mỹ tập trung vào việc mở rộng quy mô thông qua sức mạnh tính toán (OpenAI ước tính sử dụng hơn 32.000 GPU cao cấp), các công ty Trung quốc thành công nhờ đổi mới kiến trúc và sử dụng tài nguyên hiệu quả

📌 Qwen2.5-Max của Alibaba chứng minh hiệu quả vượt trội với điểm Arena-Hard 89,4% và độ chính xác lập luận toán học 94,5%, đe dọa vị thế dẫn đầu AI của Mỹ. Mô hình tiết kiệm được 40-60% chi phí hạ tầng nhờ kiến trúc mixture-of-experts đột phá.

https://venturebeat.com/ai/alibabas-qwen2-5-max-challenges-u-s-tech-giants-reshapes-enterprise-ai/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo