DeepSeek-V2.5 trở thành mô hình AI nguồn mở hàng đầu mới

• DeepSeek, công ty con AI của quỹ đầu cơ High-Flyer Capital Management (Trung Quốc), vừa ra mắt mô hình DeepSeek-V2.5 vào ngày 6/9/2024.

DeepSeek-V2.5 kết hợp khả năng xử lý ngôn ngữ tổng quát và lập trình trong một mô hình duy nhất, là phiên bản nâng cấp từ DeepSeek-V2-0628 và DeepSeek-Coder-V2-0724.

• Mô hình này hiện đã có mặt trên Hugging Face, cho phép truy cập qua web và API.

• Theo đánh giá của các nhà nghiên cứu độc lập, DeepSeek-V2.5 được coi là mô hình ngôn ngữ lớn (LLM) tiên tiến nhất hiện có trong lĩnh vực nguồn mở.

• DeepSeek-V2.5 vượt trội trong nhiều tiêu chuẩn đánh giá quan trọng:
- AlpacaEval 2.0: Độ chính xác tổng thể 50,5 (so với 46,6 của DeepSeek-V2-0628 và 44,5 của DeepSeek-Coder-V2-0724)
- ArenaHard: Độ chính xác 76,2 (so với 68,3 và 66,3 của các phiên bản trước)
- HumanEval Python: Đạt điểm 89, thể hiện khả năng lập trình vượt trội

Mô hình này còn vượt qua GPT-4o mini và ChatGPT-4o-latest trong đánh giá tiếng Trung nội bộ.

• Theo Shin Megami Boson, một chuyên gia AI, DeepSeek-V2.5 vượt trội hơn Meta's Llama 3-70B Instruct và Llama 3.1-405B Instruct trong bài kiểm tra riêng mô phỏng Graduate-Level Google-Proof Q&A Benchmark (GPQA).

• DeepSeek-V2.5 được phát hành dưới dạng nguồn mở trên Hugging Face với giấy phép biến thể của MIT, cho phép sử dụng miễn phí và thương mại hóa với một số điều kiện nhất định.

Để chạy DeepSeek-V2.5 cục bộ, người dùng cần thiết lập định dạng BF16 với GPU 80GB (8 GPU để tận dụng tối đa).

• Mô hình sử dụng kiến trúc Multi-Head Latent Attention (MLA) giúp giảm bộ nhớ đệm KV, cải thiện tốc độ suy luận mà không ảnh hưởng đến hiệu suất.

📌 DeepSeek-V2.5 đặt ra tiêu chuẩn mới cho mô hình AI nguồn mở, kết hợp xử lý ngôn ngữ và lập trình. Với hiệu suất vượt trội trong nhiều tiêu chuẩn đánh giá, mô hình này mở ra cơ hội ứng dụng AI tiên tiến cho doanh nghiệp và nhà phát triển, đồng thời thúc đẩy nghiên cứu và phát triển trong lĩnh vực AI.

https://venturebeat.com/ai/deepseek-v2-5-wins-praise-as-the-new-true-open-source-ai-model-leader/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo