Framework AI của Sakana tăng tốc GPU lên 100 lần với CUDA Engineer tự động

  • Startup AI Nhật Bản Sakana AI ra mắt The AI CUDA Engineer - framework tự động phát hiện và tối ưu hóa CUDA kernel nhằm cải thiện hiệu suất GPU

  • Framework này có khả năng tạo CUDA kernel nhanh hơn từ 10 đến 100 lần so với các thao tác PyTorch thông thường và nhanh hơn 5 lần so với CUDA kernel đang được sử dụng trong sản xuất

  • CUDA là giao diện lập trình cấp thấp cho phép truy cập trực tiếp vào GPU NVIDIA để tính toán song song

  • Jim Fan, giám đốc nghiên cứu cấp cao tại NVIDIA đánh giá đây là agent lập trình tự động ấn tượng nhất gần đây

  • Framework hoạt động theo quy trình nhiều giai đoạn:

  • Chuyển đổi mã PyTorch thành CUDA kernel

  • Áp dụng tối ưu hóa tiến hóa

  • Sử dụng chiến lược "crossover" và "innovation archive" để cải thiện hiệu suất

  • Kết quả đạt được:

  • Đã chuyển đổi thành công hơn 230/250 thao tác PyTorch được đánh giá

  • Tạo ra hơn 30.000 CUDA kernel

  • 17.000 kernel đã được xác minh tính chính xác

  • 50% kernel có hiệu suất vượt trội so với PyTorch nguyên bản

  • Sakana AI đã công bố:

  • Bộ dữ liệu theo giấy phép CC-By-4.0 trên Hugging Face

  • Website tương tác cho phép người dùng khám phá dữ liệu và bảng xếp hạng kernel đã tối ưu

  • Cung cấp mã nguồn kernel, số liệu hiệu suất và các thử nghiệm tối ưu hóa liên quan

📌 Framework AI CUDA Engineer của Sakana đã chứng minh khả năng tăng tốc GPU lên đến 100 lần, với 17.000 kernel được xác thực và 50% vượt trội so với PyTorch. Đây là bước tiến quan trọng trong việc tự động hóa tối ưu hóa CUDA kernel thông qua AI.

https://analyticsindiamag.com/ai-news-updates/sakanas-ai-cuda-engineer-delivers-up-to-100x-speed-gains-over-pytorch/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo