- Các công ty đang chi hàng chục triệu USD để huấn luyện các hệ thống AI nhằm cải thiện hoạt động kinh doanh hoặc tạo ra các dịch vụ mới. Chi phí có thể lên tới hàng triệu USD để chuyển các mô hình đã huấn luyện giữa các data center và môi trường đám mây để kiểm thử và xác thực thêm.
- Các tổ chức đang gặp khó khăn trong việc triển khai các mô hình AI đòi hỏi nhiều tài nguyên tính toán. Đơn giản hóa, mở rộng quy mô và tốc độ triển khai là những ưu điểm lớn của public cloud, nhưng các vấn đề về quy định, hiệu năng, độ trễ và chi phí đang khiến một số triển khai đám mây trở nên kém hấp dẫn.
- Các mô hình ngôn ngữ lớn (LLM) ngày nay có kích thước gấp 10 lần so với vài năm trước và sử dụng tới 100 lần tài nguyên tính toán. Chúng xử lý hàng tỷ hoặc thậm chí hàng nghìn tỷ tham số để huấn luyện các mô hình AI tạo ra các phản hồi và dự đoán cực kỳ tinh vi, chính xác trong thời gian thực.
- Các sáng kiến AI đang thúc đẩy nhu cầu về một loại cơ sở hạ tầng mới cung cấp khả năng tính toán tăng tốc. Các ứng dụng này đòi hỏi cơ sở hạ tầng chạy nhanh hơn, lớn hơn và an toàn hơn, với hiệu suất năng lượng cao ở mọi quy mô.
- Các public cloud cung cấp quyền truy cập tức thì vào tài nguyên, khả năng nhanh chóng tạo và hủy môi trường phát triển, khả năng mở rộng linh hoạt. Chúng cũng cung cấp nhiều công nghệ mới dựa trên Kubernetes, container và các tùy chọn khác tạo điều kiện cho phát triển và quản lý ứng dụng hiện đại.
- Các nhà cung cấp GPU cloud như AWS Lambda, Scaleway hay CoreWeave cung cấp GPU và tài nguyên full-stack mạnh mẽ theo nhu cầu để đáp ứng tăng trưởng nhanh hoặc sử dụng biến động. Họ tuyên bố cung cấp hiệu năng nhanh hơn nhiều, độ trễ và chi phí thấp hơn so với các đám mây hyperscale lớn hơn.
- Tuy nhiên, hơn 80% tổ chức dự kiến sẽ chuyển một số tài nguyên tính toán và lưu trữ trở lại môi trường private cloud hoặc non-cloud. 93% lãnh đạo CNTT đã tham gia vào một số loại dự án hồi hương đám mây trong 3 năm qua.
- Việc di chuyển dữ liệu vào và ra khỏi hybrid cloud có thể dẫn đến các khoản phí egress khá lớn. 42% tổ chức gần đây đã chuyển các ứng dụng sản xuất của họ từ đám mây do chi phí. Các sáng kiến AI có thể làm gia tăng mối lo ngại về chi phí đám mây.
- Tốc độ không được ấn tượng khi dữ liệu di chuyển từ đám mây trở lại data center on-premises hoặc colocation. Một số ứng dụng không thể chịu được độ trễ như vậy.
- Các tổ chức triển khai các ứng dụng cực kỳ nhạy cảm với độ trễ (LLM, GenAI, tài chính, hàng không vũ trụ, lái xe tự động hoặc khoa học đời sống) có thể thấy mức độ dịch vụ on-premises hoặc colocation dễ đoán và hiệu quả hơn.
- Các máy chủ dựa trên GPU, hệ thống tệp song song và mạng cáp quang có sẵn tại chỗ, các tổ chức muốn duy trì quyền kiểm soát tại chỗ đối với dữ liệu nhạy cảm của họ có thể đáp ứng hoặc vượt qua quy mô và tốc độ đám mây. Họ cũng có thể đáp ứng các yêu cầu tuân thủ và chủ quyền dữ liệu hiệu quả hơn về chi phí.
📌 Sự bùng nổ của AI đang thúc đẩy nhu cầu về cơ sở hạ tầng đám mây mới với hiệu năng cao, khả năng mở rộng lớn và bảo mật tốt hơn. Tuy public cloud và GPU cloud đang phát triển mạnh để đáp ứng nhu cầu này, nhiều tổ chức vẫn đang xem xét việc chuyển một phần tải công việc AI trở lại môi trường on-premises hoặc colocation do lo ngại về chi phí, hiệu năng, quy định và chủ quyền dữ liệu. Xu hướng này có thể định hình lại cục diện cạnh tranh giữa các mô hình triển khai đám mây trong thời gian tới.
https://www.forbes.com/sites/forbestechcouncil/2024/06/17/ai-is-accelerating-the-demand-for-cloud-but-which-type/