Cách xây dựng các mô hình ngôn ngữ lớn cho ứng dụng AI viễn thông

- Các công cụ AI tạo sinh (gen AI) như ChatGPT, Gemini hay Copilot đôi khi cho kết quả thú vị và phù hợp, nhưng cũng có lúc đưa ra những thông tin khó hiểu, không liên quan do phải xử lý khối lượng dữ liệu khổng lồ.
- Điều này đặt ra thách thức cho các giải pháp AI chuyên biệt trong ngành như công cụ AI viễn thông để lập kế hoạch hạ tầng hay tối ưu mạng lưới.
- Các chuyên gia từ AWS, IBM, McKinsey và Nokia cho rằng cần phải thu hẹp tập dữ liệu huấn luyện, tập trung vào lĩnh vực cụ thể thay vì cố gắng xây dựng LLM khổng lồ.
- Sau đó cần tiếp tục huấn luyện, cải thiện khả năng suy luận, tạo dựng sự tin tưởng và sự chấp nhận của tổ chức để đưa vào sử dụng.
- Với LLM cho AI viễn thông, "lớn hơn không phải lúc nào cũng tốt hơn".
- Vào tháng 2/2024, các công ty Deutsche Telekom, e& Group, Singtel, SK Telecom và SoftBank đã công bố liên minh Global Telco AI Alliance để phát triển các LLM chuyên biệt cho viễn thông, tập trung vào trợ lý số và chatbot.
- Bên cạnh AI viễn thông cho chính ngành viễn thông, các công ty viễn thông cũng đang tìm cách mở rộng thị phần sang các doanh nghiệp khác bằng cách bán các giải pháp mạng riêng, điện toán biên, v.v. Nokia được cho là đi đầu trong xu hướng này.

📌 Các công ty công nghệ lớn đang hợp tác để phát triển các mô hình ngôn ngữ lớn chuyên biệt cho ngành viễn thông, tập trung vào dữ liệu huấn luyện thu hẹp thay vì mở rộng quy mô. Liên minh Global Telco AI Alliance giữa 5 công ty viễn thông hàng đầu ra đời nhằm tạo ra các trợ lý số và chatbot AI cho lĩnh vực này.

Citations:
[1] https://www.rcrwireless.com/20240426/ai-ml/how-to-build-llms-for-telco-ai-applications

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo