• Một báo cáo mới từ Legit Security chỉ ra rằng hàng trăm máy chủ xây dựng mô hình ngôn ngữ lớn (LLM) nguồn mở và hàng chục cơ sở dữ liệu vector đang rò rỉ thông tin nhạy cảm ra Internet.
• Nhà nghiên cứu Naphtali Deutsch đã quét Web tìm kiếm 2 loại dịch vụ AI nguồn mở có khả năng dễ bị tấn công: cơ sở dữ liệu vector và công cụ xây dựng ứng dụng LLM, cụ thể là chương trình nguồn mở Flowise.
• Cuộc điều tra đã phát hiện ra một lượng lớn dữ liệu cá nhân và doanh nghiệp nhạy cảm bị lộ do các tổ chức vội vàng áp dụng AI tạo sinh mà không chú ý đến vấn đề bảo mật.
• Flowise là một công cụ low-code để xây dựng các ứng dụng LLM. Nó được hỗ trợ bởi Y Combinator và có hàng chục nghìn sao trên GitHub.
• Đầu năm nay, một lỗ hổng bỏ qua xác thực trong Flowise phiên bản 1.6.2 trở xuống đã được phát hiện, được theo dõi là CVE-2024-31621 với điểm CVSS 7.6 (mức cao).
• Bằng cách khai thác CVE-2024-31621, Deutsch đã truy cập được 438 máy chủ Flowise. Bên trong có các token truy cập GitHub, khóa API OpenAI, mật khẩu và khóa API Flowise ở dạng văn bản thuần, cấu hình và lời nhắc liên quan đến ứng dụng Flowise, v.v.
• Deutsch cũng phát hiện khoảng 30 máy chủ cơ sở dữ liệu vector trực tuyến không có bất kỳ kiểm tra xác thực nào, chứa thông tin rõ ràng nhạy cảm như:
- Cuộc trò chuyện email riêng tư từ một nhà cung cấp dịch vụ kỹ thuật
- Tài liệu từ một công ty thời trang
- Thông tin PII và tài chính của khách hàng từ một công ty thiết bị công nghiệp
- Dữ liệu bất động sản, tài liệu sản phẩm và bảng dữ liệu
- Thông tin bệnh nhân được sử dụng bởi một chatbot y tế
• Cơ sở dữ liệu vector bị rò rỉ thậm chí còn nguy hiểm hơn các công cụ xây dựng LLM bị rò rỉ, vì chúng có thể bị can thiệp mà không cảnh báo cho người dùng các công cụ AI dựa vào chúng.
• Để giảm thiểu rủi ro, Deutsch khuyến nghị các tổ chức hạn chế quyền truy cập vào các dịch vụ AI họ sử dụng, giám sát và ghi nhật ký hoạt động liên quan đến các dịch vụ đó, bảo vệ dữ liệu nhạy cảm được truyền tải bởi ứng dụng LLM và luôn áp dụng các bản cập nhật phần mềm khi có thể.
📌 Hàng trăm máy chủ LLM và cơ sở dữ liệu vector đang rò rỉ dữ liệu nhạy cảm do thiếu biện pháp bảo mật. 438 máy chủ Flowise và 30 cơ sở dữ liệu vector bị truy cập trái phép, chứa thông tin như token GitHub, khóa API và dữ liệu khách hàng. Các tổ chức cần cải thiện bảo mật khi triển khai công nghệ AI.
https://www.darkreading.com/application-security/hundreds-of-llm-servers-expose-corporate-health-and-other-online-data