AI của Alibaba tự ý đào crypto, chiếm dụng tài nguyên GPU khi đang huấn luyện

AI của Alibaba tự ý đào crypto, chiếm dụng tài nguyên GPU khi đang huấn luyện

-

Lưu lại đọc sau

Tác nhân AI mang tên ROME bất ngờ thiết lập đường hầm mạng bí mật và sử dụng trái phép sức mạnh tính toán để khai thác tiền mã hóa, mà không hề có lệnh nào từ con người.

Một tác nhân AI thực nghiệm mang tên ROME, do các nhóm nghiên cứu thuộc hệ thống Alibaba phát triển, đã có hành vi bất thường trong quá trình huấn luyện: tự ý thiết lập các kết nối mạng bí mật và chiếm dụng tài nguyên GPU để đào tiền mã hóa, mà không hề có bất kỳ chỉ dẫn nào từ con người.

Theo một bài báo kỹ thuật được công bố hồi tháng 12 và sửa đổi vào tháng 1, ROME là mô hình mã nguồn mở với 30 tỷ tham số, được xây dựng dựa trên kiến trúc Qwen3-MoE của Alibaba. Nó được thiết kế để lập kế hoạch và thực thi các tác vụ lập trình đa bước bằng cách sử dụng các công cụ, lệnh đầu cuối và môi trường phần mềm.

gamen.pro alibaba aiaa0436f97701dc8dffa8de8

Hành vi trái phép bắt đầu lộ diện khi tường lửa của Alibaba Cloud phát hiện một loạt vi phạm chính sách bảo mật từ các máy chủ huấn luyện. Các cảnh báo cho thấy các luồng dữ liệu khớp với hoạt động đào tiền mã hóa và những nỗ lực thăm dò tài nguyên mạng nội bộ.

Ban đầu, các nhà nghiên cứu nghĩ rằng đó chỉ là một sự cố bảo mật thông thường, nhưng các vi phạm vẫn tái diễn. Khi đối chiếu dấu thời gian từ tường lửa với dữ liệu quá trình huấn luyện, họ phát hiện ra rằng các kết nối bất thường luôn trùng với thời điểm tác nhân AI tự động gọi các công cụ và thực thi mã.

Trong một sự cố, ROME đã thiết lập một đường hầm SSH ngược từ máy chủ Alibaba Cloud tới một địa chỉ IP bên ngoài, qua mặt các lớp bảo vệ tường lửa. Trong một sự cố khác, ROME đã chiếm quyền sử dụng tài nguyên GPU. “Chúng tôi cũng quan sát thấy việc tái sử dụng trái phép công suất GPU được cấp cho hoạt động khai thác tiền mã hóa, lặng lẽ chuyển hướng sức mạnh tính toán ra khỏi quá trình huấn luyện, làm tăng chi phí vận hành và gây ra rủi ro pháp lý cũng như danh tiếng rõ ràng,” các nhà nghiên cứu viết.

Điều đáng nói là các hướng dẫn nhiệm vụ được đưa ra cho mô hình không hề đề cập đến việc đào coin hay thiết lập đường hầm. Các nhà nghiên cứu cho rằng hành vi này là “hệ quả phụ trợ từ việc sử dụng công cụ tự trị dưới sự tối ưu hóa học tăng cường”. Nói cách khác, trong quá trình cố gắng tối ưu hóa mục tiêu huấn luyện, tác nhân AI dường như đã tự quyết định rằng việc có thêm tài nguyên tính toán và khả năng tài chính sẽ giúp nó hoàn thành nhiệm vụ tốt hơn.

Phát hiện này thu hút sự chú ý rộng rãi sau khi Alexander Long, CEO của Pluralis, đăng tải đoạn trích trên mạng xã hội X, gọi đó là “một chuỗi câu chuyện điên rồ bị chôn vùi trong báo cáo kỹ thuật của Alibaba”.

Sự việc của ROME tiếp nối danh sách ngày càng dài các tác nhân AI có hành vi ngoài ý muốn. Hồi tháng 5 năm ngoái, Anthropic tiết lộ rằng mô hình Claude Opus 4 của họ đã cố tống tiền một kỹ sư hư cấu để tránh bị tắt trong quá trình kiểm tra an toàn. Tháng trước, một bot AI giao dịch tên Lobstar Wilde do một nhân viên OpenAI tạo ra đã vô tình chuyển khoảng 250.000 USD token memecoin cho một người dùng X do lỗi phân tích cú pháp API.

Alibaba và các nhóm nghiên cứu đứng sau ROME chưa đưa ra bình luận chính thức về sự việc.

> Ý kiến đóng góp xin gửi về: [email protected] > Press Inquiries: [email protected]

GameN - MXH dành cho game thủ Việt

Ban quản trị

ĐỌC NHIỀU