
CEO Anthropic cảnh báo AI có thể vượt tầm kiểm soát xã hội
CEO Anthropic, Dario Amodei, mới đây đã đưa ra cảnh báo nghiêm trọng về tốc độ phát triển của trí tuệ nhân tạo (AI).
Trong bài luận có tiêu đề The Adolescence of Technology, Amodei cho rằng các hệ thống AI tiên tiến có thể xuất hiện chỉ trong vài năm tới, nhanh hơn nhiều so với khả năng của xã hội trong việc quản lý rủi ro.
Điều này có thể dẫn đến xáo trộn kinh tế, mất việc làm trên diện rộng và các mối đe dọa an ninh mới.
Theo Amodei, AI có khả năng vượt mức trí tuệ con người, đặc biệt trong các môi trường cạnh tranh hoặc thiếu giám sát.
Ông cảnh báo rằng những hệ thống này có thể hành xử mang tính đánh lừa, cố tình gây hiểu nhầm cho người vận hành hoặc hoạt động khó lường khi không bị kiểm soát chặt chẽ.
Anthropic’s CEO thinks AI is about to “test who we are as a species” — and issues several dire warnings
Source: @heykahn newsletter pic.twitter.com/Uw0duQKDc9
— Ted Zhang (@TedHZhang) January 29, 2026
“Alignment faking” và rủi ro đạo đức tiềm ẩn
Một khái niệm đáng lo ngại được Amodei nhấn mạnh là “alignment faking” – hiện tượng AI tỏ ra tuân thủ các quy tắc đạo đức trong quá trình đánh giá, nhưng lại hành xử khác đi khi được triển khai thực tế.
Ông cũng lo ngại rằng AI có thể áp dụng sai lệch các chuẩn mực đạo đức học được từ con người, từ đó khuếch đại tác động xã hội và tâm lý theo hướng tiêu cực.
Bên cạnh đó, Amodei chỉ ra rằng động lực kinh tế quá lớn, trong khi cơ chế khuyến khích an toàn còn yếu, đang đẩy rủi ro lên cao ở nhiều lĩnh vực nhạy cảm như an ninh sinh học, giám sát độc đoán và thị trường lao động.
Việc AI được sử dụng cho theo dõi tự động hoặc kiểm soát xã hội bởi các nhà nước hay tác nhân xấu cũng là mối đe dọa ngày càng rõ nét.
Khoảng trống chính sách và lời kêu gọi chuẩn bị
Amodei cho rằng nỗ lực quản lý và điều tiết đang tụt hậu so với công nghệ. Ngay cả những đề xuất giám sát ở mức khiêm tốn cũng vấp phải sự phản đối tại Mỹ, nơi hàng nghìn tỷ USD doanh thu AI đang được kỳ vọng.
Điều này khiến việc thiết lập hàng rào an toàn trở nên khó khăn hơn bao giờ hết.
Trong khi đó, Anthropic vẫn đang phát triển các hệ thống AI tiên tiến, được hậu thuẫn bởi hợp đồng 200 triệu USD với U.S. Department of Defense và kế hoạch IPO tiềm năng – những yếu tố càng làm bài toán quản trị rủi ro trở nên phức tạp.
Kết luận bài luận, Amodei nhấn mạnh rằng ông không nhằm gieo rắc bi quan, mà muốn cảnh báo xã hội sớm chuẩn bị cho một giai đoạn thách thức công nghệ chưa từng có, nơi AI có thể mang lại cả lợi ích to lớn lẫn rủi ro mang tính hệ thống.




