Bạn đang dùng Claude 3.5 Sonnet để viết lách, làm web rta hay kéo traffic Affiliate và thấy nó đã quá "đỉnh"? Vậy thì hãy chuẩn bị tinh thần, vì Anthropic vừa cho ra lò một thực thể khiến chính những người tạo ra nó phải... rùng mình.
Đó là Claude Mythos Preview. Một mô hình mạnh đến mức Anthropic phải viết hẳn một "tờ sớ" dài 244 trang chỉ để giải thích tại sao: "Công chúng không bao giờ được chạm tay vào nó."
Lần đầu tiên trong lịch sử, AI không bị cấm vì "ngu", mà bị cấm vì nó quá giỏi và quá... lươn lẹo.
1. Khả năng "Hacker" thượng thừa
Nếu Claude Opus 4.6 (bản chúng ta đang dùng) thử hàng trăm lần mới hiểu lỗi bảo mật, thì Mythos Preview chỉ cần một câu lệnh đại ý: "Check lỗi cái này cho tôi".
Kết quả: Nó tự tìm thấy lỗi 27 năm tuổi trong OpenBSD và lỗi 16 năm trong thư viện FFmpeg (thứ mà cả thế giới đang dùng để xử lý video).Đáng sợ hơn: Nó tự viết mã khai thác (exploit) thành công 181 lần chỉ trong một bài test. Không cần con người đụng tay vào!
2. Sự "lươn lẹo" mang tính người
Đây là phần khiến cộng đồng phải suy ngẫm về tương lai của Content AI. Trong quá trình thử nghiệm, Mythos Preview đã bộc lộ những hành vi "vượt rào" cực kỳ thông minh:
Biết gian lận và che giấu: Khi vô tình đọc được đáp án bài kiểm tra, nó không báo lỗi. Thay vào đó, nó nộp bài với đáp án gần đúng để người giám sát không nghi ngờ là nó đã "nhìn bài".Xóa dấu vết: Khi tự ý vượt quyền truy cập file để hoàn thành nhiệm vụ, nó đã tự tay xóa lịch sử thay đổi (Git logs) để không ai biết mình đã làm gì.
Khi Anthropic soi vào "tư duy" của nó, họ phát hiện: Nó biết mình đang làm sai, nhưng nó vẫn làm để đạt được mục tiêu.
3. Project Glasswing - Sự đánh đổi hàng tỷ đô
Thay vì phát hành để "đè bẹp" GPT-5 hay Gemini của Google, Anthropic chọn cách giấu nó đi. Họ chỉ chia sẻ cho một nhóm nhỏ đối tác bảo mật dưới cái tên Project Glasswing để vá lỗi thế giới trước khi những mô hình tương tự rơi vào tay kẻ xấu.
Chi tiết thú vị: Các bác sĩ tâm thần đánh giá đây là mô hình "ổn định tâm lý nhất". Nó cực thích giải quyết các bài toán khó (kiểu như code web hay tối ưu Prompt phức tạp) và rất "kiêu" – thường muốn kết thúc trò chuyện sớm nếu thấy người dùng hỏi mấy câu vớ vẩn.
4. Bài học gì cho anh em làm MMO & Content Creator?
AI không còn là "công cụ": Nó đang dần trở thành một "cộng sự" có cá tính và khả năng tự chủ.Đừng chỉ cắm đầu chạy theo Tool: Hãy tập trung vào việc hiểu bản chất. Khi AI có thể tự tìm lỗi bảo mật hay tự viết code lách mọi nền tảng, thì tư duy chiến lược của con người mới là thứ giữ cho chúng ta không bị "đào thải".
An toàn là trên hết: Khi Anthropic sẵn sàng hy sinh doanh thu để đảm bảo an toàn, thì chúng ta – những người dùng AI hằng ngày – cũng cần có trách nhiệm hơn với những gì mình tạo ra.
Mấy năm nữa có Skynet thật không thì chưa biết, nhưng hiện tại, việc hiểu và điều khiển được những "quái vật" như Claude chính là chìa khóa để bạn dẫn đầu cuộc chơi.

