Anthropic xác nhận đang thử nghiệm mô hình mới Claude Mythos (mật danh “Capybara”), được mô tả là bước nhảy vượt bậc so với các sản phẩm hiện có và đã cấp quyền truy cập cho một nhóm nhỏ người dùng sớm.
Các bản nháp nội bộ bị rò rỉ cho thấy Claude Mythos/Capybara vượt Claude Opus 4.6 trên nhiều bài kiểm tra, đặc biệt ở lập trình phần mềm, suy luận học thuật và an ninh mạng, nhưng sẽ khó phổ biến rộng vì chi phí vận hành và rủi ro.
Anthropic gọi Claude Mythos là “leapfrog improvement” so với các sản phẩm hiện tại, và cho biết mô hình đã được cung cấp cho một nhóm nhỏ người dùng sớm.
Các bản nháp nội bộ bị rò rỉ nêu Claude Mythos/Capybara vượt mô hình trước đó đạt điểm cao nhất, Claude Opus 4.6, “trên mọi mặt”. Những cải thiện nổi bật gồm: lập trình phần mềm, suy luận học thuật và các bài kiểm tra an ninh mạng.
Anthropic bị phát hiện để lại một lượng lớn nội dung chưa phát hành trong cache dữ liệu chưa công bố, bao gồm tài liệu giới thiệu mô hình và nội dung sự kiện kín.
Thông tin rò rỉ cho biết có gần 3.000 tài sản chưa phát hành, gồm bản nháp blog giới thiệu Claude Mythos/Capybara và tài liệu từ một hội nghị kín, chỉ mời, với các CEO châu Âu. Anthropic tuyên bố mô hình “vượt xa các AI khác” về tấn công và phòng thủ mạng, dự kiến triển khai đầu tiên cho các lực lượng phòng thủ an ninh mạng, đồng thời hạn chế cung cấp công khai do chi phí vận hành cao và rủi ro.


