Lộ thông tin mô hình mới của Anthropic mang tên “Claude Mythos” cho biết khả năng tấn công mạng mạnh nhất từ trước đến nay, khiến người trong chính công ty cũng lo lắng

動區BlockTempo

2026-03-27 07:40:34

Một sự cố do con người bên trong đã khiến cho mô hình flagship hoàn toàn mới mang mã hiệu “Claude Mythos” của Anthropic bị lộ. Công ty mô tả đây là một “bước nhảy vọt giai đoạn” trong hiệu suất AI, đồng thời cảnh báo rằng khả năng an ninh mạng của nó vượt xa bất kỳ mô hình AI hiện có nào.
(Cuộc chiến pháp lý: Thẩm phán ủng hộ Anthropic, cấm Bộ Quốc phòng Mỹ trừng phạt Claude bằng “nhãn rủi ro chuỗi cung ứng”)
(Tóm tắt bối cảnh: Báo cáo dài hàng nghìn từ về chỉ số kinh tế AI của Anthropic: Tần suất quy trình giao dịch tự động đã tăng gấp đôi, Claude đang từ công cụ biến thành trợ lý đời sống)

Mục lục bài viết

Toggle

Tầng Capybara: Cấp độ hoàn toàn mới trên Opus
Người bảo vệ đã có trước, hacker đã sử dụng
Hội nghị CEO, trang viên, các tính năng chưa phát hành

Không phải là một thông báo có chủ ý, mà là một sai sót do con người? Theo báo cáo độc quyền của 《Fortune》, Anthropic đã vô tình làm lộ gần 3,000 bài viết nội bộ chưa phát hành do lỗi trong hệ thống quản lý nội dung (CMS), khiến chúng xuất hiện trên các dữ liệu có thể tìm kiếm công khai.

Fortune đã thu thập và xem xét các bài viết nháp, phát hiện rằng Anthropic đang phát triển một mô hình flagship hoàn toàn mới có mã hiệu “Claude Mythos” (hay còn gọi là Capybara), và đã lặng lẽ mở thử nghiệm cho các khách hàng truy cập sớm.

Bài nháp viết rõ ràng:

Đây là “mô hình AI mạnh mẽ nhất mà chúng tôi đã phát triển cho đến nay, không nghi ngờ gì nữa”

Tầng Capybara: Cấp độ hoàn toàn mới trên Opus

Xét về vị trí kiến trúc, Claude Mythos không phải là phiên bản nâng cấp của Opus, mà là một tầng “Capybara” mới được thêm vào trên các cấp độ hiện có: thay thế Opus trở thành mô hình cao cấp nhất của Anthropic. Tài liệu nháp chỉ ra rằng, so với Claude Opus 4.6, mô hình mới đã có sự cải thiện đáng kể trong các bài kiểm tra về lập trình phần mềm, lý luận học thuật, an ninh mạng, v.v.

Claude hiện được chia thành ba cấp độ: Haiku (siêu rẻ), Sonnet (toàn năng cân bằng) và Opus (flagship sâu sắc)

Chi phí là một thách thức. Anthropic thừa nhận mô hình này có “chi phí thực thi cao”, chưa sẵn sàng để mở cửa cho công chúng. Chiến lược hiện tại là phát hành theo giai đoạn: trước tiên cho phép các đối tác truy cập sớm thử nghiệm, thu thập phản hồi rồi mới quyết định có mở rộng quy mô hay không.

Nguyên nhân rò rỉ là do quyền truy cập mặc định của tài sản CMS được thiết lập là công khai, nhân viên phải đánh dấu thủ công là riêng tư, một khi bỏ sót sẽ trực tiếp có thể tìm kiếm. Trong sự cố này, thông tin bị lộ không chỉ có thông tin về mô hình: còn bao gồm hồ sơ nghỉ thai sản của nhân viên, hình ảnh chưa phát hành, PDF và âm thanh. Fortune đã thông báo cho Anthropic ngay sau đó, quyền truy cập đã ngay lập tức bị đóng. Anthropic thừa nhận đây là “sai sót do con người”, nhà nghiên cứu Roy Paz của LayerX Security và nhà nghiên cứu Alexandre Pauwels từ Đại học Cambridge cũng đã hỗ trợ xem xét và xác thực tính xác thực của các tệp liên quan.

Người bảo vệ đã có trước, hacker đã sử dụng

Đáng chú ý, tài liệu nháp cảnh báo rằng các mô hình như vậy “dự báo một làn sóng sắp tới, khả năng khai thác lỗ hổng của chúng sẽ vượt xa tốc độ phản ứng của những người bảo vệ”. Chính vì vậy, chiến lược phát hành ban đầu của Mythos tập trung vào các nhà bảo vệ mạng, cho phép họ củng cố thư viện mã nguồn trước, cố gắng duy trì một khoảng thời gian đệm nhất định giữa tấn công và phòng thủ.

Lo ngại chính thức không hề vô lý. Anthropic đã ghi nhận một trường hợp có bằng chứng; một tổ chức được nhà nước Trung Quốc hỗ trợ đã sử dụng Claude Code để xâm nhập vào khoảng 30 tổ chức, bao gồm các công ty công nghệ, tổ chức tài chính và cơ quan chính phủ. Anthropic đã mất 10 ngày để điều tra vụ việc, cuối cùng đã cấm tài khoản liên quan và thông báo cho các nạn nhân. Sự cố này xảy ra trước khi Mythos chính thức bị lộ, sử dụng các công cụ Claude hiện có, không phải là mô hình thế hệ tiếp theo.

Cục diện cạnh tranh cũng đang thay đổi. GPT-5.3-Codex được OpenAI phát hành cùng thời điểm cũng được ngành công nghiệp phân loại là mô hình “có khả năng cao” về an ninh mạng, có nghĩa là ranh giới khả năng của AI tiên tiến đã tập thể vượt qua một ngưỡng mới, không còn là vấn đề của một nhà cung cấp đơn lẻ.

Hội nghị CEO, trang viên, các tính năng chưa phát hành

Tập tài liệu rò rỉ này còn kèm theo một manh mối về kế hoạch kinh doanh: Anthropic dự định tổ chức một hội nghị kín kéo dài hai ngày tại một trang viên thế kỷ 18 ở vùng nông thôn nước Anh, mời “các lãnh đạo doanh nghiệp có ảnh hưởng nhất châu Âu”, CEO Dario Amodei sẽ tham dự, các đại biểu sẽ trải nghiệm các tính năng Claude chưa được công bố ra ngoài".

Chi tiết của hội nghị này đã bị lộ một cách bất ngờ, phản ánh rằng Anthropic đang tăng tốc thâm nhập vào thị trường thương mại châu Âu, và Mythos rất có thể là quân bài cốt lõi trong buổi trình diễn kín đó.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bình luận

0/400

Không có bình luận