Các công ty AI Trung Quốc, làm thế nào để 「sao chép bài tập của Claude Code」?

Question

Nguồn: Cổng tin tức Geek ParkTác giả: Thụ Lâm Vũ Vương Nếu vài ngày trước có người nói với tôi rằng Anthropic—đơn vị được xem là “coi trọng nhất về AI an toàn”—trong vòng một tuần lại liên tiếp rò rỉ hai lần các bí mật cốt lõi, thì có lẽ tôi sẽ nghĩ đó là một giai thoại ngày Cá tháng Tư. Nhưng chuyện đó lại đúng vào ngày ngay trước Cá tháng Tư. Ngày 31 tháng 3, nhà nghiên cứu bảo mật Chaofan Shou phát hiện rằng trong phiên bản Claude Code 2.1.88 mà Anthropic đăng tải trên npm, có nhét một tệp source map nặng 59.8MB. Tệp lẽ ra chỉ dùng cho gỡ lỗi nội bộ lại trỏ đến một gói zip trong chính bucket lưu trữ Cloudflare R2 của Anthropic—bên trong là mã nguồn TypeScript hoàn chỉnh của Claude Code, khoảng 1900 tệp, 512.000 dòng code. Trong vài giờ, trên GitHub đã xuất hiện nhiều kho lưu trữ mirror. Một trong số đó là dự án tên “claw-code”, trong vòng hai giờ đã “lấy” 50.000 sao, trở thành kho có tốc độ tăng sao nhanh nhất trong lịch sử GitHub. Số lượt fork vượt 41.500. Và đúng 5 ngày trước đó, Anthropic vừa rò rỉ sự tồn tại của mô hình thế hệ tiếp theo “Mythos” do một bộ nhớ đệm dữ liệu công khai không được bảo vệ—một mô hình mới được mô tả nội bộ là “bước nhảy về năng lực”, trong mảng năng lực an ninh mạng “vượt xa mọi mô hình AI hiện có”. Rò rỉ hai lần trong một tuần. Một công ty nói về bảo mật lại bị tát thẳng vào mặt bởi chính vấn đề bảo mật của mình. Đánh giá của cộng đồng nhà phát triển khá đồng nhất—“châm biếm mà không giống thật”. Nhưng dù là châm biếm, thì những thứ bị lộ ra là thật sự có giá trị. Vấn đề quan trọng hơn là: một công ty AI nên tận dụng “lần rò rỉ” này để sao chép (lấy bài) như thế nào?01 Trong “vỏ” Claude Code có gì? Nhiều người phản ứng đầu tiên rằng: Claude Code chẳng phải chỉ là một công cụ dòng lệnh bọc API của mô hình đó sao? Lộ mã nguồn thì có sao; không có trọng số mô hình, các đoạn code này bất quá chỉ là “một cái vỏ”. Nhận định đó đúng một nửa. Claude Code đúng là một cái vỏ, nhưng là một cái vỏ tinh xảo đến mức khiến người ta bất ngờ. Trước hết hãy xem hệ thống công cụ (tool system). Claude Code áp dụng kiến trúc tương tự plugin: mỗi loại năng lực—đọc/ghi tệp, thực thi shell, trích xuất web, tích hợp LSP—đều là một mô-đun công cụ độc lập, có kiểm soát quyền hạn. Chỉ riêng lớp định nghĩa công cụ đã có 29.000 dòng TypeScript. Mỗi mô tả công cụ không chỉ là một câu ngắn, mà chi tiết đến mức chỉ cho mô hình “khi nào nên dùng công cụ này, dùng như thế nào, sau khi dùng thì kỳ vọng điều gì sẽ xảy ra”. Bản thân các mô tả này đã là một dạng prompt engineering được tinh chỉnh công phu. Tiếp theo là hệ thống trí nhớ. Mã nguồn bị rò rỉ cho thấy một kiến trúc “trí nhớ tự vá” ba tầng. Tầng thấp nhất là MEMORY.md, một tệp chỉ mục nhẹ, mỗi dòng khoảng 150 ký tự, luôn được nạp trong ngữ cảnh. Kiến thức dự án cụ thể được phân tán trong các “tệp chủ đề” và chỉ được nạp khi cần. Toàn bộ lịch sử hội thoại gốc sẽ không bao giờ được đọc lại toàn bộ vào ngữ cảnh; chỉ khi cần thiết mới truy xuất các mã định danh cụ thể thông qua grep. Nói cách khác, thứ mà các kỹ sư của Anthropic đã tốn rất nhiều thời gian để giải quyết không phải là “cách gọi API”, mà là “làm thế nào để trong một cửa sổ ngữ cảnh hữu hạn, mô hình có thể làm việc thông minh nhất có thể”. Rồi đến thứ khiến ai cũng hào hứng: KAIROS. Chức năng này được đặt tên theo tiếng Hy Lạp cổ “khoảnh khắc thích hợp”, và trong mã nguồn được nhắc đến hơn 150 lần. Nó là một kiểu tiến trình bảo vệ tự chủ, để Claude Code chạy như một proxy nền always-on liên tục. Điều thú vị hơn nữa là logic “autoDream” của nó—khi người dùng rảnh, proxy sẽ tiến hành “tích hợp trí nhớ”, hợp nhất các quan sát rời rạc, loại bỏ mâu thuẫn logic, và chuyển các phán đoán mơ hồ thành các sự kiện mang tính xác định. Nói cách khác, Anthropic đang biến trợ lý lập trình AI từ công cụ “bạn hỏi tôi trả lời” thành một cộng tác viên “liên tục hiểu dự án của bạn, chủ động phát hiện vấn đề”. Ngoài ra, mã nguồn bị rò rỉ còn bao gồm 44 feature flag chưa được tung ra, bao phủ các chế độ phối hợp đa tác nhân (COORDINATOR MODE), tương tác bằng giọng nói (VOICE_MODE), các phiên lập kế hoạch từ xa 30 phút (ULTRAPLAN), thậm chí còn có một thú cưng kiểu “tạt bá” cho terminal (BUDDY) với 18 loài và các cấp độ hiếm. Còn hai chi tiết đáng nói. Một là “frustration regex”—một đoạn biểu thức chính quy dùng để phát hiện liệu người dùng có đang mắng Claude hay không. Dùng regex để suy đoán cảm xúc người dùng sẽ nhanh và rẻ hơn rất nhiều so với việc dùng suy luận mô hình. Một chi tiết khác là “undercover mode”; Anthropic dùng Claude Code để “đóng góp ẩn danh” cho các dự án mã nguồn mở công khai, và trong prompt hệ thống có ghi rõ: “Bạn đang chạy ở UNDERCOVER mode… thông tin commit của bạn không được chứa bất kỳ thông tin nội bộ nào của Anthropic. Đừng để lộ danh tính.”02 Công ty AI ở Trung Quốc có thể học được gì Bây giờ quay lại câu hỏi thực sự quan trọng. Trong năm qua, mảng công cụ lập trình AI của Trung Quốc đã tăng tốc rõ rệt. Trae của ByteDance đã tiến hóa từ MarsCode ban đầu thành một IDE AI-native, tích hợp chế độ Agent, hỗ trợ tự động hóa toàn bộ quy trình từ hiểu yêu cầu đến viết code rồi đến kiểm thử. CodeGeeX của Zhipu thì mở mã nguồn và triển khai tại chỗ, tối ưu sâu cho việc hiểu code tiếng Trung. Bộ đôi Tongyi—ling mã, và cả đậu-bánh MarsCode cũng đang lặp nhanh từng bước. Nhưng nếu đem các sản phẩm này đối chiếu với kiến trúc mà Claude Code bị rò rỉ, thì khoảng cách không nằm ở việc “có dùng được hay không”, mà nằm ở độ tinh xảo trong mặt kỹ thuật (engineering). Bài học thứ nhất: mô tả công cụ chính là sức mạnh sản phẩm. Có lẽ đây là điều dễ bị bỏ qua nhất, và cũng đáng để học nhất. Claude Code đã tinh chỉnh cực kỳ kỹ lưỡng phần mô tả prompt cho từng công cụ—khi nào dùng, khi nào không dùng, sau khi dùng thì xử lý kết quả ra sao, nếu lỗi thì thử lại thế nào. Về bản chất, các mô tả này đang dạy mô hình “cách làm một lập trình viên giỏi”. Nhiều công cụ trong nước hiện vẫn đang dừng ở giai đoạn “đưa cho mô hình một chữ ký hàm (function signature) để nó tự đoán cách dùng”. Chỉ riêng việc viết mô tả công cụ đạt đến mức của Claude Code đã có thể làm cho hiệu suất của cùng một mô hình tăng lên một bậc. Bài học thứ hai: kiến trúc trí nhớ—quan trọng đối với trải nghiệm người dùng hơn cả tham số mô hình. Hệ thống trí nhớ ba tầng của Claude Code giải quyết một vấn đề rất hiện thực—cửa sổ ngữ cảnh của mô hình là hữu hạn, bạn không thể nhét toàn bộ lịch sử hội thoại vào đó. Cách làm của Anthropic là phân tầng trí nhớ—dữ liệu nóng luôn trực tuyến, dữ liệu ấm nạp theo nhu cầu, còn dữ liệu lạnh chỉ làm chỉ mục. Cách nghĩ này không hề mới, nhưng trong các công cụ lập trình AI, phần hiện thực engineering ở các đội trong nước đa phần vẫn chưa đạt đến độ tinh xảo như vậy. Bài học thứ ba: nhận biết cảm xúc không phải huyền học, mà là bài toán kỹ thuật. Dùng một đoạn biểu thức chính quy để kiểm tra xem người dùng có đang phát cáu hay không, rồi điều chỉnh chiến lược phản hồi. Giải pháp này đơn giản đến thô bạo, nhưng lại cực kỳ hữu dụng. Nó nói với bạn một chân lý—một sản phẩm AI tốt không phải vấn đề nào cũng cần dùng mô hình để giải quyết; đôi khi chỉ cần regex là đủ. Các đội làm công cụ AI ở Trung Quốc thường rơi vào quán tính suy nghĩ “mọi vấn đề đều giao cho mô hình lớn”. Đây là một sự lãng phí. Bài học thứ tư: hướng đi mà KAIROS chỉ ra còn quan trọng hơn bản thân KAIROS. Một proxy nền always-on, tự động sắp xếp trí nhớ và phát hiện vấn đề khi người dùng không dùng. Hướng sản phẩm này đồng nghĩa với việc bước tiếp theo của trợ lý lập trình AI không phải “trả lời nhanh hơn”, mà là “khi bạn chưa hỏi thì nó đã đang làm việc”. Hiện tại, hầu như mọi công cụ lập trình AI trong nước đều mang tính đáp ứng (reactive)—người dùng ra lệnh, công cụ thực thi. Ai làm trước được chế độ tiến trình giám hộ (guardia n/daemon), thì người đó có thể định nghĩa hình thái sản phẩm thế hệ tiếp theo.03 Ranh giới của việc “sao chép” ở đâu Tất nhiên, giữa học hỏi và đạo (sao chép) vẫn có một đường ranh giới. Về pháp lý, đây không phải mã nguồn mở mà là phần mềm thương mại bị rò rỉ ngoài ý muốn. Xây dựng sản phẩm trực tiếp dựa trên mã nguồn bị rò rỉ thì rủi ro bản quyền là rõ ràng. Trên GitHub, “claw-code” tuyên bố sẽ dùng Rust viết lại, nhưng nếu lõi logic vẫn sao chép y nguyên, thì ranh giới pháp lý vẫn mù mờ. Với các công ty ở Trung Quốc, trong bối cảnh áp lực xuất khẩu (ra thị trường quốc tế) ngày càng lớn, những rủi ro kiểu này cần được đánh giá nghiêm túc. Về mặt kỹ thuật, nhiều quyết định thiết kế của Claude Code được tùy biến sâu cho năng lực của mô hình Claude. Ví dụ, phần mô tả công cụ viết dài và chi tiết đến vậy là vì năng lực xử lý ngữ cảnh dài của Claude đủ mạnh, không bị “lơ ngơ” do prompt hệ thống quá dài. Nếu chuyển sang một mô hình có cửa sổ ngữ cảnh ngắn và khả năng tuân lệnh yếu, việc chép nguyên chiến lược prompt đó có thể phản tác dụng. Cách làm thật sự thông minh không phải là fork 510.000 dòng code này, mà là hiểu từng quyết định thiết kế chứa đựng tradeoff gì, rồi triển khai lại phù hợp với đặc điểm mô hình của riêng mình. Có thể học ý tưởng kiến trúc, có thể học mô hình biên soạn/công cụ (tool orchestration), có thể học chiến lược phân tầng trí nhớ—nhưng việc hiện thực hóa phải là của chính bạn. Còn một thực tế dễ bị bỏ qua—Anthropic rò rỉ một bản snapshot, trong khi đội ngũ kỹ thuật của họ mỗi ngày đều đang lặp tiến (iterate). 44 feature flag nghĩa là tối thiểu có cả chục tính năng lớn đang xếp hàng chờ để được đưa lên. Code bạn fork hôm nay, tháng sau đã là phiên bản cũ. Chạy theo mà sao chép mãi mãi không theo kịp; chỉ khi hiểu được nguyên lý, bạn mới có thể chạy ra lộ trình riêng. Ý nghĩa lớn nhất của lần rò rỉ này có thể không nằm ở chi tiết kỹ thuật, mà ở chỗ nó xé đi một lớp “bí ẩn”—hóa ra công cụ lập trình AI cốt lõi nhất của Anthropic, ở tầng dưới cũng chỉ là prompt orchestration được thiết kế kỹ lưỡng, cộng thêm điều phối công cụ theo hướng engineering. Không có phép thuật đen; chỉ có vô số chi tiết được gia công tinh vi. Với các công ty AI ở Trung Quốc, đây thực ra là một tin tốt. Nó có nghĩa là khoảng cách là có thể thu hẹp. Điều kiện là bạn phải có kiên nhẫn để mài giũa những chi tiết đó—không phải nghĩ đến việc lấy code của người khác mang về sửa tên ngay lập tức.

Các công ty AI Trung Quốc, làm thế nào để 「sao chép bài tập của Claude Code」?

Chủ đề thịnh hành

AprilMarketOutlook

CryptoMarketsRiseBroadly

IsraelStrikesIranBTCPlunges

GoldSilverRally

ClaudeCode500KCodeLeak

Gate Fun hot

大汉民族

大汉民族

😃

wwe

漫威粉丝币

漫威粉丝币

8T

8 Trend

mb

macbook

Ghim