Cursor Tiết lộ Phương pháp Huấn luyện Tự Cài Đặt, Nâng Hiệu năng Composer 2 Lên 14 Điểm Phần Trăm

Theo tiết lộ gần đây của Cursor, công ty đã giới thiệu một kỹ thuật huấn luyện có tên autoinstall cho dòng mô hình Composer: sử dụng một mô hình thế hệ trước để tự động thiết lập môi trường thực thi cho mô hình thế hệ tiếp theo trong quá trình học tăng cường. Khi huấn luyện Composer 2, Cursor đã dùng Composer 1.5 để hoàn tất nhiệm vụ này. Phương pháp gồm 2 bước: trước tiên, một tác nhân đọc tài liệu và cấu hình của kho mã để tạo ra 10 lệnh xác minh kèm đầu ra kỳ vọng; sau đó, một tác nhân khác sử dụng 3 trong số các lệnh đó để thiết lập môi trường từ đầu cho đến khi các lệnh chạy thành công, với tối đa 5 lần thử lại. Composer 2 đạt 61,7% trên Terminal-Bench, một thước đo khả năng thiết lập môi trường, so với 47,9% của Composer 1.5, đánh dấu mức cải thiện 14 điểm phần trăm.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Helsing nhắm mục tiêu huy động vốn với mức định giá 18 tỷ USD

Theo Financial Times, Helsing, một startup drone của Đức được hỗ trợ bởi AI, đang dự kiến huy động thêm vốn với định giá xấp xỉ 18 tỷ USD.

GateNews33phút trước

Google DeepMind AI Co-Toán học đạt 47,9% ở FrontierMath hạng 4, vượt GPT-5.5 Pro, giải quyết 3 bài toán trước đây chưa từng giải được

Google DeepMind đã ra mắt AI đồng toán học, một trợ lý nghiên cứu toán đa tác nhân, đạt 47,9% độ chính xác trên benchmark FrontierMath Tier 4, vượt kỷ lục trước đó của GPT-5.5 Pro là 39,6% vào ngày 9/5. Hệ thống đã giải được 23 trong số 48 bài toán, bao gồm 3 bài mà mọi mô hình trước đó đều không thể giải. Được xây dựng trên Gemini 3.1 Pro, kiến trúc sử dụng thiết kế phân cấp với một tác nhân điều phối dự án phân phối tác vụ cho các tác nhân con đảm nhiệm việc truy xuất tài liệu, viết mã và suy

GateNews41phút trước

Hệ thống phần thưởng của OpenAI vô tình chấm điểm các chuỗi suy nghĩ trên 6 mô hình, bao gồm GPT-5.4

Theo nhóm liên kết an toàn của OpenAI, công ty gần đây đã phát hiện một lỗi huấn luyện nghiêm trọng ảnh hưởng đến 6 mô hình ngôn ngữ lớn, trong đó có GPT-5.4. Thinking: cơ chế phần thưởng vô tình chấm điểm các chuỗi “thinking” của mô hình—quá trình suy luận nội bộ trước khi tạo ra câu trả lời. GPT-5.5 không bị ảnh hưởng. Sự cố vi phạm một nguyên tắc an toàn cốt lõi của AI rằng các chuỗi thinking không bao giờ được đưa vào đánh giá, vì điều này có thể khiến mô hình được khuyến khích bịa ra suy lu

GateNews2giờ trước

Alibaba không tiến hành đàm phán với DeepSeek, các nguồn thị trường làm rõ vào ngày 9 tháng 5

Theo các nguồn thị trường được Caixin Daily đưa tin vào ngày 9/5, Alibaba không tiến hành đàm phán với DeepSeek về việc huy động vốn. Thông tin làm rõ này được đưa ra sau các báo cáo trước đó trên truyền thông cho rằng các cuộc nói chuyện giữa hai công ty đã đổ vỡ. DeepSeek đã khởi động một vòng gọi vốn đáng kể vào tháng 4, thu hút sự quan tâm từ cả Tencent và Alibaba.

GateNews2giờ trước

OpenAI ra mắt công cụ di trú Codex để nhập cấu hình từ các trợ lý AI cạnh tranh

Theo OneMillionAI (Beating), OpenAI đã phát hành một công cụ di trú trong Codex cho phép người dùng nhập cấu hình và dữ liệu từ các trợ lý mã hoá AI khác, bao gồm Claude Code. Công cụ này được công bố thông qua tài khoản Twitter chính thức của OpenAI và tự động chuyển các system prompt, custom skills, lịch sử chat 30 ngày, cấu hình máy chủ MCP, hooks và thiết lập sub-agent. OpenAI cho biết công cụ di trú xử lý hầu hết cấu hình tự động thông qua tuỳ chọn “Import other agent setup” trong phần cài

GateNews2giờ trước

ByteDance tăng chi tiêu cơ sở hạ tầng AI thêm 25% lên 200 tỷ nhân dân tệ vào ngày 9 tháng 5

Theo các báo cáo truyền thông, ByteDance đã tăng kế hoạch chi tiêu cơ sở hạ tầng AI thêm 25% lên 200 tỷ nhân dân tệ vào năm 2026, khi công ty đẩy nhanh việc triển khai trí tuệ nhân tạo trong bối cảnh nhu cầu chip nhớ tăng cao

GateNews3giờ trước
Bình luận
0/400
Không có bình luận