Menurut Beating, Prime Intellect telah merilis open-source general-agent, sebuah lingkungan pelatihan agen yang dapat berkembang sendiri dan menggunakan mekanika pembuatan tugas dual-player. Sistem ini secara otomatis menghasilkan 4.504 tugas dan lebih dari 8.000 alat unik dengan bergantian antara task synthesizer dan solver, mengategorikan tantangan ke dalam lima tingkat kesulitan melalui sembilan strategi termasuk kondisi batas, instruksi berisik, dan coupling lintas-entitas.
Dalam pengujian, fine-tuning model berparameter 30B pada lebih dari 4.400 trajektori dari lingkungan meningkatkan akurasi tool-calling dari 18,9% menjadi 52,3% pada benchmark BFCL, sehingga menunjukkan kemampuan framework dalam menghasilkan data pelatihan yang terverifikasi secara semantik tanpa bergantung pada dataset statis yang dianotasi secara manual.