Pantera與Franklin Templeton加入Sentient Arena,共同測試企業級AI代理性能

PANews 2月27日消息,据Cointelegraph报道,开源AI实验室Sentient宣布推出Arena,这是一个用于评估AI代理在企业级工作流程中表现的生产级测试环境。Pantera Capital和Franklin Templeton的数字资产部门已加入Arena的首批测试队列。 Sentient表示,Arena并非静态模型测试,而是通过模拟包含长文档、不完整信息和冲突来源的企业条件,对AI代理进行标准化任务测试。平台会跟踪幻觉、证据缺失、引用错误和推理漏洞等失败类别,帮助开发者诊断问题。Arena计划通过公开排行榜发布对比性能指标,并发布总结常见失败模式和修复方案的测试报告。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Nous Research 深度解析:Paradigm 押注 10 億估值的去中心化 AI 實驗室,Hermes 模型與 Psyche 網路全面拆解

Nous Research 是一家開源 AI 實驗室,專注於 Hermes 系列模型,於 2025 年獲得 Paradigm 投資 5,000 萬美元,估值達 10 億。其獨特在於由 crypto native 團隊開發 AI 技術後再整合區塊鏈。核心產品 Hermes 模型以減少拒絕率為設計理念,且資料來源以合成資料為主。同時,Psyche Network 在 Solana 上構建去中心化 AI 訓練網路,透過代幣機制激勵參與者。Nous Research 採用開源與去中心化策略,旨在展現其技術實力及可行性。

鏈新聞abmedia1小時前

Ondo Finance 向美國 SEC 提交不採取執法行動函請求,涉及代幣化證券權益鏈上記錄

Ondo Finance 於 4 月 13 日向 SEC 提交請求,尋求確認在特定模式下,以代幣化形式記錄證券權益於以太坊主網的合規性。Ondo 認為,這一鏈上記錄能提升抵押品監控、優化流程並簡化對帳,旨在與傳統金融協同運作。

GateNews2小時前

Pi Network 向 1M 名 KYC 驗證者分發 26.5M PI

Pi Network 在打造其生態系方面又邁進了一步。該專案最近向超過 100 萬名 KYC 驗證者分發了 2650 萬枚 PI 代幣。 這些獎勵是給協助在網路上驗證身分的使用者。這個流程很重要。因為它能確保

Coinfomania3小時前

Aave 深陷信任危機:服務商集體出走,「技術、治理與風控」全面失守

作者:Jae,PANews 比起熊市的外部壓力,Aave 內部反而先出現了一隻「黑天鵝」。 長期盤踞借貸協議王座的 Aave,正遭遇自成立以來最慘烈的生態震盪。沒有駭客攻擊,沒有程式碼漏洞,有的只是權力失控和利益反目。 從技術支柱 BGD Labs 的毅然離去,到治理先鋒 ACI(Aave Chan Initiative)的公開決裂,再到風控管家 Chaos Labs 的官宣斷交,一場服務商「大撤退」正在上演。 這場博弈的深度遠超的合作糾紛,它觸發了

区块客4小時前

Hyperliquid 主網上線優先費用機制,訂單優先費用上限下調至 8 bps

Hyperliquid 創始人 Jeff 在 Discord 宣布,優先費用機制已在主網以 Alpha 模式上線,包括 Gossip 和 Order 兩種類型。用戶可使用 HYPE 代幣支付,訂單優先費用上限由 20 bps 降至 8 bps,目前僅適用於 HIP-3 資產的 IOC 訂單。

GateNews5小時前

Byreal 推出鏈上 AI 交易助手 RealClaw,支援第三方技能擴展

Byreal於4月13日推出鏈上AI交易助理RealClaw;該工具基於OpenClaw框架,支援第三方技能擴充,使用者可自訂交易策略,目前處於Alpha測試階段,僅向受邀使用者開放。

GateNews5小時前
留言
0/400
暫無留言