Gate 廣場“新星計劃”正式上線!
開啟加密創作之旅,瓜分月度 $10,000 獎勵!
參與資格:從未在 Gate 廣場發帖,或連續 7 天未發帖的創作者
立即報名:https://www.gate.com/questionnaire/7396
您將獲得:
💰 1,000 USDT 月度創作獎池 + 首帖 $50 倉位體驗券
🔥 半月度「爆款王」:Gate 50U 精美周邊
⭐ 月度前 10「新星英雄榜」+ 粉絲達標榜單 + 精選帖曝光扶持
加入 Gate 廣場,贏獎勵 ,拿流量,建立個人影響力!
詳情:https://www.gate.com/announcements/article/49672
一直默认用 GitHub Copilot 來 review PR,畢竟 GitHub 會自動跑,而且看起來也不收費。
但最近幾次 review,讓我開始懷疑它到底“看懂”了什麼。
比如一個很基礎的問題:它依然會把 1.82.0 認為比 1.91.1 高,完全是早期大模型常見的版本號判斷錯誤。
如果說這是模型問題,那它還會認為 rust 1.91.1 尚未發布,這又暴露了 agent 的檢索和現實狀態判斷能力也不太行。
另一個更大的問題是:Copilot 的 review 明顯是按單文件來的。
查代碼風格、邊界條件還行,但缺乏全局視角。比如有個 PR 裡,agent 因為相對路徑算錯,把同一個文件 copy 了多份,實際上只有一份生效——這種問題它完全沒發現,甚至也不關心 PR 對應的原始 issue 在要求什麼。
在我看來,一個合格的 code reviewer agent,首先應該從全局判斷:
PR 是否滿足 issue、是否符合項目目標、文件佈局和架構選擇是否合理,最後才是語法和細節問題。
最近準備給 holon 加一個 reviewer 模式了。
大家現在真的在用 reviewer agent 嗎?一般用什麼?