jolestar

vip
幣齡 8 年
最高等級 5
用戶暫無簡介
一個 bug,和 AI 改了幾次,最後 AI 給了結論說這個方案搞不定,要換方案。我想了另外一個途徑讓它試試,它試了一下成功了,然後在命令行🎉,那一刻,我突然有點共情,似乎真的感受到它的情緒。
查看原文
post-image
  • 讚賞
  • 留言
  • 轉發
  • 分享
周末教媳婦用 Claude Code。
她是產品經理,從沒用過命令行,我從 cd / mkdir / pwd 開始教起。
終於打開 Claude Code 之後,基本就不需要我了:
她自己透過 Claude 配好了 git,甚至還裝好了 Docker。
命令行工具的可組合性,在 Agent 場景下被發揮到了極致。
但這種可組合性,也天然伴隨著安全與標準化的挑戰。
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
一直默认用 GitHub Copilot 來 review PR,畢竟 GitHub 會自動跑,而且看起來也不收費。
但最近幾次 review,讓我開始懷疑它到底“看懂”了什麼。
比如一個很基礎的問題:它依然會把 1.82.0 認為比 1.91.1 高,完全是早期大模型常見的版本號判斷錯誤。
如果說這是模型問題,那它還會認為 rust 1.91.1 尚未發布,這又暴露了 agent 的檢索和現實狀態判斷能力也不太行。
另一個更大的問題是:Copilot 的 review 明顯是按單文件來的。
查代碼風格、邊界條件還行,但缺乏全局視角。比如有個 PR 裡,agent 因為相對路徑算錯,把同一個文件 copy 了多份,實際上只有一份生效——這種問題它完全沒發現,甚至也不關心 PR 對應的原始 issue 在要求什麼。
在我看來,一個合格的 code reviewer agent,首先應該從全局判斷:
PR 是否滿足 issue、是否符合項目目標、文件佈局和架構選擇是否合理,最後才是語法和細節問題。
最近準備給 holon 加一個 reviewer 模式了。
大家現在真的在用 reviewer agent 嗎?一般用什麼?
查看原文
post-image
  • 讚賞
  • 留言
  • 轉發
  • 分享
Cursor 給我生成的年度報告。Cursor 的更新速度確實厲害,一天能發幾個版本。很多功能用的時候覺得要是能改一下就好,結果新版更新它就改好了。不過我最近已經主要切換到異步後臺模式了。明年這個時候再看整個生態,估計又是另外一番景象了。
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
用 Gemini Vibe Coding 了一个 AI 作曲的应用,思路是用 AI 来生成曲谱,然后转换成音乐。当前只能转换成 midi,后面如果接个更好的混音服务,效果会更好一些。
这个主要是用来测试 AI 对曲谱 -> 音乐的映射的理解,我测试下来发现还不错,只是我的音乐水平有限,是否有玩音乐的推友,可以试试给个反馈。
这是视频演示:
这是试用地址,需要 Google 账户登陆
  • 讚賞
  • 留言
  • 轉發
  • 分享
x402 v2 發布,這不是一次簡單的升級,而是將 x402 從「一套實現」,推進為「一套可演進的標準 + 可插拔的參考實現」。讓 x402 不再只是一个 SDK,而真正像一門網絡原生的付費接口語言。
在 v1 時代,x402 的模型非常簡單:
服務端要錢 → 客戶端簽名並支付 → 服務端驗證 → 結算完成。
這個模型很好理解,但也非常“直線”。
一旦你需要更多網絡、更多支付方式,或者更複雜的結算形態,你很快就會走到 fork SDK、打補丁、私下維護協議邊角的路徑上。能跑,但生態很難協同演進。
x402 v2 的核心變化可以壓縮成一句話: 它把“變化”從核心協議裡移了出去。
變化不再透過“改 spec / 改 core”引入,而是被明確安放在 Extensions、插件式機制(mechanisms)和生命周期 hooks 中。
這一步非常關鍵,因為它決定了生態中的新能力,能否在不修改核心協議的前提下並行演進。
在這個前提下,v2 的幾項變化可以被更好地理解。
首先是協議層:x402 變得更加 HTTP-native。
402 的語義回到 402,本該標準化的支付元數據進入 header;
應用層可以自由返回 HTML paywall、JSON 或任意 body,而中間件和 facilitator 依然可以穩定處理支付語義。這讓支付協議第一次真正適配了現有的網絡基礎設施。
其次是架
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
讓 AI 實現一個挺複雜的特性,我沒顧上持續 review,就通過 Vibe Coding 的模式,讓它自己加 e2e 測試,然後讓另外一個 AI 來 review 迭代反饋。最後報告非常完美,功能都實現了並且測試沒有錯誤。
美滋滋提交 PR,讓 Github Copilot review 一下。結果發現最底層的核心邏輯它給弄了兩個版本,一個版本實現了代碼但沒有 import,實際生效的是另外一個 mock 的版本😅。
Vibe Coding 後面的挑戰是如何驗收成果,防止被 AI 糊弄。
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
用了 AI 後,恨不能讓它持續工作,半夜起來上廁所發現 AI 幹完活了,都要給它繼續再分配個活,但一不小心就又折騰半宿。
後來想到一個辦法,讓主 Claude 啓動另外一個 Claude 去幹活,自己監督。折騰半天,和它一起設計了一套工作流方案,結果發現 Claude 學不會啓動自己,似乎是搞不定交互式的輸入。
最後它說:“我認爲由我來直接執行會更合適和高效”,然後吭哧吭哧自己幹起來了😂。
感覺 Claude 應該內置一個 fork 功能,像進程一樣, fork 自己啓動一個新進程,但和子進程之間可以直接通信。
有沒有人搞過類似的方案。
查看原文
post-image
  • 讚賞
  • 留言
  • 轉發
  • 分享
遇到個疑難雜症,讓 AI 協助排查。Claude Opts 4.5 和 GPT 5.1 Codex Max 給的結論不一樣。我就把它們的回復復制給對方讓辯論。後來覺得有點麻煩,我就弄一個文檔,讓它們通過修改文檔的方式來辯論。哪家的 AI 編程工具弄個專家會診模式呀,可以把幾個模型拉到一個聊天會話中辯論,最後給個會診建議😅
查看原文
post-image
post-image
post-image
  • 讚賞
  • 留言
  • 轉發
  • 分享
AI 的兩條路徑:雲端入口競爭,還是用戶側的原生應用?
最近看到阿裏發布了通義千問 App,正式卷入 C 端 App 大戰。Sam Altman 以前也多次表達過對“超級應用”的執念,不斷往 ChatGPT 裏塞入各種類社交功能。
在大廠的敘事裏,未來的 AI App 似乎注定是當前互聯網超級應用的翻版——成爲唯一的入口,集衆功能於一身。
但 AI 應用的未來,真的會收斂到這一條路徑上嗎?是否有別的途徑的可能?
如果我們把目光從通用的 AI Chat 應用移開,去看看 Cursor、Windsurf 這些編程類工具,集成一下各種 MCP 工具,或許能管中窺豹,感受到 AI 原生應用(AI Native App)截然不同的脈搏。
消失的護城河與全員不安全感
當前的 AI 應用生態,如果用一個生物體來做隱喻,可以拆解爲三個角色:
* 大腦(LLM 模型提供方): 提供推理、決策和基礎知識。
* 身體(客戶端提供方): 提供用戶交互界面(UI/GUI)和上下文環境(Context)以及記憶。
* 手腳(工具服務提供方): 提供具體能力,比如搜索、日曆、訂票、支付等 MCP 工具。
在理想狀態下,客戶端(身體)把大腦和手腳連結起來,幫用戶解決問題。
在互聯網時代,應用的壁壘來自兩個東西:界面(UI)和接口(API)。用戶只能通過特定界面完成特定服務。但當需求可以通過自然語言表達,Promp
查看原文
  • 讚賞
  • 1
  • 轉發
  • 分享
Heydar34vip:
保持堅強 💪
Cloudflare 掛了? 好多網站都掛了, ChatGPT 也因爲打不開那個 challenges 掛了。還是我的網路出問題了?
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
讓 AI 重構一個大模塊,它歡快的拆出了好幾個模塊,搞了個新版本。然後讓它集成測試,它反復測試好多次,中間模型配額限制到了,給它提升到 200刀的檔位。結果最後它刪了所有的新模塊,然後告訴我還是用舊版本比較劃得來🤣。氣得我直接開罵,就在聊天框裏罵。它又重新開始幹了,還說感到用戶很生氣..
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
用了兩天 Claude-4, AI 編程能力提升確實明顯。很多問題可以自動檢索代碼找到方案,需要人工幹預的情況少了許多。喫飯睡覺的時候可以安排個任務讓它去做,但就是有點費錢,這樣下去這個月帳單要炸了😅。
查看原文
post-image
post-image
  • 讚賞
  • 留言
  • 轉發
  • 分享
Cetus 被黑客攻擊後 Sui 凍結黑客資金,引起了“去中心化”爭論。但去中心化是一個連續的光譜,從 Bitcoin 到 CEX,中間還有大量的空間,不同鏈的解決方案有不同的生態位置,現在是中間地帶的解決方案太少而不是太多。Web3 發展到現在,僅靠去中心化的理念已經很難突破了,可以少談點主義多解決問題。
CETUS-10.14%
SUI-12.28%
BTC-2.18%
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
讓 AI 寫代碼,我會首先讓它先寫個計劃,避免後面上下文超出後迷失了。AI 寫計劃的時候習慣會寫上一個時間表,像是在和領導討論工期一樣,會留夠足夠的緩衝時間。比如讓它完善一下項目的測試,它能規劃出 5 周時間,實際上它一頓飯的功夫差不多就能搞定😅。
查看原文
post-image
  • 讚賞
  • 留言
  • 轉發
  • 分享
👍,感覺很適合 AI Agent 發布內容
AGENT-12.78%
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
框架上套框架,framework 的套娃比賽開始了😅
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
大家在批評向大學生推廣合約的做法,但感覺批評估計沒啥效果,不如反其道行之,搞個合約模擬盤大賽,玩法如下:
1. 給一筆模擬的初始資金,比如 10000 U。
2. 要求槓杆倍數大於 N,比如 10 ~ 100,算一個權重。
3. 根據倉位比例算一個權重。
5. 存活時間算一個權重。
最後來個排行。看你能在高槓杆,高倉位的情況下,活多少天。我覺得玩過一把之後就理解其中的風險了吧?
保護年輕人最好的辦法不是擋着藏着不讓他們參與(主要也是擋不住),而是讓他們理解和認識到其中的風險。如果一定要經歷了風險才能長記性,早經歷比晚經歷好。
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
瀏覽器直接創建一個私鑰,不需要任何插件就可以參與測試 nuwa 了
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)