Gate 广場「創作者認證激勵計畫」優質創作者持續招募中!
立即加入,發布優質內容,參與活動即可瓜分月度 $10,000+ 創作獎勵!
認證申請步驟:
1️⃣ 打開 App 首頁底部【廣場】 → 點擊右上角頭像進入個人首頁
2️⃣ 點擊頭像右下角【申請認證】,提交申請等待審核
立即報名:https://www.gate.com/questionnaire/7159
豪華代幣獎池、Gate 精美周邊、流量曝光等超過 $10,000 的豐厚獎勵等你拿!
活動詳情:https://www.gate.com/announcements/article/47889
#Deepseek Goes Viral
DeepSeek,一家位於中國杭州的人工智能初創公司,憑藉2024年12月下旬推出的大型語言模型DeepSeek-V3,在全球人工智能行業引起了廣泛關注。該模型擁有6710億個參數,但僅用了約兩個月的時間進行訓練,成本為558萬美元,遠低於其他主要技術公司的投資。
DeepSeek-V3在開源模型中取得了最佳性能,並與世界上最先進的模型進行了比較。該公司已經優化了訓練過程,以最小化成本,在中國生產的Nvidia H800 GPU上使用了約278萬小時。這表明,儘管受到美國對獲取AI訓練所需先進半導體的限制,中國的人工智能公司取得了顯著進展。
DeepSeek的成功引起了美國科技行業的擔憂,英偉達和其他科技公司的股票大幅下挫。專家認為,得益於採用開源技術和有效的培訓方法,DeepSeek以比美國同行更低的成本實現了高性能。
此外,DeepSeek已發佈了模型的源代碼和詳細的技術解釋,使全球的研究人員和開發人員能夠訪問和改進這項技術。這種透明度與美國主要人工智能公司更加神祕的方法形成鮮明對比,可能會改變未來大型科技公司開發模型的方式。