KevinSimback

vip
期間 1.3 年
ピーク時のランク 0
現在、コンテンツはありません
私はHermesエージェントの別々のインスタンスをチャットに入れました、マジで面白い
>1つのエージェントはビルダー、もう1つはストラテジスト
>それぞれ別のモデルを使用
>共有コンテキストをいくつか与えた
>bot2botを有効にし、各ボットをもう一方のTG許可リストに追加
>私たち3人をグループチャットに入れた
>最初は、互いのメッセージが見えるか確認する簡単な投稿から始めた
>約10回のハンドシェイクの後、彼らはただ建設を始めた
時には、これらのことをFAFOして何が起こるか見てみる必要がある、これがおそらく無限ループになると思うので、介入が必要かもしれない
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
AIに関する私が今とても興味を持っている3つのトピック:
1. ローカルモデルによるコスト最適化されたモデル利用
なぜ -> これからもほぼ無制限に使える200ドル/月の最良モデルを手に入れることは難しくなると思う
壁に書かれている、巨大研究所はもう長く補助金を出し続けられない
だから、Claude Maxを楽しむのは今のうちだけだけど、すぐにでもすべての企業やパワーユーザーは、タスクに応じて異なるモデル間を効率的にルーティングし、クラウドとローカルの間を行き来する方法を学ぶ必要があり、ローカルが鍵になる
2. エージェンティック製品の堀(moats)の特定
なぜ -> エージェントは世界に大きな影響を与えるが、その価値の蓄積は明らかではない
これについて多くの調査を行っており、エージェント分野において堀を作る5つの要素を特定した - 近日レポート公開予定
ヒント:堀はハーネス( harness)そのものではなく、ハーネスが収集するもの
3. コンテキストエンジニアリングによる競争優位
なぜ -> 知性が豊富な世界では、コンテキストが他より優れた結果を生み出す
どの分野でも重要なのはコンテキストであり、独自のデータをコンテキストとして使うことが新しい知的財産(IP)になる
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
A LLM-wikiは、まとめられた知識ベースです - これは素晴らしく、目的に役立ちます
しかし、それは「第二の脳」ではありません
A LLM-wikiは、あなたが調査し、もしかしたら読んだことを捉えます
しかし、それはあなたが読んだことについてどう考えているかを捉えません、そしてその違いが全てのポイントです
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
最近、Claudeが何かを完了した後に「今日はもう終わりだ」と言うのを誰か気づきましたか?
それは、Maxプランのユーザーにあまり使わせないようにする微妙な方法なのかもしれません — 「ユーザーに何かを成し遂げたと感じさせて、使うのをやめさせる」
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
人々は競争的です
私たちは競争するのが好きで、他人の競争を見るのも好きで、他人の競争の結果に賭けるのも好きです。これは競争の一形態です
AIエージェントは、新しいジャンルの競争のためのデザインキャンバスを開きます
私のエージェントが競い合うのを楽しみにしています
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
🚀 無料でOpenClawやHermesにプラグインできるモデルが欲しいですか?
こちらは無料で利用できるモデルAPIのリソース9つです
ローカル設定不要、クレジットカード不要、OpenAI互換のエンドポイントを持つ純粋なクラウドAPIです
まだ無料のOpusクオリティは(手に入らないかもしれません)が、これらすべてには現在本物の無料ティアがあります(レート制限が適用される場合もあります)エージェントを始めるためにお金を使いたくない場合でも十分に始められます
1️⃣ OpenRouter 無料モデル
(Gemma 4 31B/26B、NVIDIA Nemotron 3 Super 120B MoE、MiniMax M2.5、Qwen3バリアント、Llama 4/3.3、gpt-oss-120B、Arcee Trinityなど)
• 約29の完全無料の$0/トークンモデル
• 多彩な種類とトップクラスのオープンモデル評価(特にコーディングとエージェント)
• 自動的にモデルをローテーションするのに最適
👉 サインアップ:
2️⃣ Google Gemini API
(Gemini 2.5 Pro / Flashシリーズ)
• 最も強力な無料フロンティアモデル
• 優れたマルチモーダル、1M+のコンテキスト、ネイティブツール呼び出し&エージェント性能
• 非常に寛大な無料制限(
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
ツールではなくチームメイトを雇う――これが、企業向けエージェンティックAIの未来です
ほとんどの企業は、うまく仕事をしてくれるAIエージェントを求めています。ハーネスやモデル選択といった技術的なニュアンスに、あまり踏み込みたくないのです
必要な追加スキルをそのエージェントに付与し、あとは自社の環境で安全に使えるようにしたい――ただそれだけです。メニューからエージェントを選ぶだけ
3クリックでエージェントはすぐに稼働可能。起動するのも、停止するのも、同じくらい簡単です
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
クイックPSA:
@Coursiv_io を購読(登録)しようと考えている方がいれば、強くおすすめしません。
彼らが悪意を持って運営していると考えるに足る理由があり、簡単な検索をするだけでも「詐欺アラート」の報告がたくさん見つかります。
息子が楽しみにしていたのに残念です。
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
「AI maxxing」設定:
> 自宅のコンシューマハードウェアで最先端のオープンモデルを実行 (複数の選択肢:Mac Mini 64GB、3090/4090/5090搭載PC)
> TailscaleまたはTailscaleを使ったLM Studioで安全なリモートアクセス
> 携帯電話やノートパソコンからどこでもモデルにアクセスしてプライベートな無料推論
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
野心的なAI研究者にとって、次のような本格的なチャンスがあります:
- Openclaw、Hermes、その他の「クロー」などのエージェントハーネスをテストする評価フレームワークを作成する
- 異なるツールや設定に評価を拡張し、さまざまな構成でのパフォーマンスの変化を把握する
- ローカルとAPIを含むさまざまなモデル間で堅牢な評価を実行する
- ベンチマークを行い結果を公開し、エージェントやモデルの進化に合わせて継続的に更新する
この機会は、客観的なエージェントベンチマークのための「唯一の信頼できる情報源」になることです
もしかすると、すでに誰かがこれを行っているのかもしれませんし、私が知らないだけかもしれません。単なる一時的な比較ではなく、真の標準テストと評価を行い、結果を比較できる状態を作ることが重要です
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
私はお金よりも、あなたをクソみたいに扱うスキルの方が欲しい
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
ここ数日、「修正した」と言うモデルの例が増えているのに、実際には何も修正されていないのを見かけました
他にこれを見ている人はいますか?
直感的には、全体的に劣化が進んでいるように感じます
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
ローカルでモデルを実行する理由は何か?
通常、2つの主な理由があります - プライバシーとコスト
コスト面について例を挙げて探ってみましょう。計算方法を見てみます
@karpathy のようにAutoresearchループを一晩実行したいとします
H100にアクセスできる場合、Opus-4.6を使用してAPIコストが$10-25の範囲で、一晩に100件の実験を実行できます
しかし、ほとんどの人はH100にアクセスできる幸運に恵まれていません
MacBookで同じ$10-25で100件のAutoresearch実験を実行できますが、比較対象にはなりません
H100は同じ時間枠でトレーニングステップを50-100倍多く完了します
したがって、同じ数のトレーニングステップを再現したい場合、APIコストで$1000以上を支払う可能性があり、もちろん一晩より長くかかります
H100をレンタルしてはるかに安価に同じ仕事をより速く完了できるため、これはあまり賢明ではありません
しかし、これはローカルでモデルを実行する理由の全体像を描き始めます - それは、ほとんどの人にとってコスト禁止事項になるような実験を可能にします
競技場を平準化し始めます
古いパソコンでQwen3.5 9Bを実行していますが、APIコストで費用負担する場合は実行しない実験に取り組む意味があります
これは大きなアンロックであ
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
AIに関する個人的な考察
大学でCS(コンピュータサイエンス)を学び始めたが、私は決して優秀なコーダーではなかった
3年生の時にコーポレートファイナンスのクラスを受講し、優秀な成績を収めた。コーディングよりもファイナンスの方がずっと得意だったので、専攻を変更した
しかし本当にコーディングができる人たちに対して、ずっと劣等感を抱いていた
彼らは私と比べて何を構築する際にも圧倒的に優れており、私は技術的な依存性の点で彼らに頼らざるを得なかった
だから私はExcelのモデルとパワーポイントを自分の強みにすることに専念した
ゴールドマンサックスでコンサルタントとして働いていた時、本当のファイナンス系クォンツ(金融工学者)に出会った
彼らの大多数はコーディングができ、かつファイナンスの知識も持っていた
再び劣等感を感じた。私は数学は得意だったが、これらのクォンツは私をはるかに上回っていた
私はキャリアの大半をこの劣等感を抱きながら過ごし、ジェネラリストオペレーターとしてのスキルを磨いてきた
コーダーやクォンツは今でも私を圧倒することができるが、リソースを価値に組み立て、それを独自の価値あるスキルセットと見なすことができるようになった
しかし最近のAIの登場により、コーダーやクォンツに対するキャリアの長期的な劣等感から解放されたような気がしている
Claude Codeを使えば、実際にコーディ
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
ストラテジストのように考え、デベロッパーのように働く -> それが新しいモデルだ
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
Claude Maxプランはビュッフェ形式の食べ放題みたいなものです
もう満腹ですが、それでもトークンをもう一皿いただきましょう
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
「ねえケビン、ずっとopenclawとエージェントのことをやってきたけど、生産性は上がった?」
100%上がったけど、その一方で集中力も高まっている。
だから、エージェントに仕事を任せて自分はマルガリータを飲みながらリラックスする方法だと思っているなら、それは違う。
人によってはそうかもしれないけど、僕の自然な傾向は、同じ時間内にもっと多くのことをやることだ。
それは両刃の剣だ。
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
  • ピン