المؤلف: xiyu
هل تريد استخدام Claude Opus 4.6 ولكن لا تريد أن ينفجر فاتورة نهاية الشهر؟ هذه المقالة تساعدك على تقليل التكاليف بنسبة 60-85%.
هل تعتقد أن التوكنات مجرد “كلامك + رد الذكاء الاصطناعي”؟ الواقع أبعد من ذلك بكثير.
التكلفة الخفية لكل محادثة:
مثال بسيط: “كيف هو الطقس اليوم”، يستهلك فعليًا 8000-15000 توكن إدخال. باستخدام Opus، فقط السياق يكلف 0.12-0.22 دولار.
الأمر الأكثر قسوة: كل مرة يتم تفعيلها = محادثة جديدة = إعادة حقن كل السياق. cron الذي يعمل كل 15 دقيقة، 96 مرة في اليوم، مع Opus يكلف حوالي 10-20 دولار في اليوم.
نفس الشيء ينطبق على Heartbeat: هو في الأساس استدعاء للمحادثة، وكلما كانت الفواصل أقصر، زادت التكاليف.
أكبر طريقة لتوفير المال، وأثرها قوي جدًا. سعر Sonnet حوالي 1/5 من Opus، ويكفي 80% من المهام اليومية.
markdown
نصائح:
يرجى مساعدتي في ضبط OpenClaw ليكون النموذج الافتراضي هو Sonnet،
واستخدام Opus فقط عند الحاجة للتحليل العميق أو الإبداع.
المتطلبات:
تعيين النموذج الافتراضي إلى Sonnet
ضبط مهمة cron لاستخدام Sonnet بشكل افتراضي
تحديد Opus فقط للمهام الكتابية، التحليل العميق، الإبداع
سيناريو Opus: كتابة مقالات طويلة، كود معقد، استنتاجات متعددة الخطوات، مهام إبداعية
سيناريو Sonnet: دردشة يومية، أسئلة بسيطة، فحوصات cron، Heartbeat، عمليات الملفات، الترجمة
تجربة عملية: بعد التبديل، انخفضت التكاليف الشهرية بنسبة 65%، والتجربة تكاد تكون بدون فرق.
كل استدعاء يستهلك “ضوضاء أساسية” تتراوح بين 3000-14000 توكن. تقليل ملفات الحقن هو أفضل تحسين من حيث القيمة مقابل المال.
markdown
نصائح:
ساعدني على تقليل ملفات سياق OpenClaw لتوفير التوكنات.
بما يشمل: 1) حذف الأجزاء غير الضرورية من AGENTS.md (قواعد المجموعات، TTS، وظائف غير مستخدمة)، وتقليلها إلى أقل من 800 توكن
تبسيط SOUL.md إلى نقاط موجزة، بين 300-500 توكن
تنظيف MEMORY.md من المعلومات القديمة، وتقليلها إلى أقل من 2000 توكن
مراجعة إعدادات workspaceFiles، وإزالة الملفات غير الضرورية
قاعدة الخبرة: كلما قللت 1000 توكن من الحقن، واعتبرت 100 استدعاء يوميًا لـ Opus، فستوفر حوالي 45 دولار شهريًا.
markdown
نصائح:
ساعدني على تحسين مهام cron في OpenClaw لتوفير التوكنات.
يرجى:
سرد جميع مهام cron وتواترها والنموذج المستخدم
تقليل جميع المهام غير الإبداعية إلى Sonnet
دمج المهام التي تتم في نفس الفترة الزمنية (مثل عمليات الفحص المتعددة في مهمة واحدة)
تقليل التكرار غير الضروري (مثل تغيير فحص النظام من كل 10 دقائق إلى كل 30 دقيقة، وفحص الإصدار من 3 مرات يوميًا إلى مرة واحدة)
ضبط إعدادات التسليم ليكون إشعارات عند الطلب، وعدم إرسال رسائل بشكل طبيعي
المبدأ الأساسي: ليس من الضروري أن تكون التكرارات عالية جدًا، فمعظم “الطلبات في الوقت الحقيقي” غير ضرورية. دمج 5 فحوصات مستقلة في استدعاء واحد يوفر حوالي 75% من تكلفة حقن السياق.
markdown
نصائح:
ساعدني على تحسين إعدادات Heartbeat في OpenClaw:
ضبط الفاصل الزمني للعمل بين 45-60 دقيقة
جعل فترة الصمت من 23:00 إلى 08:00
تبسيط ملف HEARTBEAT.md لأقل عدد من الأسطر
دمج عمليات الفحص المبعثرة إلى تنفيذ دفعة واحدة في Heartbeat
عند استعلام agent عن المعلومات، عادةً “قراءة النص الكامل” — ملف من 500 سطر يستهلك 3000-5000 توكن، لكنه يحتاج فقط إلى 10 أسطر منه. 90% من توكنات الإدخال تُهدر.
qmd هو أداة بحث معنوي محلية، يبني فهرس كامل + فهرس متجهات، لتمكين agent من تحديد الفقرات بدقة بدلاً من قراءة الملف بالكامل. كل ذلك محلي، بدون تكلفة API.
مع استخدامه مع mq (Mini Query): معاينة هيكل الدليل، استخراج فقرات دقيقة، البحث عن كلمات مفتاحية — كل مرة يقرأ فقط 10-30 سطرًا.
markdown
نصائح:
ساعدني على إعداد قاعدة معرفية باستخدام qmd لتوفير التوكنات.
رابط Github: https://github.com/tobi/qmd
المتطلبات:
تثبيت qmd
إنشاء فهرس لمجلد العمل
إضافة قواعد البحث في AGENTS.md، وتوجيه agent لاستخدام qmd/mq أولاً بدلًا من قراءة النص الكامل
ضبط تحديث الفهرس بشكل دوري
النتيجة الفعلية: تقليل استهلاك المعلومات من 15000 توكن إلى 1500، بنسبة تقليل 90%.
الفرق بينه وبين memorySearch: الأول “يسترجع” (MEMORY.md)، والثاني “يبحث” (قاعدة المعرفة المخصصة)، ولا يتداخلان.
markdown
نصائح:
ساعدني على إعداد memorySearch في OpenClaw.
إذا كانت ملفات الذاكرة قليلة (عشرات ملفات md)،
هل أنسب استخدام Embedding محلي أم Voyage AI؟
يرجى توضيح التكاليف وجودة الاسترجاع لكل منهما.
الاستنتاج البسيط: إذا كانت ملفات الذاكرة قليلة، استخدم Embedding محلي (بتكلفة صفرية). وإذا كانت الحاجة للغات متعددة أو الملفات كثيرة، فـ Voyage AI (مع 2 مليار توكن مجانية لكل حساب).
markdown
نصائح:
ساعدني على تحسين إعدادات OpenClaw مرة واحدة لتحقيق أقصى قدر من التوفير في التوكنات، وفقًا للقائمة التالية:
تغيير النموذج الافتراضي إلى Sonnet، واستخدام Opus فقط للمهام الإبداعية والتحليلية
تبسيط ملفات AGENTS.md / SOUL.md / MEMORY.md
تقليل جميع مهام cron إلى Sonnet + دمج + تقليل التكرار
ضبط Heartbeat على فاصل 45 دقيقة + فترة صمت ليلية
إعداد qmd للبحث الدقيق بدلاً من قراءة النص الكامل
الاحتفاظ فقط بالملفات الضرورية في workspaceFiles
تنظيف ملفات الذاكرة بشكل دوري، وتقليل MEMORY.md إلى أقل من 2000 توكن
طبقات النموذج — Sonnet للمهام اليومية، Opus للمهام الحرجة، توفير 60-80%
تقليل حجم السياق — تبسيط الملفات + استخدام qmd للبحث الدقيق، وتوفير 30-90% من توكنات الإدخال
تقليل الاستدعاءات — دمج cron، تمديد فاصل Heartbeat، تفعيل فترة الصمت
Sonnet 4 قوي جدًا، ويمكن الاعتماد عليه في المهام اليومية بدون فرق ملحوظ. وعند الحاجة إلى Opus، فقط قم بالتبديل.