تُصدر NVIDIA وMIT إطار Lightning OPD، ما يعزز كفاءة تقطير النماذج 4 مرات مع القضاء على مشكلات ذاكرة وحدة معالجة الرسوميات

وبحسب تقارير، أطلق باحثون من NVIDIA ومعهد ماساتشوستس للتكنولوجيا Lightning OPD (Offline On-Policy Distillation)، وهو إطار عمل جديد لما بعد التدريب لنماذج اللغات الكبيرة يُلغي الحاجة إلى إبقاء نموذج المعلم قيد التشغيل أثناء التدريب. ومن خلال المعالجة المسبقة لاحتمالات السجل الخاصة بنموذج المعلم دون اتصال بالإنترنت، يعزز الإطار كفاءة التدريب بمقدار 4 أضعاف، مع تحرير جميع موارد وحدات معالجة الرسومات للتدريب على نموذج الطالب.

وبالاختبار على 8 وحدات NVIDIA H100 GPU، نجح Lightning OPD في تقطير Qwen3-30B-A3B-Base (وهو نموذج MoE تبلغ معلماته 30 ملياراً) وحقق 71.0 في معيار AIME 2024، في حين تعذر على OPD القياسي العمل بسبب نفاد الذاكرة على الأجهزة نفسها. وبالنسبة لنموذج Qwen3-8B الأصغر، تطلب الإطار 30 ساعة GPU فقط للوصول إلى 69.9 نقطة.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

تضيف منصة B.AI 8,756 مستخدمًا في 11 مايو، بينما يقود DeepSeek-V4 60% من استهلاك الرموز

وفقًا لـ B.AI، أضافت المنصة 8,756 مستخدمًا جددًا في 11 مايو، بينما بلغ اعتماد مدفوعات Stripe بين المستخدمين الأساسيين من الدافعين 69.0%، مما يعكس تحسين الاحتفاظ بالمطوّرين التقليديين والمستخدمين ذوي المستوى الإنتاجي. شكلت نماذج سلسلة DeepSeek-V4 ما يقرب من 60% من استهلاك الرموز، مستفيدة من قدرات زمن استجابة منخفض جدًا وتزامن عالٍ وإنتاجية عالية لتعمل كمحرك تنفيذ أساسي لحقبة عملاء الذكاء الاصطناعي.

GateNewsمنذ 9 د

مكثّف من محفزات الاقتصاد الكلي هذا الأسبوع يقترب: من نشر مؤشر أسعار المستهلكين إلى قراءة شاملة لجدول مناقشة مشروع قانون CLARITY

2026 年 5 月中旬، يمر سوق العملات المشفرة بممر نادر للغاية شديد الحساسية على المستوى الكلي. تُعلن بيانات مؤشر أسعار المستهلكين الأمريكي (CPI) في 12 مايو، وتُعقد قمة الصين-الولايات المتحدة بين 13 و15 مايو، بينما سينظر «لجنة البنوك» في مجلس الشيوخ في 14 مايو في مشروع قانون CLARITY (قانون أسواق الأصول الرقمية الواضح). تتجمع ثلاثة أحداث مستقلة لكنها شديدة الترابط خلال أربعة أيام فقط، لتشكّل اختبار ضغط مرحليًا لآلية تسعير الأصول المشفرة. 5 مايو–15 مايو: تقويم الأحداث وتوزيع كثافة المعلومات؟ من زاوية إيقا

GateInstantTrendsمنذ 31 د

شركة بدء تشغيل أصوات الذكاء الاصطناعي Vapi تُنجز جولة $50M من الفئة B بقيادة Peak XV Partners

وفقاً لـ TechCrunch، أكملت Vapi، وهي شركة ناشئة في مجال أصوات الذكاء الاصطناعي، جولة تمويل من الفئة B بقيمة 50 مليون دولار بقيادة Peak XV Partners، مع تقييم بعد التمويل يقدَّر بنحو 500 مليون دولار. وقد قامت Ring، وهي شركة تابعة لشركة Amazon، بنشر Vapi للتعامل مع 100% من مكالماتها الواردة بعد تقييم أكثر من 40 من موردي أصوات الذكاء الاصطناعي، ما ساعد على دفع جولة التمويل.

GateNewsمنذ 1 س

انخفاض دقة GPT-5.4 من 100% إلى 54% على ARC-AGI بعد عمليات تلخيص متكررة للذاكرة

وفقاً لـ Beating، كشفت دراسة حديثة للذاكرة لدى الوكلاء أجراها ديلان تشانغ، طالب دكتوراه في جامعة إلينوي، أن تلخيص تجارب النموذج بشكل متكرر يمكن أن يُضعف الأداء بدل أن يحسّنه. في مهام ARC-AGI، حقق GPT-5.4 دقة 100% على 19 مسألة دون ذاكرة، لكن بعد عدة جولات من ضغط الذاكرة استناداً إلى مسارات الحل الصحيحة انخفضت الدقة إلى 54%. وبالمثل، في مهام التسوق عبر WebShop، سجّل أسلوب AWM للذاكرة 0.64 مع 8 مسارات خبراء، لكنه تراجع إلى 0.20 مع 128 مساراً، وعاد إلى مستوى الأساس. تشير نتائج البحث إلى أن المشكلة ت

GateNewsمنذ 1 س

توسّع OpenAI برنامج الوصول الموثوق ليشمل عشرات الشركات الأوروبية في 12 مايو

وبحسب تقارير صادرة في 12 مايو، أعلنت OpenAI خططًا لتوسيع برنامج الوصول الموثوق الخاص بها ليشمل عشرات الشركات الأوروبية.

GateNewsمنذ 1 س

روبوتات التحويل الواقعية! أطلقت شركة Unitree Technology أول مركبة روبوتية قابلة للإنتاج على نطاق عالمي، بسعر 570 ألف دولار

أعلنت شركة يوشو للروبوتات في هانغتشو بالصين (Unitree Robotics) في 12 مايو إطلاق منتجها الجديد GD01، وهو روبوت ميكانيكي مأهول يمكنه التبديل بحرية بين وضعية الروبوت الثنائي الأرجل ووضعية التسلق الرباعي الأرجل. ويمكن القول إن هذا يترجم مشاهد فيلمَي الخيال العلمي «Transformers» و«Pacific Rim» إلى الواقع. ولا تتمثل هذه الإتاحة في مجرد ظاهرة تكنولوجية، بل تعكس أيضاً السرعة التي يمضي بها قطاع الروبوتات في الصين قدماً. Unitree Unveils: GD01, A Manned Transformable Mecha, from $650,000 The world’s first

ChainNewsAbmediaمنذ 2 س
تعليق
0/400
لا توجد تعليقات