الخطوة الثورية لـ Deepseek: عندما تغير التكنولوجيا قواعد اللعبة (1 ديسمبر)

إصدار Deepseek v3.2 أصبح اليوم الموضوع الرئيسي، وليس بدون سبب. أظهرت الشركة نتائج تتنافس مباشرة مع أحدث النماذج المغلقة لرواد الصناعة، بما في ذلك gemini3.0. هذا بالتأكيد يضع Deepseek في فئة open-source SOTA، مع جميع المقاييس القابلة للقياس التي تؤكد هذا التصنيف.

على ماذا يعتمد هذا الاختراق حقًا؟

من الناحية التقنية، لا تكمن الابتكار في أخبار ثورية في الهندسة المعمارية. لا تزال Deepseek تستخدم DSA وتستثمر باستمرار في مرحلة ما بعد التدريب، التي تمثل أكثر من 10% من الميزانية الحاسوبية الإجمالية. لكن بطريقة ما، وجدت الشركة طريقة لتعظيم كفاءة هذا النهج. باستخدام كامل إمكانات الإصدار التجريبي v3.2، حققت الفريق نتائج تتناقض مباشرة مع السرد حول “جدار القدرات الحاسوبية”.

عبّر سوبين جو، أحد الباحثين الرئيسيين في Deepseek، عن فرضية مثيرة للاهتمام: إذا أثبتت Gemini3 قدراتها في مجال pretraining، فإن v3.2 تركز على توسيع التعلم المعزز (RL) وسلاسل القرارات (CoT). هذا لا يعني انخفاض القدرة الحاسوبية — على العكس، يتطلب الأمر إنفاقًا أكبر أثناء الاستدلال. الفكرة الأساسية: يجب أن يستمر التوسع على جميع المستويات، وتقلبات حدوده مجرد ضجيج.

السياق السوقي والقيمة الحقيقية

لكن هنا تظهر نقطة حرجة جدًا. تعترف Deepseek بأن كفاءة استخدام الرموز في هذا الإصدار تعتبر “أدنى” مقارنة بالبدائل. علاوة على ذلك، يتم استخدام عدد أكبر بكثير من الرموز في نسخة النموذج لتحقيق نفس النتائج. هذا يؤثر مباشرة على التكلفة العملية للتنفيذ.

وفقًا للمحللين، الطلب على القدرات الحاسوبية لا يزال غير مستنفد بشكل جوهري. المشكلة الحقيقية ليست في انخفاض الحاجة إلى الحسابات، بل في أن تكلفتها لا تزال مرتفعة جدًا للتوسع التجاري الواسع. فقط الاختراقات الثورية في الأجهزة وهياكل النماذج يمكن أن تغير هذه المعادلة جذريًا.

ما هو معنى ذلك للاعبين الكبار؟

بالنسبة لشركات مثل OpenAI، التي بنيت ميزتها التنافسية على “قدرات النموذج” كـ “ممر مائي” رئيسي، يبدو إصدار Deepseek هذا كتحذير جدي. البديل مفتوح المصدر، الذي يقترب بالفعل من الحلول المغلقة، يقلل من الحجة حول التفوق التكنولوجي الحصري للتطويرات المغلقة.

1 ديسمبر: عاصفة مثالية في السوق؟

من المثير للاهتمام أن هذا الإصدار يصادف بالضبط الذكرى الثالثة لإطلاق ChatGPT. من المتوقع أن يكون سوق مساء اليوم مليئًا بالتقلبات: عدة عوامل ماكرو غير متوقعة من اليابان، حركة BTC، وشائعات حول Amazon re:Invent كمحفز قادم للتغيير. يتداول المحللون بالفعل توقعات حول مدى عدوانية استجابة السوق للمنافسة التي يمثلها يومنا هذا.

ماذا بعد: هل تم ضغط v3 إلى أقصى حد؟

ختامًا، يتساءل بعض المشاركين في الأوساط البحثية عما إذا كانت نسخة v3 قد استُنفدت إلى أقصى حدودها، وإذا حان الوقت للتفكير في v4. إذا قضت Deepseek عامًا كاملًا فقط على تحسين الإصدار 3، فهذا يدل على عمق العمل وطموحات الشركة الجدية. عدد التغييرات على لوحة AI واضح أنه في تزايد.

BTC‎-0.71%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت