الموجه الدلالي للنماذج اللغوية الكبيرة الافتراضية: تكاملٌ بين التوجيه الشبكي الذكي والذكاء الاصطناعي مفتوح المصدر
بقلم: هوامين تشين، كبير مهندسي البرمجيات الرئيسيين لدى ريد هات

20 نوفمبر 2025: تشهد وتيرة الابتكار في النماذج اللغوية الكبيرة (LLMs) تسارعاً مطرداً، إلا أن انتقال الشركات لاستخدام هذه النماذج في بيئات الإنتاج يؤدي إلى طرحٍ مختلف مع انتقال التركيز ليس من الحجم الهائل فحسب، بل أيضاً إلى كفاءة استهلاك الموارد والاستخدام الذكي والموجه للحوسبة.
على هذا الصعيد، لا تتطلب جميع الطلبات نفس القدر من التعقيد والتحليل؛ فإذا كان لدى المستخدم طلب بسيط، مثل "ما هي عاصمة ولاية كارولينا الشمالية؟"، فإنه لا يحتاج إلى العملية التحليلية متعددة الخطوات التي يحتاجها طلب تقديرات مالية على سبيل المثال. وإذا ما قامت المؤسسات باستخدام نماذج استدلال معقدة ومرهقة الموارد لكل طلب، فإن النتيجة ستكون مكلفة وغير فعالة. وينتج عن ذلك معضلةٌ نسميها تحدي تنفيذ "ميزانيات الاستدلال". ولهذا السبب طورت "ريد هات" المشروع مفتوح المصدر "الموجه الدلالي للنماذج اللغوية الكبيرة الافتراضية" (vLLM Semantic Router)، والذي يختار بذكاء أفضل نموذج لكل مهمة، ما يزيد الكفاءة وسهولة الاستخدام ويقلل التكاليف.
ما هو "الموجه الدلالي للنماذج اللغوية الكبيرة الافتراضية"؟
يعد "الموجه الدلالي للنماذج اللغوية الكبيرة الافتراضية" نظاماً مفتوح المصدر، يعمل كطبقةٍ ذكية لتوجيه الطلبات والأوامر، آخذاً بعين الاعتبار التكلفة لمحرك استدلال النماذج اللغوية الكبيرة الافتراضية عالي الكفاءة. ويعتبر هذا النظام بمثابة صانع القرار في سلسة استدلال النموذج اللغوي، ويعالج تحديات الكفاءة من خلال التوجيه الديناميكي القائم على الدلالة، عن طريق:
استخدام أداة تصنيف خفيفة الحجم، مثل ModernBERT ونماذج أخرى مدربة مسبقاً لتحليل نية الاستعلام ومدى تعقيده.
توجيه الاستعلامات البسيطة إلى نموذج لغوي أصغر حجماً وأسرع، أو إلى نموذج لا يقوم بعمليات تحليل معقدة، لتوفير موارد الحوسبة.
توجيه الطلبات والأوامر المعقدة التي تتطلب تحليلاً عميقاً إلى نماذج أكثر قوة تدعم عمليات الاستدلال والتحليل المعقد.
ويهدف "الموجه الدلالي للنماذج اللغوية الكبيرة الافتراضية" إلى ضمان إضفاء القيمة من خلال كل رمز تم إنشاؤه. ويوفر الموجه زمن استجابة منخفض وقدرة عالية على المعالجة المتزامنة، حيث تم تصميمه لتقديم أداءٍ عالٍ وكتابته بلغة Rust وتطويره باستخدام إطار Candle من Hugging Face.
وبفضل قوة المصادر المفتوحة، يعزز "الموجه الدلالي للنماذج اللغوية الكبيرة الافتراضية" مرونة استخدام النماذج من خلال توفير تبديل فعال بين النماذج والتوجيه الدلالي. ويمنح ذلك المطورين تحكماً دقيقاً في الموازنة بين الكفاءة والدقة من خلال الاختيار التلقائي للنموذج اللغوي الكبير المناسب ووضع الاستدلال المناسب للمهمة. وعلى نفس القدر من الأهمية، يدعم المشروع النشر السحابي المحلي من خلال التكامل الأصلي مع "كوبرنيتس" وباستخدام الأداة المساعدة Envoy ext_proc. ويجسد ذلك تصميم "الموجه الدلالي للنماذج اللغوية الكبيرة الافتراضية" ليتم نشره وإدارته وتوسيع نطاقه عبر بيئات الحوسبة الهجينة باستخدام "ريد هات أوبن شيفت"، ما يدعم بشكل كامل أفضل الممارسات السحابية عبر أي بيئة سحابية.
"الموجه الدلالي للنماذج اللغوية الكبيرة الافتراضية" والإطار المتقدم ومفتوح المصدر للاستدلال الموزع lllm-d
يمكن لـ"الموجه الدلالي للنماذج اللغوية الكبيرة الافتراضية" أن يجد العديد من حالات استخدام النشر. على سبيل المثال، يمكن للمستخدمين في المؤسسات تطبيق مفاهيم التوجيه نفسها في عمليات نشر الإطار المتقدم ومفتوح المصدر للاستدلال الموزع llm-d عبر القطاعات، فقد يستخدم فريق واحد نموذج GPT-OSS-120B يعمل على مجموعة إنتاجية من H100، في حين يصل فريق آخر إلى نفس النموذج على أجهزة A100 لأغراض التجريب. وباستخدام قدرات التصنيف في "الموجه الدلالي للنماذج اللغوية الكبيرة الافتراضية" والمدمجة مع الإطار المتقدم ومفتوح المصدر للاستدلال الموزع llm-d، يمكن للطلبات مشاركة نقطة دخول واحدة يتم توجيهها بذكاء إلى نقطة النهاية المناسبة للبنية التحتية، ما يضمن الأداء الأمثل بناءً على المستخدم والسياسة وموارد الحوسبة المتاحة.
ويدعم "الموجه الدلالي للنماذج اللغوية الكبيرة الافتراضية" التخزين الدلالي المؤقت وكشف محاولات الاختراق عند نشره مع الإطار المتقدم ومفتوح المصدر للاستدلال الموزع llm-d. ومن خلال التخزين الدلالي المؤقت، يمكن للطلبات أو الأوامر المكررة أو المتشابهة إعادة استخدام نتائج الاستدلال الموجودة، ما يقلل من عبء الحوسبة للاستفسارات الزائدة عن الحاجة، وهو ما يكتسب أهميةً خاصة في بيئات الإنتاج التي تضم أنماط أسئلة متكررة وجلسات دردشة. وتعتمد قدرة كشف محاولات الاختراق على طبقة التوجيه الموزعة في llm-d للإشارة إلى الطلبات غير المطابقة للسياسات قبل وصولها إلى محرك الاستدلال. ويوفر هذا المزيج للمؤسسات سير عمل استدلال أكثر أماناً وكفاءة ومراعاة للسياسات.
القيمة العائدة على المؤسسات والمجتمع
فيما يتعلق بالمؤسسات، فإن استخدام "الموجه الدلالي للنماذج اللغوية الكبيرة الافتراضية" يترجم مباشرة إلى قيمة تجارية قابلة للقياس من خلال المساعدة في حل معضلة الموازنة بين التكلفة والدقة. وأظهرت معايير أداء المشروع، مع ضبط وضع الاستدلال التلقائي باستخدام نموذج MMLU-Pro وQwen3 30B، مكاسب كبيرة في الكفاءة، حيث تحسنت الدقة في المهام المعقدة بنسبة 10.2%، فيما انخفض زمن الاستجابة واستهلاك الرموز بنسبة 47.1% و48.5% على التوالي. وتشير هذه النتائج إلى أنَّ تأثير "الموجه الدلالي للنماذج اللغوية الكبيرة الافتراضية" يتجاوز خفض التكاليف التشغيلية الإجمالية، ويشمل المساعدة في إدارة بصمة نماذج الاستدلال، مما يؤدي إلى استخدام أكثر استدامة للطاقة.
وعندما بدأتُ في تطوير "الموجه الدلالي للنماذج اللغوية الكبيرة الافتراضية"، كنت على علمٍ بأنَّ هذا النوع من التوجيه الدلالي محصور إلى حد كبير في الأنظمة المغلقة واحتكارية المصدر، إلا أن طبيعة "ريد هات" القائمة على تطوير الحلول مفتوحة المصدر تتطلب منا أن نقدم هذه الإمكانية الحيوية إلى مجتمع المصادر المفتوحة، لجعلها متاحة وشفافة للجميع. وأكدت الاستجابة الفورية مدى الحاجة إليه، فقد اكتسب المشروع زخماً قوياً من مجتمع المهنيين والمختصين خلال فترةٍ وجيزة، حيث حصل على أكثر من 2000 نجمة وما يقارب 300 عملية تنزيل على GitHub بعد مرور شهرين على طرحه. ويرسخ هذا الدعم من مجتمع المصادر المفتوحة قناعتي المسبقة حول كيفية بناء مستقبل البنية التحتية للذكاء الاصطناعي بشكل تعاوني ومفتوح.
وتتبنى "ريد هات" رؤية واضحة لعصر الذكاء الاصطناعي، بغض النظر عن النموذج، أو المسرع الأساسي، أو بيئة النشر، فالنموذج اللغوي الكبير الافتراضي مقدر له أن يكون المعيار المفتوح الأساسي للاستدلال عبر الحوسبة السحابية الهجينة الجديدة، ويحقق "الموجه الدلالي للنماذج اللغوية الكبيرة الافتراضية" هذه الرؤية.
وينتقل مفهوم الاستدلال من "هل يمكننا تشغيله؟" إلى "كيف يمكننا تشغيله بشكل أفضل؟"، حيث يوفر "الموجه الدلالي للنماذج اللغوية الكبيرة الافتراضية" الطبقة الحوسبية المتطورة المدركة للمهام، مما يزود المؤسسات بالأدوات مفتوحة المصدر التي تحتاجها لبناء ذكاءٍ اصطناعي فعال ومسؤول وجاهز لتلبية متطلباتها. ولنرسم معاً معالم المرحلة التالية من استدلال النماذج اللغوية الكبيرة، تفضلوا بزيارة موقع المشروع، ومجتمع "الموجه الدلالي للنماذج اللغوية الكبيرة الافتراضية" على GitHub.






