تقدم Microsoft نموذج MU AI الذي يعمل على تشغيل وكلاء الذكاء الاصطناعي في إعدادات Windows 11

قدمت Microsoft MU ، نموذج الذكاء الاصطناعي الجديد (AI) يمكن أن يعمل محليًا على جهاز. في الأسبوع الماضي ، أصدرت شركة Tech Giant التي تتخذ من ريدموند مقراً لها ، ميزات Windows 11 الجديدة في Beta ، من بينها ميزة وكلاء الذكاء الاصطناعى الجديدة في الإعدادات. تتيح الميزة للمستخدمين وصف ما يريدون القيام به في قائمة الإعدادات ، وتستخدم وكلاء الذكاء الاصطناعي للانتقال إلى الخيار أو إجراء الإجراء بشكل مستقل. أكدت الشركة الآن أن الميزة مدعومة بنموذج اللغة الصغيرة MU (SLM).
وكلاء Microsoft Mu AI Model Powers في إعدادات Windows
في منشور المدونة، عملت شركة التكنولوجيا العملاقة للتفصيل نموذج الذكاء الاصطناعي الجديد. يتم نشره حاليًا على الجهاز بالكامل في Copilot+ PCS متوافق ، ويعمل على وحدة المعالجة العصبية للجهاز (NPU). عملت Microsoft على تحسين واستقلال النموذج وتزعم أنها تستجيب لأكثر من 100 رمز في الثانية لتلبية “متطلبات UX المتطلبة للوكيل في سيناريو الإعدادات”.
تم تصميم MU على بنية ترميز ترميز تشفير تستند إلى المحولات والتي تضم 330 مليون معلمة رمزية ، مما يجعل SLM مناسبًا للنشر على نطاق صغير. في مثل هذه البنية ، يقوم المشفر أولاً بتحويل الإدخال إلى تمثيل ثابت طوله الطول ، والذي يتم تحليله بعد ذلك بواسطة وحدة فك الترميز ، مما يولد أيضًا الإخراج.
وقالت Microsoft إن هذه البنية كانت مفضلة بسبب الكفاءة العالية والتحسين ، وهو أمر ضروري عند العمل مع النطاق الترددي الحسابي المحدود. للحفاظ على توافقها مع قيود NPU ، اختارت الشركة أيضًا أبعاد الطبقة وتوزيع المعلمات المحسّن بين المشفر وفك التشفير.
تم تقطيره من نماذج PHI للشركة ، وتم تدريب MU باستخدام وحدات معالجة الرسومات A100 على التعلم الآلي Azure. عادة ، تظهر النماذج المقطرة كفاءة أعلى مقارنة بالنموذج الأصل. قامت Microsoft بتحسين كفاءتها من خلال إقران النموذج بالبيانات الخاصة بالمهمة والضبط من خلال أساليب التكيف منخفضة الرتبة (LORA). ومن المثير للاهتمام ، تدعي الشركة أن MU تؤدي على مستوى مماثل مثل PHI-3.5-MINI على الرغم من كونها عُشر الحجم.
تحسين MU لإعدادات Windows
كان على عملاق التكنولوجيا أيضًا حل مشكلة أخرى قبل أن يتمكن النموذج من تشغيل وكلاء الذكاء الاصطناعى في الإعدادات – يجب أن يكون قادرًا على التعامل مع رموز الإدخال والإخراج لتغيير مئات إعدادات النظام. هذا لا يتطلب فقط شبكة المعرفة الواسعة ولكن أيضا انخفاض الكمون لإكمال المهام على الفور تقريبا.
وبالتالي ، قامت شركة Microsoft بتوسيع نطاق بيانات التدريب بشكل كبير ، وانتقلت من 50 إعدادًا إلى مئات ، واستخدمت تقنيات مثل وضع العلامات الاصطناعية وحقن الضوضاء لتعليم AI كيفية عبارات الأشخاص المشتركة. بعد التدريب مع أكثر من 3.6 مليون مثال ، أصبح النموذج سريعًا ودقيقًا بما يكفي للرد في أقل من نصف ثانية ، حسبما زعمت الشركة.
كان أحد التحديات المهم هو أن MU كان أداء أفضل مع استعلامات متعددة الكلمات على عبارات أقصر أو غامضة. على سبيل المثال ، فإن كتابة “سطوع الشاشة السفلي في الليل” يمنحها سياقًا أكثر من مجرد كتابة “السطوع”. لحل هذا ، تواصل Microsoft إظهار نتائج البحث التقليدية القائمة على الكلمات الرئيسية عندما يكون الاستعلام غامضًا للغاية.
لاحظت Microsoft أيضًا فجوة قائمة على اللغة. في الحالات التي يمكن أن تنطبق فيها الإعداد على أكثر من وظيفة واحدة (على سبيل المثال ، يمكن أن تشير “زيادة السطوع” إلى شاشة الجهاز أو شاشة خارجية). لمعالجة هذه الفجوة ، يركز نموذج الذكاء الاصطناعي حاليًا على الإعدادات الأكثر استخدامًا. هذا شيء يواصل عملاق التكنولوجيا تحسينه.