تقدم هيوم ميزة التحكم الصوتي القائمة على إمكانية التفسير لتخصيص الصوت بالذكاء الاصطناعي
كشفت شركة هيوم، وهي شركة ذكاء اصطناعي مقرها نيويورك، عن أداة جديدة يوم الاثنين ستسمح للمستخدمين بتخصيص أصوات الذكاء الاصطناعي. تهدف الميزة الجديدة، التي يطلق عليها اسم التحكم الصوتي، إلى مساعدة المطورين على دمج هذه الأصوات في برامج الدردشة الخاصة بهم والتطبيقات الأخرى المستندة إلى الذكاء الاصطناعي. بدلاً من تقديم مجموعة كبيرة من الأصوات، توفر الشركة تحكمًا دقيقًا في 10 أبعاد مختلفة للأصوات. ومن خلال تحديد المعلمات المطلوبة في كل بُعد من الأبعاد، يمكن للمستخدمين إنشاء أصوات فريدة لتطبيقاتهم.
قامت الشركة بتفصيل أداة الذكاء الاصطناعي الجديدة في ملف مشاركة مدونة. صرحت هيوم بأنها تحاول حل مشكلة الشركات في العثور على صوت الذكاء الاصطناعي المناسب الذي يتناسب مع هوية علامتها التجارية. باستخدام هذه الميزة، يمكن للمستخدمين تخصيص جوانب مختلفة من إدراك الصوت والسماح للمطورين بإنشاء صوت أكثر حزماً واسترخاءً ونشاطًا للتطبيقات القائمة على الذكاء الاصطناعي.
يتوفر التحكم الصوتي الخاص بـ Hume حاليًا في إصدار تجريبي، ولكن يمكن لأي شخص مسجل على النظام الأساسي الوصول إليه. تمكن موظفو Gadgets 360 من الوصول إلى الأداة واختبار الميزة. هناك 10 أبعاد مختلفة يمكن للمطورين تعديلها بما في ذلك الجنس، والحزم، والطفو، والثقة، والحماس، والأنف، والاسترخاء، والنعومة، والفتور، والضيق.
بدلاً من إضافة تخصيص قائم على المطالبة، أضافت الشركة شريط تمرير يتراوح من -100 إلى +100 لكل من المقاييس. وذكرت الشركة أن هذا النهج تم اتباعه لإزالة الغموض المرتبط بالوصف النصي للصوت ولتوفير تحكم دقيق في اللغات.
في اختباراتنا، وجدنا أن تغيير أي من الأبعاد العشرة يُحدث فرقًا مسموعًا في صوت الذكاء الاصطناعي، وكانت الأداة قادرة على فصل الأبعاد المختلفة بشكل صحيح. ادعت شركة الذكاء الاصطناعي أن ذلك تم تحقيقه من خلال تطوير “نهج غير خاضع للرقابة” جديد يحافظ على معظم خصائص كل صوت أساسي عندما تتنوع معلمات محددة. والجدير بالذكر أن هيوم لم يذكر بالتفصيل مصدر البيانات التي تم الحصول عليها.
والجدير بالذكر أنه بعد إنشاء صوت الذكاء الاصطناعي، سيتعين على المطورين نشره في التطبيق من خلال تكوين نموذج الذكاء الاصطناعي لواجهة الصوت التعاطفية (EVI). في حين أن الشركة لم تحدد ذلك، فمن المحتمل أن يكون نموذج EVI-2 قد تم استخدامه لهذه الميزة التجريبية.
في المستقبل، يخطط هيوم لتوسيع نطاق الأصوات الأساسية، وإدخال أبعاد إضافية قابلة للتفسير، وتعزيز الحفاظ على خصائص الصوت في ظل تعديلات شديدة، وتطوير أدوات متقدمة لتحليل وتصور الخصائص الصوتية.
اكتشاف المزيد من موقع لنكات مسلّم
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.