تقدم هيوم ميزة التحكم الصوتي القائمة على إمكانية التفسير لتخصيص الصوت بالذكاء الاصطناعي

كشفت شركة هيوم، وهي شركة ذكاء اصطناعي مقرها نيويورك، عن أداة جديدة يوم الاثنين ستسمح للمستخدمين بتخصيص أصوات الذكاء الاصطناعي. تهدف الميزة الجديدة، التي يطلق عليها اسم التحكم الصوتي، إلى مساعدة المطورين على دمج هذه الأصوات في برامج الدردشة الخاصة بهم والتطبيقات الأخرى المستندة إلى الذكاء الاصطناعي. بدلاً من تقديم مجموعة كبيرة من الأصوات، توفر الشركة تحكمًا دقيقًا في 10 أبعاد مختلفة للأصوات. ومن خلال تحديد المعلمات المطلوبة في كل بُعد من الأبعاد، يمكن للمستخدمين إنشاء أصوات فريدة لتطبيقاتهم.

قامت الشركة بتفصيل أداة الذكاء الاصطناعي الجديدة في ملف مشاركة مدونة. صرحت هيوم بأنها تحاول حل مشكلة الشركات في العثور على صوت الذكاء الاصطناعي المناسب الذي يتناسب مع هوية علامتها التجارية. باستخدام هذه الميزة، يمكن للمستخدمين تخصيص جوانب مختلفة من إدراك الصوت والسماح للمطورين بإنشاء صوت أكثر حزماً واسترخاءً ونشاطًا للتطبيقات القائمة على الذكاء الاصطناعي.

يتوفر التحكم الصوتي الخاص بـ Hume حاليًا في إصدار تجريبي، ولكن يمكن لأي شخص مسجل على النظام الأساسي الوصول إليه. تمكن موظفو Gadgets 360 من الوصول إلى الأداة واختبار الميزة. هناك 10 أبعاد مختلفة يمكن للمطورين تعديلها بما في ذلك الجنس، والحزم، والطفو، والثقة، والحماس، والأنف، والاسترخاء، والنعومة، والفتور، والضيق.

بدلاً من إضافة تخصيص قائم على المطالبة، أضافت الشركة شريط تمرير يتراوح من -100 إلى +100 لكل من المقاييس. وذكرت الشركة أن هذا النهج تم اتباعه لإزالة الغموض المرتبط بالوصف النصي للصوت ولتوفير تحكم دقيق في اللغات.

في اختباراتنا، وجدنا أن تغيير أي من الأبعاد العشرة يُحدث فرقًا مسموعًا في صوت الذكاء الاصطناعي، وكانت الأداة قادرة على فصل الأبعاد المختلفة بشكل صحيح. ادعت شركة الذكاء الاصطناعي أن ذلك تم تحقيقه من خلال تطوير “نهج غير خاضع للرقابة” جديد يحافظ على معظم خصائص كل صوت أساسي عندما تتنوع معلمات محددة. والجدير بالذكر أن هيوم لم يذكر بالتفصيل مصدر البيانات التي تم الحصول عليها.

والجدير بالذكر أنه بعد إنشاء صوت الذكاء الاصطناعي، سيتعين على المطورين نشره في التطبيق من خلال تكوين نموذج الذكاء الاصطناعي لواجهة الصوت التعاطفية (EVI). في حين أن الشركة لم تحدد ذلك، فمن المحتمل أن يكون نموذج EVI-2 قد تم استخدامه لهذه الميزة التجريبية.

في المستقبل، يخطط هيوم لتوسيع نطاق الأصوات الأساسية، وإدخال أبعاد إضافية قابلة للتفسير، وتعزيز الحفاظ على خصائص الصوت في ظل تعديلات شديدة، وتطوير أدوات متقدمة لتحليل وتصور الخصائص الصوتية.

مرتبط

الوسوم

اترك تعليقاً إلغاء الرد

Georgia Waltrip
Hi, this is a comment. To get started with moderating, editi...
James Kim
Hi, this is a comment. To get started with moderating, editi...
Donald Allbright
Hi, this is a comment. To get started with moderating, editi...
Georgia Waltrip
Hi, this is a comment. To get started with moderating, editi...
Ernest Baker
Hi, this is a comment. To get started with moderating, editi...

تقدم هيوم ميزة التحكم الصوتي القائمة على إمكانية التفسير لتخصيص الصوت بالذكاء الاصطناعي

مرتبط

اترك تعليقاً إلغاء الرد

دليل عملي لبناء أعمال تجارية جاهزة للإنترنت

انقراض العمل: 7 تهديدات تتطلب خطة.

أفضل 4 مخاطر تجارية لتجاهل استراتيجية تكنولوجيا المعلومات

أنمي Skip to Loafer الموسم الاول الحلقة 11 مترجمة

فيلم Other People’s Children 2022 مترجم اون لاين

أكبر 10 أفلام ألغاز DC لم يتم حلها بعد

فريق التمثيل وكل ما نعرفه

سلاح Loki الأكثر دموية هو أيضًا الأكثر إثارة للاشمئزاز

10 حقائق مثيرة للاهتمام حول مصمم كيم كارداشيان دانييل ليفي

مرتبط

مقالات ذات صلة

دليل عملي لبناء أعمال تجارية جاهزة للإنترنت

انقراض العمل: 7 تهديدات تتطلب خطة.

أفضل 4 مخاطر تجارية لتجاهل استراتيجية تكنولوجيا المعلومات

لماذا يحتاج عملك أكثر من مجرد نسخ احتياطية

اترك تعليقاً إلغاء الرد

دليل عملي لبناء أعمال تجارية جاهزة للإنترنت

انقراض العمل: 7 تهديدات تتطلب خطة.

أفضل 4 مخاطر تجارية لتجاهل استراتيجية تكنولوجيا المعلومات

أنمي Skip to Loafer الموسم الاول الحلقة 11 مترجمة

فيلم Other People’s Children 2022 مترجم اون لاين

أكبر 10 أفلام ألغاز DC لم يتم حلها بعد

فريق التمثيل وكل ما نعرفه

سلاح Loki الأكثر دموية هو أيضًا الأكثر إثارة للاشمئزاز

10 حقائق مثيرة للاهتمام حول مصمم كيم كارداشيان دانييل ليفي