السبت، 17 يونيو 2023

قامت Meta بالإعلان عن نموذج Voicebox الذي سيحدث ثورة في تحويل النص إلى كلام

 

أعلنت شركة Meta اليوم الجمعة عن ثورة في مجال الذكاء الاصطناعي التوليدي المتعلق بالتحدث، وذلك في ظل المنافسة المتصاعدة مع شركات التكنولوجيا العملاقة الأخرى مثل Google و Microsoft و Amazon.


فقد أعلنت Meta عن تطويرها لنموذج ذكاء اصطناعي جديد يُسمى Voicebox، والذي يمتلك القدرة على أداء مهام إنشاء الكلام مثل التحرير وأخذ العينات وتحديد الأسلوب. ويتميز هذا النموذج بقدرته على التعلم في السياق، حيث يحصل على تدريب خاص لتنفيذ تلك المهام.


وأشارت شركة التكنولوجيا العملاقة، التي تملك Facebook و Instagram و WhatsApp وغيرها، إلى إمكانية استخدام Voicebox لإنتاج مقاطع صوتية عالية الجودة وتحرير المقاطع الصوتية المُسجلة سابقًا، مثل إزالة أصوات أبواق السيارات أو نباح الكلاب، مع الحفاظ على جودة المحتوى ونغمة الصوت.


وتتميز خدمة Voicebox بإمكانياتها الفريدة في اللغات المتعددة، حيث يمكنها إنتاج الكلام ب 6 لغات مختلفة.


وتعتقد Meta أنه في المستقبل، يُمكن لنماذج الذكاء الاصطناعي المتعددة الأغراض مثل Voicebox أن توفر أصواتًا طبيعية للمساعدين الافتراضيين وشخصيات غير الاعبين في الميتافيرس.


كما أفادت الشركة بأن هذه النماذج تمكّن الأشخاص ذوي البصر الضعيف من سماع رسائل مكتوبة من الأصدقاء، حيث يتم قراءتها بأصواتهم من خلال الذكاء الاصطناعي، كما توفر لمنشئي المحتوى أدوات جديدة لإنشاء وتحرير المقاطع الصوتية لمقاطع الفيديو بسهولة، وغير ذلك الكثير.


ويمكن لنموذج Voicebox، باستخدام عينة صوتية تدوم لمدة ثانيتين فقط، أن يتطابق مع نمط الصوت ويستخدمه لتطوير تقنية تحويل النص إلى كلام.


كما أشارت Meta إلى إمكانية قدرة النموذج الجديد للذكاء الاصطناعي المتعدد الأغراض على إعادة صياغة جزء من الكلام المشوش أو استبدال الكلمات المنطوقة بشكل خاطئ، دون الحاجة إلى إعادة تسجيل الكلام بالكامل.


وعندما يتم تقديم عينة من كلام شخص ما ومقطع نصي باللغة الإنجليزية أو الفرنسية أو الألمانية أو الإسبانية أو البولندية أو البرتغالية، يستطيع نموذج Voicebox قراءة النص بأي من تلك اللغات، حتى عندما يكون النموذج نفسه مختلف اللغات في مجال الكلام والنص.


وتأمل ميتا أن تستغل هذه القدرة في المستقبل لتعزيز التواصل بين الأفراد بشكل طبيعي وحقيقي، حتى لو لم يتقنوا نفس اللغات.


وبفضل استفادتها من مجموعة متنوعة من البيانات، أعلنت الشركة أن نموذجها يمتلك القدرة على إنتاج كلام يعبّر بشكل أفضل عن طريقة التواصل للأشخاص في العالم الحقيقي، وذلك باللغات الست التي يدعمها حاليًا.


كما تعتبر Meta أن Voicebox تمثل خطوة هامة للأمام في جهودها في مجال الذكاء الاصطناعي التوليدي. وإنها تتطلع لمواصلة استكشافها في مجال الصوت ومشاهدة كيف يستفيد الباحثون الآخرون من عملها.



from موضوع جديد لك https://ift.tt/fhVFt7N
via IFTTT

ليست هناك تعليقات:

إرسال تعليق