ميتا تطلق نموذج Spirit LM لتقليد الأصوات البشرية بشكل طبيعي

أعلنت شركة ميتا عن إطلاق نموذجها الجديد للذكاء الاصطناعي “Spirit LM“، الذي يتميز بقدرته على تقليد الأصوات البشرية بشكل دقيق وطبيعي. النموذج الجديد مفتوح المصدر ويهدف إلى تحسين التجارب الصوتية عبر الذكاء الاصطناعي، خاصةً في مجالات التفاعل الصوتي.

ما هو نموذج “Spirit LM“؟

يعد “Spirit LM” نموذجًا لغويًا متقدمًا يحتوي على 7 مليارات معلمة، وهو قادر على معالجة الأصوات بشكل أكثر تعقيدًا من النماذج التقليدية. يعتمد هذا النموذج على رموز الفونيم والنغمات ودرجات الصوت، مما يجعله قادرًا على إنتاج أصوات أكثر طبيعية وتعبيرًا.

استثمارات تصل إلى 250 ألف دولار لدعم رائدات التكنولوجيا

فوري تطلق خدمات الدفع الإلكتروني عبر تطبيق “طريقي” لتحصيل رسوم الطرق الذكية

CODE81 تطلق كتاباً جديداً حول التحول نحو التطبيقات المستقلة والذكاء الاصطناعي

أهداف ميتا من إطلاق “Spirit LM“

تهدف ميتا من خلال “Spirit LM” إلى توفير تجربة صوتية طبيعية، تعزز من قدرات الروبوتات الذكية في التواصل الصوتي. يسعى النموذج إلى تجاوز القيود التقليدية التي تعتمد على تقنيات التعرف التلقائي على الكلام (ASR)، والتي قد تؤدي إلى فقدان الكثير من التعبيرات الطبيعية في الصوت.

مجالات استخدام “Spirit LM“

تتوقع ميتا أن يُستخدم “Spirit LM” في العديد من التطبيقات الذكية، مثل واتساب وإنستاجرام وفيسبوك، مما يسمح للمستخدمين بالتفاعل مع الذكاء الاصطناعي عبر محادثات صوتية أكثر تعقيدًا وتعبيرًا. وهذا النموذج يمكنه تعلم مهام جديدة مثل تحويل النص إلى صوت وتصنيف الكلام.

استثمار مفتوح المصدر

توفر ميتا نموذج “Spirit LM” كمشروع مفتوح المصدر، مما يتيح للباحثين والمطورين فرصة تحسينه واستخدامه في مشاريعهم الخاصة. هذا النهج يعزز من تسريع التطوير في مجال الذكاء الاصطناعي الصوتي، ويجعل التكنولوجيا أكثر سهولة للوصول.