أعلنت شركة ميتا عن إطلاق نموذجها الجديد للذكاء الاصطناعي “Spirit LM“، الذي يتميز بقدرته على تقليد الأصوات البشرية بشكل دقيق وطبيعي. النموذج الجديد مفتوح المصدر ويهدف إلى تحسين التجارب الصوتية عبر الذكاء الاصطناعي، خاصةً في مجالات التفاعل الصوتي.
ما هو نموذج “Spirit LM“؟
يعد “Spirit LM” نموذجًا لغويًا متقدمًا يحتوي على 7 مليارات معلمة، وهو قادر على معالجة الأصوات بشكل أكثر تعقيدًا من النماذج التقليدية. يعتمد هذا النموذج على رموز الفونيم والنغمات ودرجات الصوت، مما يجعله قادرًا على إنتاج أصوات أكثر طبيعية وتعبيرًا.
أهداف ميتا من إطلاق “Spirit LM“
تهدف ميتا من خلال “Spirit LM” إلى توفير تجربة صوتية طبيعية، تعزز من قدرات الروبوتات الذكية في التواصل الصوتي. يسعى النموذج إلى تجاوز القيود التقليدية التي تعتمد على تقنيات التعرف التلقائي على الكلام (ASR)، والتي قد تؤدي إلى فقدان الكثير من التعبيرات الطبيعية في الصوت.
مجالات استخدام “Spirit LM“
تتوقع ميتا أن يُستخدم “Spirit LM” في العديد من التطبيقات الذكية، مثل واتساب وإنستاجرام وفيسبوك، مما يسمح للمستخدمين بالتفاعل مع الذكاء الاصطناعي عبر محادثات صوتية أكثر تعقيدًا وتعبيرًا. وهذا النموذج يمكنه تعلم مهام جديدة مثل تحويل النص إلى صوت وتصنيف الكلام.
استثمار مفتوح المصدر
توفر ميتا نموذج “Spirit LM” كمشروع مفتوح المصدر، مما يتيح للباحثين والمطورين فرصة تحسينه واستخدامه في مشاريعهم الخاصة. هذا النهج يعزز من تسريع التطوير في مجال الذكاء الاصطناعي الصوتي، ويجعل التكنولوجيا أكثر سهولة للوصول.








