السياسي -وكالات
أعلنت شركة ميتا إطلاق مشروع جديد يُدعى “NotebookLlama”، وهو نسخة مفتوحة المصدر لنظام إنشاء الحلقات الصوتية التفاعلية “البودكاست” اعتماداً على الذكاء الاصطناعي، وهي بذلك تنافس منصة غوغل المماثلة NotebookLM التي نالت شهرة واسعة حديثاً.
ويعتمد المشروع على نماذج الذكاء الاصطناعي الخاصة بشركة ميتا، المعروفة باسم “Llama”، لتنفيذ جزء كبير من عمليات المعالجة.
وعلى غرار NotebookLM، يمكن لـ NotebookLlama توليد ملخصات صوتية بأسلوب حواري يشبه حلقات البودكاست استناداً إلى الملفات النصية التي تُرفع إليه.
وفي البداية، تحوّل أداة NotebookLlama النصوص إلى ملفات صوتية، مثل مقالات الأخبار أو المنشورات، ثم تضيف “لمسات درامية” وتفاعلات تُضفي طابعاً حيوياً على النصوص قبل إرسالها إلى نماذج مفتوحة لتحويل النص إلى كلام.
أصوات غير طبيعية
ولا تضاهي النتائج حالياً الجودة الصوتية لأداة NotebookLM من غوغل، إذ يظهر في عينات الصوت من أداة ميتا NotebookLlama أن الأصوات لا تبدو طبيعية، وتبدو آلية إلى حد بعيد، كما تميل إلى التداخل في الحديث بنحو غير متناسق.
ومع ذلك، يشير الباحثون في ميتا إلى إمكانية تحسين الجودة باستخدام نماذج أقوى، مضيفين أن “نموذج تحويل النص إلى كلام هو المحدد الرئيسي لمدى طبيعية الصوت”، كما أوضحوا أنه يمكن أيضاً اتباع نهج آخر لتوليد البودكاست عبر جعل اثنين من وكلاء الذكاء الاصطناعي يناقشان الموضوع ويضعان هيكل الحوار، في حين يُستخدم حالياً نموذج واحد لكتابة المخطط.
ومن الجدير بالذكر أن أداة NotebookLlama ليست المحاولة الأولى لاستنساخ ميزة البودكاست من أداة غوغل NotebookLM، فقد ظهرت عدة مشاريع تتفاوت في مستوى النجاح، لكن لم يتمكن أي منها حتى الآن من التغلب على مشكلة “الهلوسة” التي تُعانيها كافة تطبيقات الذكاء الاصطناعي، ومنها أداة NotebookLM نفسها، إذ قد تولّد معلومات غير دقيقة أو مُختلَقة في البودكاست.
The work highlight of my weekend was generating 10+ custom podcasts with NotebookLM and listening on walks and commutes.
There is so much noise—we need more AI that summarizes.
— Allie K. Miller (@alliekmiller) September 30, 2024