تقنية وإنترنت

Beatoven.ai، وهي منصة هندية لتوليد الموسيقى تعمل بالذكاء الاصطناعي، تجعل إنشاء الموسيقى متاحًا


لقد كانت التكنولوجيا دائمًا بمثابة عامل تسوية عظيم. فمن العصر الصناعي إلى عصر الإنترنت، أدى ذلك إلى تحسين نوعية الحياة للجماهير وجعل الوصول إلى الأشياء التي لم يكن من الممكن تصورها في السابق أكثر سهولة. يحتاج المرء فقط إلى إلقاء نظرة على هواتفهم الذكية لفهم كيف أصبح التواصل مع شخص يجلس على بعد آلاف الكيلومترات أمرًا شائعًا لدرجة أن معظمهم لا يفكرون في الأمر كثيرًا. قبل غراهام بيل، كانت هذه الاتصالات بعيدة المدى متاحة فقط للأثرياء وذوي النفوذ بسبب التكاليف المرتفعة المرتبطة بها.

هذه الأمثلة لا تعد ولا تحصى. من وسائل التواصل الاجتماعي التي توفر اتصالاً حقيقيًا في جميع أنحاء العالم، وتطبيقات الهواتف الذكية التي تعمل على رقمنة المهام التي تتطلب حضورًا فعليًا وتستغرق ساعات من اليوم، والعمل عن بعد الذي يمكّن الأشخاص الذين يعيشون بعيدًا عن مراكز الشركات من الحصول على فرص أفضل للكسب، فقد أضفت التكنولوجيا طابعًا ديمقراطيًا على إمكانية الوصول نفسها. ومن نواحٍ عديدة، أصبح الذكاء الاصطناعي التوليدي هو حامل الشعلة التالي لتوسيع إمكانية الوصول إلى حدود جديدة.

أحد هذه المجالات حيث يمكن لإمكانية الوصول أن يكون لها تأثير كبير هي صناعة الموسيقى. على الرغم من وصول منصات البث المستقلة مثل Spotify، وSoundCloud، وApple Music، وغيرها، مما يجعل توزيع الموسيقى أرخص، فإن المشكلة التي لا تزال قائمة هي إنشاء الموسيقى. اليوم، أصبحت الموسيقى الخلفية الأصلية سلعة تشتد الحاجة إليها. من الفنانين المحترفين إلى منشئي الوسائط الاجتماعية ومقدمي البودكاست، يحتاج الجميع إلى مقطوعات موسيقية لمحتواهم، ويفضل أن تكون أصلية، لتجنب أي مخالفات لحقوق الطبع والنشر من قبل المنصات (يدرك منشئو محتوى YouTube جيدًا تأثيرها) أو دعوى قضائية.

ولكن خلق الموسيقى ليس كوب الشاي للجميع. على الأرجح، إذا لم تتدرب لسنوات على إتقان آلة موسيقية واحدة أو عدة آلات موسيقية، ومع ذلك تريد موسيقى أصلية وفريدة لتلبية احتياجاتك المهنية، فستجد نفسك عالقًا بين حلين باهظين فقط – استئجار منتج موسيقى أو موسيقي جلسة، أو الدفع على الانترنت لشراء الموسيقى الأسهم. ولكن ليس بعد الآن، لأن هذا هو المكان الذي تدخل فيه الذكاء الاصطناعي.

لنأخذ على سبيل المثال Beatoven.ai، وهي منصة هندية لتوليد الموسيقى تعمل بالذكاء الاصطناعي وتتيح للمستخدمين كتابة رسالة نصية بسيطة لإنشاء موسيقى خلفية جديدة وفريدة من نوعها في غضون عشر ثوانٍ. لفهم كيفية عمل هذه التكنولوجيا، وآثارها المختلفة، وتجربة إدارة مثل هذه الشركة الناشئة المبتكرة، تحدثنا في Gadgets 360 مع منصور رحيمات خان، المؤسس المشارك والرئيس التنفيذي لشركة Beatoven.ai.

بداية ورحلة Beatoven.ai

منصور رحيمات خان منصور رحيمات خان

منصور رحيمات خان، الرئيس التنفيذي والمؤسس المشارك لشركة Beatoven.ai في حفل توزيع جوائز Gadgets 360

ينحدر منصور رحيمات خان من عائلة جواليور-إندور-دارواد جارانا من سيتار، وهي عائلة مشهورة من الموسيقيين الذين عزفوا وشكلوا موسيقى السيتار الحديثة لمدة سبعة أجيال. لم يكن خان مختلفًا، لكنه اختار مسارًا مختلفًا بسبب شغفه الآخر، وهو التكنولوجيا. “لقد أكملت تخرجي من المعهد الوطني للتكنولوجيا (NIT)، جوا، في هندسة الإلكترونيات والاتصالات. كان هذا أيضًا عندما بدأت التعمق في الفضاء الذي يقع عند تقاطع الموسيقى والتكنولوجيا.

بعد العمل لبضع سنوات، التقى خان بسيدهارت بهاردواج، وهو خريج المعهد الهندي للتكنولوجيا (IIT)، الله أباد (المعروف الآن باسم براياجراج)، وعشاق الموسيقى. حدد الثنائي، الذي يشترك في اهتمامات مماثلة، مشكلة ترخيص الموسيقى في المحتوى وأراد بناء شيء يمكن أن يجعل الموسيقى في متناول الملايين من المبدعين – سواء على وسائل التواصل الاجتماعي أو الذين يتابعون مهنة بشكل احترافي. كان هذا هو نشأة Beatoven.ai.

لكن كان هناك مشكلة واحدة. حتى عندما بدأ الثنائي العمل على المنتج والشركة الناشئة في عام 2021، كان حل المشكلة يتطلب الذكاء الاصطناعي التوليدي، والذي كان لا يزال على بعد عام من الوصول إلى الاتجاه السائد (في نوفمبر 2022، يمكن القول إن ChatGPT بدأ سباق الذكاء الاصطناعي العام).

“في البداية، كان النموذج الأولي الذي بنيناه في عام 2021 عبارة عن منصة مجردة للغاية. يمكن للمستخدمين تحديد النوع والإيقاع وتحديد المدة، وسنقوم بإنشاء مقطوعة موسيقية أصلية. في ذلك الوقت، لم تكن هناك نماذج لغوية كبيرة (LLM)، لذلك كان علينا بناء مجموعتنا التقنية بالكامل من الصفر. قال خان: “اليوم، لدينا التكنولوجيا الخاصة بنا والتي بدأنا في بنائها في ذلك الوقت”.

أصبحت الأمور أسهل بمجرد ظهور موجة الذكاء الاصطناعي، واستفادت شركة Beatoven.ai من توفر حاملي شهادات الماجستير في السوق، حيث تمكنوا من خلال ذلك من تجهيز منصتهم بشكل أفضل لتلبية احتياجات قاعدة المستخدمين الحالية التي تضم مليون مستخدم.

منصة Beatoven.ai

النظام الأساسي على الويب فقط هو أداة توليد موسيقى مدعومة بالذكاء الاصطناعي لمنشئي المحتوى. يمكن للمستخدمين، بمجرد قيامهم بالتسجيل، كتابة مطالبة نصية لإنشاء موسيقى خلفية أصلية. وبدلاً من ذلك، تتيح المنصة أيضًا للمستخدمين اختيار الإيقاع والمدة والنوع والمزاج لإنشاء الموسيقى.

بمجرد قيام المستخدم بإضافة الإدخال، يتولى الذكاء الاصطناعي المهمة ويولد أربعة مسارات منفصلة. توفر المنصة أيضًا ميزات تحرير ما بعد الجيل حيث يمكن للمستخدمين تغيير الآلة الموسيقية، أو تقليل أو زيادة مستوى الصوت في أجزاء معينة، أو إعادة إنشاء قسم كامل من المسار. قال خان إن المسار الواحد يمكن أن يصل طوله إلى 15 دقيقة، على الرغم من عدم وجود حد أعلى، والقيمة المقترحة موجودة للحفاظ على وقت العرض قصيرًا. سيستغرق إنشاء مسار يبلغ متوسط ​​طوله 1-2 دقيقة حوالي 10 ثوانٍ. استنادًا إلى البيانات التي شاركتها الشركة، منذ إنشائها، أنتجت Beatoven 15 ألف مقطع صوتي وحققت 3 آلاف تنزيل.

لا تسمح المنصة حاليًا للمستخدمين بإنشاء مسارات مدمجة حيث يتم مزج نوعين أو أكثر، لكن خان صرح لـ Gadgets 360 حصريًا أن الشركة ستصدر قريبًا تحديثًا جديدًا سيضيف هذه الميزة.

لقد اختبرنا أيضًا المنصة ووجدنا أن الموسيقى واقعية تمامًا. تم إنشاء الأغنية التالية باستخدام المطالبة “إنشاء نشيد EDM عالي الطاقة مع إيقاع مثالي لحفلة رقص”.

مكدس التكنولوجيا Beatoven.ai

هناك مكونان لمنصة Beatoven. الأول هو LLM، الذي يسمح للمستخدمين بكتابة المطالبات باللغة الطبيعية ثم معالجة تلك المعلومات بتنسيق يمكن أن يفهمه الذكاء الاصطناعي لتحويله إلى موسيقى. يستخدم بدء التشغيل نماذج GPT لهذا الجزء.

يفهم المكون الثاني نية المستخدم ويقوم بإنشاء مسار يلبي المعلمة. تم إنشاء هذه البنية من قبل الشركة محليًا. يستخدم نموذج الذكاء الاصطناعي بنية التعلم المتباينة لتحقيق ذلك. يسلط خان الضوء على أن الإلهام لهذه التقنية جاء من نموذج CLIP الخاص بـ OpenAI، لكنه يشير بسرعة إلى أن نموذج OpenAI تم تصميمه للنصوص والصور، وكان Beatoven أول من استخدمه للصوت والموسيقى. ونظرًا لكونه عملًا خاصًا، فقد تمكنت الشركة أيضًا من تحسين العملية. على سبيل المثال، أخبرنا خان أن النظام الأساسي يستخدم استدلال وحدة المعالجة المركزية (CPU) بدلاً من استدلال وحدة معالجة الرسومات (GPU). يعد هذا أمرًا ملحوظًا نظرًا لأن حتى برامج LLM الصغيرة تتطلب استنتاج GPU لتشغيلها.

حصلت الشركة الناشئة على ما يقرب من 100000 عينة بيانات من فنانين مستقلين لتدريب نموذج الذكاء الاصطناعي. تعاونت الشركة مع ما يقرب من 250 فنانًا على مستوى العالم ودفعت لهم مقابل مقطوعات حصرية. وادعى خان أن الشركة حصلت على جميع بيانات التدريب الخاصة بها بشكل أخلاقي ولم تبحث عنها على الإنترنت. ومن المثير للاهتمام أن شركة Adobe تفعل الشيء نفسه في الوقت الحاضر لبناء نموذج لإنشاء فيديو يعمل بالذكاء الاصطناعي.

ومع ذلك، أصبحت البيانات اليوم موردًا مكلفًا للغاية ومطلوبًا باستمرار لترقية نماذج الذكاء الاصطناعي وتحسينها. بينما تواصل Beatoven ممارستها المتمثلة في التعاون مع الفنانين للحصول على البيانات حتى اليوم، فإنها تخطط في المستقبل لخفض التكاليف من خلال تقديم نموذج لتقاسم الإيرادات، حيث سيتم الدفع للفنانين بناءً على عدد المقاطع الصوتية التي تم إنشاؤها حيث استخدم الذكاء الاصطناعي الأغنية العينة أو البيانات

كيف تخطط Beatoven.ai للتعامل مع المنافسة؟

إن توليد الموسيقى القائم على الذكاء الاصطناعي ليس اقتراحًا فريدًا تمامًا اليوم. لقد دخل العديد من اللاعبين إلى هذا القطاع، مدركين للإمكانات. يشمل بعضها Google مع MusicLM، وOpenAI مع Jukebox، وAdobe مع Project Music GenAI Control. ومع ذلك، لا يتوفر أي من هذه النماذج للجمهور اليوم، ولا تزال قيد التطوير. لكن المنافسة على بيتوفن لا تزال قائمة. سيكون المنافس الكبير لهم هو Suno AI، الذي لا يقوم بإنشاء الموسيقى فحسب، بل يضيف أيضًا أصواتًا تم إنشاؤها بواسطة الذكاء الاصطناعي إلى الموسيقى لتقديم أغنية كاملة.

ردًا على هذا القلق، أكد خان أن الشركة تقدم توليدًا موسيقيًا غير محدود دون إضافة حد للسعر. علاوة على ذلك، فهو يسلط الضوء على أن الشركة تقوم ببناء نظام بيئي كامل. في حين أنه من ناحية، فهو يلبي احتياجات المستخدمين من خلال إنشاء الموسيقى، ومن ناحية أخرى، فإنه يوفر أيضًا مكانًا للفنانين لبيع موسيقاهم الأصلية. إن المجموعة الكاملة من العروض، إلى جانب الوعد بـ “موسيقى فريدة من مصادر أخلاقية وخالية من حقوق الطبع والنشر”، هي ما يعتقد خان أنه يمنح بيتوفن الأفضلية في السوق.

نظرة نحو المستقبل

وتتطلع Beatoven الآن إلى توسيع منصتها لتلبية احتياجات قاعدة المستخدمين العالمية. بدأت الشركة الناشئة بالفعل في استقطاب فنانين من مختلف أنحاء العالم حيث أن 70 بالمائة من قاعدة مستخدميها يقيمون خارج البلاد. ويعتقد خان أن هذه النظرة العالمية، إلى جانب التركيز على تحسين نموذج الذكاء الاصطناعي، ستكون المفتاح لتحقيق هدفها المتمثل في خمسة ملايين مستخدم في العامين المقبلين.

يمكن أن تكون التكنولوجيا في كثير من الأحيان سلاحًا ذا حدين. في حين أنه لا يمكن التقليل من فوائد الموسيقى المولدة بواسطة الذكاء الاصطناعي، فإن السؤال الذي يطرح نفسه هو ما إذا كان إنشاء الموسيقى بسهولة وبأسعار معقولة يمكن أن يكون له تأثير سلبي على الموسيقيين الطموحين. هل تحويل الموسيقى إلى سلعة هو الطريق الصحيح حقاً؟

يعتقد خان أنه على الرغم من أن إنشاء الموسيقى سيصبح التغيير الكبير التالي في الصناعة، فمن غير المرجح أن يسلب أحلام الموسيقيين والمغنين وسبل عيشهم. وقال: “أعتقد أن الفنانين سيظلون في مركز هذا الاضطراب لأن الذكاء الاصطناعي لا يستطيع التنافس مع الإبداع البشري”.


قد يتم إنشاء الروابط التابعة تلقائيًا – راجع بيان الأخلاقيات الخاص بنا للحصول على التفاصيل.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى