مدل هوش مصنوعی متن باز متعلق به متا، از متن برای ایجاد ترکیبات ژانرهای موسیقی استفاده میکند.
تیم تحقیقاتی متا به تازگی یک مدل زبان یادگیری عمیق منبع باز به نام «MusicGen» را منتشر کرده، که میتواند موسیقی جدیدی را بر اساس پیامهای متنی تولید کند و حتی با یک آهنگ موجود تراز شود.
با استفاده از این ابزار میتوانید سبک موسیقی مورد نظر را توضیح داده و سپس روی گزینه «Generate» کلیک کنید؛ پس از مدتی یک قطعه کوتاه از موسیقی کاملاً جدید را بر اساس پیامهای متن و ملودی درخواستی شما منتشر میکند. نسخه نمایشی به شما امکان می دهد موسیقی خود را توصیف کنید. سپس می توانید انتخاب کنید که آهنگ چقدر طول بکشد.
این تیم از 20هزار ساعت موسیقی برای آموزش مدل استفاده کرد که شامل 10هزار آهنگ موسیقی با کیفیت بالا از مجموعه دادههای داخلی به همراه آهنگهای شرکت های شاتراستاک و Pond5 بود. محققان برای سریعتر کردن آن، از واحدساز صوتی 32 کیلوهرتزی«EnCodec»متا جهت تولید قطعات کوچکتر موسیقی که میتوانند به صورت موازی پردازش شوند، استفاده کردند.
گوگل ماه گذشته، یک تولید کننده موسیقی مشابه به نام«MusicLM» منتشر کرد، اما به نظر می رسد MusicGen نتایج بهتری ایجاد می کند.
همانطور که گفته شد، MusicGen منبع باز است و حتی می توان از آن برای تولید موسیقی تجاری استفاده کرد. با این حال، این آخرین نمونه از سرعت خیره کننده توسعه هوش مصنوعی در نیم سال گذشته است.
/فارس