گوگل قابلیت تولید موسیقی با Lyria 3 را در Gemini فعال کرد
1 دقیقه خوانده شده
گوگل اعلام کرده کاربران اکنون میتوانند از طریق اپلیکیشن Gemini موسیقی مبتنی بر هوش مصنوعی تولید کنند؛ قابلیتی که با پیشرفتهترین مدل تولید موسیقی این شرکت با نام Lyria 3 پشتیبانی میشود.
به گزارش رسانه اخبار فناوری تکنا به نقل از گوگل، همزمان با گسترش کاربردهای هوش مصنوعی در تولید متن تصویر و ویدیو، تولید موسیقی نیز به جریان اصلی نزدیکتر شده است. ادغام Lyria 3 در Gemini به کاربران امکان میدهد تنها با توصیف متنی ساده قطعات موسیقی جدید بسازند و بدون نیاز به نرمافزارهای تخصصی آهنگسازی به خروجی قابل استفاده دست پیدا کنند.
Lyria 3 توسط گوگل دیپمایند Google DeepMind به عنوان ابزار جدید تولید موسیقی مبتنی بر AI معرفی شده و قادر است بر اساس ورودیهای متنی فایلهای صوتی با کیفیت بالا تولید کند. برخلاف برخی مدلهای پیشین این سامانه برای خلق موسیقی منسجمتر با ریتم ملودی و سازبندی طراحی شده است. بر اساس توضیحات گوگل این ابزار میتواند زبان طبیعی را درک کند و پارامترهایی مانند سبک حالوهوا تمپو و حتی شیوههای تولید را تحلیل کرده و بر مبنای آن قطعهای اورجینال بسازد.
این مدل پرامپت کاربر را تحلیل میکند و موسیقی را بر اساس پارامترهای استخراجشده تولید میکند. Lyria 3 همچنین امکان ساخت موسیقی بر اساس عکس و ویدیو را فراهم کرده و میتواند لحن و اتمسفر بصری را با قطعه صوتی هماهنگ کند. هر آهنگ تولیدشده قابلیت ایجاد کاور آرت با استفاده از AI را نیز دارد که فرآیند انتشار آثار را برای هنرمندان سادهتر میکند. به گفته گوگل دیپمایند این مدل بخشی از راهبرد کلان این شرکت برای توسعه AI چندوجهی است که در آن تولید متن تصویر صدا و ویدیو در یک پلتفرم واحد همزیستی دارند.
برای دستیابی به نتایج دقیقتر توصیه شده است کاربران پرامپتهای شفاف و ساختاریافته ارائه دهند. ذکر سبک مانند pop hip-hop classical EDM یا ambient تعیین حالوهوا مانند energetic calm suspenseful یا uplifting اشاره به سازهایی مانند piano guitar synth drums یا strings مشخصکردن تمپو و توضیح کاربرد نهایی مانند موسیقی پسزمینه برای vlog یا قطعه تمرینی میتواند دقت خروجی را افزایش دهد. هرچه توصیف دقیقتر باشد احتمال تولید ترکیب موسیقایی منطبق با انتظار کاربر بیشتر خواهد بود.
برای استفاده از این قابلیت ابتدا باید اپلیکیشن یا وبسایت Gemini را باز کرده و با حساب کاربری گوگل وارد شوید و از بهروز بودن نسخه برنامه اطمینان حاصل کنید. سپس در بخش ابزارهای خلاقانه گزینه تولید موسیقی که Lyria 3 در آن یکپارچه شده را انتخاب کنید. در کادر پرامپت توضیح دقیقی از موسیقی موردنظر خود وارد کنید و در صورت نیاز جزئیاتی مانند نبود وکال ملایم بودن پرکاشن یا ایجاد build-up دهثانیهای پیش از drop را اضافه کنید تا محدودیتهای بیشتری برای مدل تعریف شود.
پس از آمادهسازی پرامپت باید گزینه generate را انتخاب کنید تا Gemini درخواست را با استفاده از Lyria 3 پردازش کند و یک قطعه موسیقی تولیدشده توسط AI ارائه دهد. زمان پردازش بسته به پیچیدگی درخواست و میزان بار سرور متغیر است. در صورتی که خروجی اولیه با انتظار کاربر همخوانی نداشته باشد امکان اصلاح پرامپت و اعمال محدودیتهای بیشتر وجود دارد تا نسخههای بعدی به نتیجه مطلوب نزدیکتر شوند.