گوگل قابلیت تولید موسیقی با Lyria 3 را در Gemini فعال کرد

1 دقیقه خوانده شده

گوگل اعلام کرده کاربران اکنون می‌توانند از طریق اپلیکیشن Gemini موسیقی مبتنی بر هوش مصنوعی تولید کنند؛ قابلیتی که با پیشرفته‌ترین مدل تولید موسیقی این شرکت با نام Lyria 3 پشتیبانی می‌شود.
به گزارش رسانه اخبار فناوری تکنا به نقل از گوگل، همزمان با گسترش کاربردهای هوش مصنوعی در تولید متن تصویر و ویدیو، تولید موسیقی نیز به جریان اصلی نزدیک‌تر شده است. ادغام Lyria 3 در Gemini به کاربران امکان می‌دهد تنها با توصیف متنی ساده قطعات موسیقی جدید بسازند و بدون نیاز به نرم‌افزارهای تخصصی آهنگسازی به خروجی قابل استفاده دست پیدا کنند.
Lyria 3 توسط گوگل دیپ‌مایند Google DeepMind به عنوان ابزار جدید تولید موسیقی مبتنی بر AI معرفی شده و قادر است بر اساس ورودی‌های متنی فایل‌های صوتی با کیفیت بالا تولید کند. برخلاف برخی مدل‌های پیشین این سامانه برای خلق موسیقی منسجم‌تر با ریتم ملودی و سازبندی طراحی شده است. بر اساس توضیحات گوگل این ابزار می‌تواند زبان طبیعی را درک کند و پارامترهایی مانند سبک حال‌وهوا تمپو و حتی شیوه‌های تولید را تحلیل کرده و بر مبنای آن قطعه‌ای اورجینال بسازد.
این مدل پرامپت کاربر را تحلیل می‌کند و موسیقی را بر اساس پارامترهای استخراج‌شده تولید می‌کند. Lyria 3 همچنین امکان ساخت موسیقی بر اساس عکس و ویدیو را فراهم کرده و می‌تواند لحن و اتمسفر بصری را با قطعه صوتی هماهنگ کند. هر آهنگ تولیدشده قابلیت ایجاد کاور آرت با استفاده از AI را نیز دارد که فرآیند انتشار آثار را برای هنرمندان ساده‌تر می‌کند. به گفته گوگل دیپ‌مایند این مدل بخشی از راهبرد کلان این شرکت برای توسعه AI چندوجهی است که در آن تولید متن تصویر صدا و ویدیو در یک پلتفرم واحد همزیستی دارند.
برای دستیابی به نتایج دقیق‌تر توصیه شده است کاربران پرامپت‌های شفاف و ساختاریافته ارائه دهند. ذکر سبک مانند pop hip-hop classical EDM یا ambient تعیین حال‌وهوا مانند energetic calm suspenseful یا uplifting اشاره به سازهایی مانند piano guitar synth drums یا strings مشخص‌کردن تمپو و توضیح کاربرد نهایی مانند موسیقی پس‌زمینه برای vlog یا قطعه تمرینی می‌تواند دقت خروجی را افزایش دهد. هرچه توصیف دقیق‌تر باشد احتمال تولید ترکیب موسیقایی منطبق با انتظار کاربر بیشتر خواهد بود.
برای استفاده از این قابلیت ابتدا باید اپلیکیشن یا وب‌سایت Gemini را باز کرده و با حساب کاربری گوگل وارد شوید و از به‌روز بودن نسخه برنامه اطمینان حاصل کنید. سپس در بخش ابزارهای خلاقانه گزینه تولید موسیقی که Lyria 3 در آن یکپارچه شده را انتخاب کنید. در کادر پرامپت توضیح دقیقی از موسیقی موردنظر خود وارد کنید و در صورت نیاز جزئیاتی مانند نبود وکال ملایم بودن پرکاشن یا ایجاد build-up ده‌ثانیه‌ای پیش از drop را اضافه کنید تا محدودیت‌های بیشتری برای مدل تعریف شود.
پس از آماده‌سازی پرامپت باید گزینه generate را انتخاب کنید تا Gemini درخواست را با استفاده از Lyria 3 پردازش کند و یک قطعه موسیقی تولیدشده توسط AI ارائه دهد. زمان پردازش بسته به پیچیدگی درخواست و میزان بار سرور متغیر است. در صورتی که خروجی اولیه با انتظار کاربر همخوانی نداشته باشد امکان اصلاح پرامپت و اعمال محدودیت‌های بیشتر وجود دارد تا نسخه‌های بعدی به نتیجه مطلوب نزدیک‌تر شوند.