۷ آذر ۱۴۰۳ - ۱۲:۳۸

انویدیا یک مدل هوش مصنوعی جدید برای تولید موسیقی و صوت رونمایی کرد که می‌تواند اصوات را اصلاح و صداهای جدید تولید کند. این فناوری برای تولیدکنندگان موسیقی، فیلم و بازی‌های ویدیویی ارائه می‌شود.

آگاه: انویدیا بزرگ‌ترین تهیه‌کننده تراشه و نرم افزارهای مخصوص خلق سیستمهای هوش مصنوعی، اعلام کرده برنامه‌های آنی برای عرضه عمومی این فناوری که «فوگاتو» (Fugatto) نام گرفته، ندارد. فوگاتو خلاصه‌شده عبارت «ترانسفورماتور صوتی مولد بنیادی اوپوس یک» (Foundational Generative Audio Transformer Opus۱)  است.
این درحالی است که استارتاپ‌هایی مانند «ران وی» و شرکت‌های بزرگ‌تری مانند متا فناوری‌هایی را نمایش داده‌اند که قادر به تولید صوت یا ویدیو براساس متن است.
نسخه هوش مصنوعی انویدیا براساس متن نوشتاری جلوه‌های صوتی و موسیقی ازجمله صداهایی جدید تولید می‌کند؛ البته نکته متمایز این فناوری از دیگر سیستمهای هوش مصنوعی مشابه توانایی آن برای اصلاح اصوات موجود است؛ به‌عنوان مثال، هوش مصنوعی مذکور می‌تواند آهنگی را که با پیانو نواخته شده به آهنگی با صدای انسان تبدیل کند یا آنکه لهجه و حالت کلمات بیان و ثبت‌شده را تغییر دهد.
برایان کاتانزارو، نائب‌رییس بخش تحقیقات یادگیری عمیق کاربردی در انویدیا دراین‌باره می‌گوید: اگر نگاهی به اصوات مصنوعی در ۵۰سال اخیر بیندازیم، موسیقی فعلی به‌دلیل رایانه‌ها و ... متفاوت است. تصور می‌کنم هوش مصنوعی مولد قابلیت‌های جدیدی به موسیقی، بازی‌های ویدیویی می‌افزاید و به مردم عادی که خواستار تولید محتوا هستند نیز کمک می‌کند.
مدل هوش مصنوعی جدید این شرکت براساس داده‌های منبع باز آموزش دیده و هنوز مشخص نیست به‌طور عمومی عرضه می‌شود یا خیر.