آگاه: انویدیا بزرگترین تهیهکننده تراشه و نرم افزارهای مخصوص خلق سیستمهای هوش مصنوعی، اعلام کرده برنامههای آنی برای عرضه عمومی این فناوری که «فوگاتو» (Fugatto) نام گرفته، ندارد. فوگاتو خلاصهشده عبارت «ترانسفورماتور صوتی مولد بنیادی اوپوس یک» (Foundational Generative Audio Transformer Opus۱) است.
این درحالی است که استارتاپهایی مانند «ران وی» و شرکتهای بزرگتری مانند متا فناوریهایی را نمایش دادهاند که قادر به تولید صوت یا ویدیو براساس متن است.
نسخه هوش مصنوعی انویدیا براساس متن نوشتاری جلوههای صوتی و موسیقی ازجمله صداهایی جدید تولید میکند؛ البته نکته متمایز این فناوری از دیگر سیستمهای هوش مصنوعی مشابه توانایی آن برای اصلاح اصوات موجود است؛ بهعنوان مثال، هوش مصنوعی مذکور میتواند آهنگی را که با پیانو نواخته شده به آهنگی با صدای انسان تبدیل کند یا آنکه لهجه و حالت کلمات بیان و ثبتشده را تغییر دهد.
برایان کاتانزارو، نائبرییس بخش تحقیقات یادگیری عمیق کاربردی در انویدیا دراینباره میگوید: اگر نگاهی به اصوات مصنوعی در ۵۰سال اخیر بیندازیم، موسیقی فعلی بهدلیل رایانهها و ... متفاوت است. تصور میکنم هوش مصنوعی مولد قابلیتهای جدیدی به موسیقی، بازیهای ویدیویی میافزاید و به مردم عادی که خواستار تولید محتوا هستند نیز کمک میکند.
مدل هوش مصنوعی جدید این شرکت براساس دادههای منبع باز آموزش دیده و هنوز مشخص نیست بهطور عمومی عرضه میشود یا خیر.
۷ آذر ۱۴۰۳ - ۱۲:۳۸
انویدیا یک مدل هوش مصنوعی جدید برای تولید موسیقی و صوت رونمایی کرد که میتواند اصوات را اصلاح و صداهای جدید تولید کند. این فناوری برای تولیدکنندگان موسیقی، فیلم و بازیهای ویدیویی ارائه میشود.