آگاه: پژوهشگران دیپمایند معتقدند این نقطه آغاز عصر تازهای از رباتهای هوشمند است. سامانههای هوش مصنوعی مولد که متن، تصویر، صدا و حتی ویدئو تولید میکنند، حالا به بخشی رایج از زندگی دیجیتال بدل شدهاند. همانطور که مدلهای هوش مصنوعی دادههای مختلف را تولید میکنند، میتوان از آنها برای ایجاد کنش در رباتها هم استفاده کرد. این ایده اساس پروژه جمینای رباتیک (Gemini Robotics) دیپمایند است که اکنون از دو مدل تازه رونمایی کرده است؛ این مدلها در کنار هم نخستین رباتهایی را میسارند که پیش از عمل کردن، فکر میکنند. هوش مصنوعی مولد برای رباتیک نقشی کلیدی دارد، زیرا کارکرد عمومی را به وجود میآورد. رباتهای امروزی باید بهطور گسترده برای وظایف مشخص آموزش ببینند و معمولاً در انجام کارهای دیگری، به جز آنچه که برای آن آموزش دیدهاند عملکرد خوبی ندارند. کارولینا پارادا، رئیس بخش رباتیک دیپمایند میگوید: «رباتهای امروز بسیار سفارشی هستند و استفاده از آنها دشوار است؛ اغلب ماهها طول میکشد تا یک واحد رباتیک تنها برای انجام یک وظیفه نصب و آماده شود.» اما اساس سیستمهای مولد باعث میشود رباتهای هوش مصنوعی انعطافپذیرتر شوند. این رباتها بدون آنکه نیازی به تنظیمات دوباره داشته باشند، میتوانند با موقعیتها و محیطهای کاری کاملاً تازه روبهرو شوند داشته باشند. رویکرد فعلی دیپمایند بر دو مدل استوار است، مدلی که فکر میکند و مدل دیگری که اجرا میکند؛ این دو مدل تازه با نامهای Gemini Robotics ۱.۵ و Gemini Robotics-ER ۱.۵ معرفی شدهاند. مدل اول یک مدل دیداری-زبانی-کنشی (VLA) است که از دادههای تصویری و متنی برای تولید کنشهای رباتیک استفاده میکند. مدل دوم که «ER» در آن مخفف Embodied Reasoning یا «استدلال تجسمیافته» است، یک مدل دیداری-زبانی (VLM) به شمار میآید که ورودیهای تصویری و متنی را میگیرد و گامهای لازم برای انجام یک وظیفه پیچیده را تولید میکند.
منبع: arstechnica
۶ مهر ۱۴۰۴ - ۱۲:۲۰
کد خبر: ۱۶٬۵۲۱
گوگل دیپمایند با معرفی مدلهای جدید جمینای رباتیک (Gemini Robotics)، نخستین رباتهای هوش مصنوعی را رونمایی کرده که پیش از عمل، «فکر» میکنند؛ این مدلها میتوانند فصل تازهای در آینده رباتیک رقم بزند.

نظر شما