معرفی نخستین ربات دارای تفکر مستقل
رکنا: دیپمایند با معرفی پروژه Gemini Robotics نسل جدیدی از رباتهای هوشمند را رونمایی کرد؛ رباتهایی مجهز به هوش مصنوعی پیشرفته که پیش از انجام هر اقدام، «تفکر» میکنند و راهی تازه در عصر فناوری ایجاد میکنند.

به گزارش رکنا، محققان دیپمایند معتقدند که جهان تکنولوژی در آستانه ورود به مرحلهای تازه از رباتهای پیشرفته قرار دارد. سیستمهای هوش مصنوعی مولد امروزه در زمینههای تولید متن، تصویر، صدا و ویدئو به جزئی جداییناپذیر از زندگی دیجیتال تبدیل شدهاند. این فناوریها، علاوه بر تولید داده، حالا میتوانند در کنشهای رباتیک نیز به کار گرفته شوند. این ایده به عنوان اساس پروژه جمینای رباتیک دیپمایند شناخته میشود که اخیراً از دو مدل جدید رونمایی کرده است. این مدلها قابلیت ویژهای دارند که آنها را به نخستین رباتهای «اندیشمند» تبدیل میکند.
نقش مهم هوش مصنوعی مولد در رباتیک
هوش مصنوعی مولد برای پیشرفت در دنیای رباتها اهمیت بسیاری دارد، چراکه امکان ایجاد انعطافپذیری بالا را فراهم میکند. رباتهای کنونی معمولاً برای انجام یک وظیفه خاص آموزش میبینند و ممکن است در اجرای سایر وظایف چندان موفق عمل نکنند. رئیس بخش رباتیک دیپمایند، کارولینا پارادا، توضیح میدهد: «رباتهای امروزی بسیار پیچیده و سفارشی هستند و استفاده از آنها نیازمند زمان طولانی برای آمادهسازی است؛ حتی تنها برای انجام یک وظیفه ساده.»
اما فناوری هوش مصنوعی مولد توانسته است رباتهای تطبیقپذیرتری را به دنیای تکنولوژی معرفی کند. رباتهایی که بدون نیاز به تنظیمات مجدد، خود را با محیطها و موقعیتهای جدید وفق میدهند. دیپمایند با استفاده از این تکنولوژی دو مدل جدید به نامهای Gemini Robotics ۱.۵ و Gemini Robotics-ER ۱.۵ را توسعه داده است. مدل اول، بر مبنای سیستم دیداری-زبانی-کنشی (VLA) طراحی شده که بر پایه دادههای تصویری و متنی، کنشهای رباتیک را ایجاد میکند. مدل دوم با نام Embodied Reasoning یا «استدلال تجسمیافته» شناخته میشود و وظیفه تولید گامهای مشخص برای انجام وظایف پیچیده را بر اساس دادههای ورودی تصویری و متنی دارد.
رباتهای واقعی «اندیشمند»
مدل Gemini Robotics-ER ۱.۵ اولین هوش مصنوعی مبتنی بر رباتیک است که توانایی شبیهسازی تفکر دقیق مانند چتباتهای مدرن را داراست. دیپمایند این قابلیت را «تفکر» نامیده است، هرچند شاید در دنیای هوش مصنوعی مولد این اصطلاح کمی اغراقآمیز به نظر برسد. این مدل توانسته است در آزمونهای عملی نتایج قابل توجهی کسب کند و نشان دهد که میتواند تصمیمگیری مؤثری در تعامل با فضاهای فیزیکی داشته باشد. البته وظیفه اجرایی توسط مدل Gemini Robotics ۱.۵ انجام میشود.
برای مثال، فرض کنید میخواهید رباتی لباسهای شما را به دو دسته سفید و رنگی تقسیمبندی کند. در این فرآیند، مدل ER ابتدا درخواست شما را پردازش کرده و با بررسی تصاویر، دادههای مورد نیاز را جمعآوری میکند. این مدل حتی میتواند از ابزارهای جانبی همچون جستوجوی گوگل استفاده کند. سپس مجموعهای از دستورالعملها و گامها به زبان طبیعی تولید میکند و به مدل اجرایی ارسال مینماید.
مدل Gemini Robotics ۱.۵ که مسئولیت اجرا را بر عهده دارد، از دادههای ورودی تصویری برای حرکتهای دقیق ربات استفاده میکند و عملکرد مرحلهبهمرحله را با تفکر داخلی پیش میبرد. کانیشکا رائو، یکی از محققان دیپمایند، میگوید: «در حالی که انسانها برای انجام کارها از نوعی شهود طبیعی بهره میگیرند، رباتها چنین ویژگی ندارند. نسخه ۱.۵ مدل VLA توانسته این خلأ را با افزودن قابلیت تفکر پیش از عمل به رباتها پر کند.»
تحولی بنیادین در دنیای رباتیک
مدلهای جدید جمینای بر بستر فناوریهای پایه هوش مصنوعی ساخته شدهاند و دادههایی را ارائه میدهند که رباتها را برای کار در محیطهای واقعی بهینهسازی میکنند. این رویکرد به رباتها امکان انجام وظایف پیچیده و چندمرحلهای را میدهد و باعث میشود که تواناییهای عاملمحور وارد دنیای رباتیک شود.
با این حال، هنوز فاصله زیادی با تولید رباتهایی داریم که بتوانند کاملاً خودکار وظایفی مانند شستوشوی لباسها را انجام دهند. مدل Gemini Robotics ۱.۵ که قابلیت کنترل مستقیم رباتها را داراست، فعلاً فقط برای آزمایش در اختیار گروههای محدود قرار گرفته است. اما مدل ER در Google AI Studio عرضه شده و توسعهدهندگان اکنون میتوانند با استفاده از این فناوری، دستورالعملهایی برای آزمایشهای رباتیک خود تولید کنند.
ارسال نظر