معرفی نخستین ربات دارای تفکر مستقل
تبلیغات

 به گزارش رکنا، محققان دیپ‌مایند معتقدند که جهان تکنولوژی در آستانه ورود به مرحله‌ای تازه از ربات‌های پیشرفته قرار دارد. سیستم‌های هوش مصنوعی مولد امروزه در زمینه‌های تولید متن، تصویر، صدا و ویدئو به جزئی جدایی‌ناپذیر از زندگی دیجیتال تبدیل شده‌اند. این فناوری‌ها، علاوه بر تولید داده، حالا می‌توانند در کنش‌های رباتیک نیز به کار گرفته شوند. این ایده به عنوان اساس پروژه جمینای رباتیک دیپ‌مایند شناخته می‌شود که اخیراً از دو مدل جدید رونمایی کرده است. این مدل‌ها قابلیت ویژه‌ای دارند که آن‌ها را به نخستین ربات‌های «اندیشمند» تبدیل می‌کند.

نقش مهم هوش مصنوعی مولد در رباتیک

هوش مصنوعی مولد برای پیشرفت در دنیای ربات‌ها اهمیت بسیاری دارد، چراکه امکان ایجاد انعطاف‌پذیری بالا را فراهم می‌کند. ربات‌های کنونی معمولاً برای انجام یک وظیفه خاص آموزش می‌بینند و ممکن است در اجرای سایر وظایف چندان موفق عمل نکنند. رئیس بخش رباتیک دیپ‌مایند، کارولینا پارادا، توضیح می‌دهد: «ربات‌های امروزی بسیار پیچیده و سفارشی هستند و استفاده از آن‌ها نیازمند زمان طولانی برای آماده‌سازی است؛ حتی تنها برای انجام یک وظیفه ساده.»

اما فناوری هوش مصنوعی مولد توانسته است ربات‌های تطبیق‌پذیرتری را به دنیای تکنولوژی معرفی کند. ربات‌هایی که بدون نیاز به تنظیمات مجدد، خود را با محیط‌ها و موقعیت‌های جدید وفق می‌دهند. دیپ‌مایند با استفاده از این تکنولوژی دو مدل جدید به نام‌های Gemini Robotics ۱.۵ و Gemini Robotics-ER ۱.۵ را توسعه داده است. مدل اول، بر مبنای سیستم دیداری-زبانی-کنشی (VLA) طراحی شده که بر پایه داده‌های تصویری و متنی، کنش‌های رباتیک را ایجاد می‌کند. مدل دوم با نام Embodied Reasoning یا «استدلال تجسم‌یافته» شناخته می‌شود و وظیفه تولید گام‌های مشخص برای انجام وظایف پیچیده را بر اساس داده‌های ورودی تصویری و متنی دارد.

ربات‌های واقعی «اندیشمند»

مدل Gemini Robotics-ER ۱.۵ اولین هوش مصنوعی مبتنی بر رباتیک است که توانایی شبیه‌سازی تفکر دقیق مانند چت‌بات‌های مدرن را داراست. دیپ‌مایند این قابلیت را «تفکر» نامیده است، هرچند شاید در دنیای هوش مصنوعی مولد این اصطلاح کمی اغراق‌آمیز به نظر برسد. این مدل توانسته است در آزمون‌های عملی نتایج قابل توجهی کسب کند و نشان دهد که می‌تواند تصمیم‌گیری مؤثری در تعامل با فضاهای فیزیکی داشته باشد. البته وظیفه اجرایی توسط مدل Gemini Robotics ۱.۵ انجام می‌شود.

برای مثال، فرض کنید می‌خواهید رباتی لباس‌های شما را به دو دسته سفید و رنگی تقسیم‌بندی کند. در این فرآیند، مدل ER ابتدا درخواست شما را پردازش کرده و با بررسی تصاویر، داده‌های مورد نیاز را جمع‌آوری می‌کند. این مدل حتی می‌تواند از ابزارهای جانبی همچون جست‌وجوی گوگل استفاده کند. سپس مجموعه‌ای از دستورالعمل‌ها و گام‌ها به زبان طبیعی تولید می‌کند و به مدل اجرایی ارسال می‌نماید.

مدل Gemini Robotics ۱.۵ که مسئولیت اجرا را بر عهده دارد، از داده‌های ورودی تصویری برای حرکت‌های دقیق ربات استفاده می‌کند و عملکرد مرحله‌به‌مرحله را با تفکر داخلی پیش می‌برد. کانیشکا رائو، یکی از محققان دیپ‌مایند، می‌گوید: «در حالی که انسان‌ها برای انجام کارها از نوعی شهود طبیعی بهره می‌گیرند، ربات‌ها چنین ویژگی ندارند. نسخه ۱.۵ مدل VLA توانسته این خلأ را با افزودن قابلیت تفکر پیش از عمل به ربات‌ها پر کند.»

تحولی بنیادین در دنیای رباتیک

مدل‌های جدید جمینای بر بستر‌ فناوری‌های پایه هوش مصنوعی ساخته شده‌اند و داده‌هایی را ارائه می‌دهند که ربات‌ها را برای کار در محیط‌های واقعی بهینه‌سازی می‌کنند. این رویکرد به ربات‌ها امکان انجام وظایف پیچیده و چندمرحله‌ای را می‌دهد و باعث می‌شود که توانایی‌های عامل‌محور وارد دنیای رباتیک شود.

با این حال، هنوز فاصله زیادی با تولید ربات‌هایی داریم که بتوانند کاملاً خودکار وظایفی مانند شست‌وشوی لباس‌ها را انجام دهند. مدل Gemini Robotics ۱.۵ که قابلیت کنترل مستقیم ربات‌ها را داراست، فعلاً فقط برای آزمایش در اختیار گروه‌های محدود قرار گرفته است. اما مدل ER در Google AI Studio عرضه شده و توسعه‌دهندگان اکنون می‌توانند با استفاده از این فناوری، دستورالعمل‌هایی برای آزمایش‌های رباتیک خود تولید کنند.

اخبار تاپ حوادث

تبلیغات
تبلیغات
تبلیغات

وبگردی