تسلا تعتمد على الرؤية النقية في تدريب روبوت Optimus
تعتمد شركة تسلا (TSLA.O) الآن على استراتيجية مجرّبة لتدريب روبوتها البشري، Optimus. وكما كشف أشخاص مطلعون، أبلغت الشركة موظفيها في نهاية يونيو/حزيران بأن مشروع Optimus سيركز بشكل أكبر على منهجية "الرؤية النقية".
في السابق، كانت تسلا تستخدم بدلات التقاط الحركة ونظارات الواقع الافتراضي لتسجيل بيانات المشغلين البشريين والتحكم في الروبوت عن بعد. أما الآن، ستركز الشركة بشكل أساسي على تدريب الروبوتات من خلال تصوير مقاطع فيديو لعمّال يؤدون مهام، مثل التقاط الأشياء أو طي القمصان.
أفاد المطلعون بأن الشركة ذكرت أن التخلي عن بدلات التقاط الحركة والتحكم عن بعد سيسمح للفريق بتوسيع نطاق جمع البيانات بسرعة أكبر. يمثل هذا التحول تعديلاً كبيرًا في استراتيجية تسلا للروبوتات، مما يتماشى مع إيمان الرئيس التنفيذي إيلون ماسك الذي طال أمده بأن الذكاء الاصطناعي يمكنه إتقان المهام المعقدة بمجرد استخدام الكاميرات. وقد استخدمت تسلا منهجية مماثلة لتدريب برنامج القيادة الذاتية الخاص بها.
يأتي هذا التغيير بعد فترة وجيزة من استقالة رئيس مشروع Optimus، ميلان كوفاتش. وكشف المطلعون أن رئيس قسم الذكاء الاصطناعي، أشوك إيلوسوامي، قد تولى مسؤولية المشروع.
يعد التقاط الحركة والتحكم عن بعد من الممارسات القياسية في صناعة الروبوتات. على سبيل المثال، استخدمت شركة الروبوتات الرائدة Boston Dynamics التحكم عن بعد لتدريب روبوت Atlas الخاص بها. في التدريب، يرتدي العمال بدلات التقاط الحركة لإكمال المهام المختلفة، ثم يتم إدخال البيانات إلى الروبوت. يمكن أيضًا استخدام بدلات التقاط الحركة للتحكم في الروبوت عن بعد.
لا يزال من غير الواضح ما إذا كانت تسلا ستعيد ترتيب أولويات التقاط الحركة والتحكم عن بعد في المستقبل، أو ما إذا كانت ستستمر في التطوير باستخدام بيانات الفيديو بناءً على المعلومات التي تم جمعها مسبقًا. يقول روبرت جريفين، عالم الأبحاث الأول في معهد الإدراك البشري والآلي المتقدم، إن كميات كبيرة من بيانات التحكم عن بعد يمكن أن تسمح للروبوتات بالتعلم من خلال التفاعل المادي مع البيئة. ويضيف أن الاعتماد على بيانات الفيديو فقط يجعل من الصعب على الروبوتات ترجمة الحركات الموجودة في الفيديو بدقة إلى العالم الحقيقي.
"إذا كنت تستخدم بيانات الفيديو فقط، فلن يكون هناك تفاعل مادي مباشر،" كما يقول.
طي القمصان والتقاط الأشياء
أعلن ماسك لأول مرة عن خطط تسلا لتطوير روبوت بشري باسم Optimus في عام 2021. وقال الملياردير إن الروبوت سيكون قادرًا في النهاية على أداء مهام مثل العمل في المصنع ورعاية المرضى.
في العام الماضي، وظفت الشركة "مشغلي جمع البيانات". وتضمنت هذه الأنواع من الوظائف تنفيذ وتسجيل المهام المنزلية الأساسية. وكشفت إعلانات الوظائف أن المشغلين سيحتاجون إلى ارتداء بدلات التقاط الحركة ونظارات الواقع الافتراضي لفترات طويلة.
حتى نهاية شهر يونيو/حزيران، تضمن المشروع تدريب Optimus من خلال التحكم عن بعد وبدلات التقاط الحركة. وذكر المطلعون أن العمال أمضوا وقتًا طويلاً في التعامل مع مشاكل الملابس والروبوت نفسه، مما حد من كمية البيانات التي يمكن للفريق جمعها.
منذ تغيير طريقة التدريب، بدأ العمال في تسجيل حركاتهم باستخدام مجموعة من خمس كاميرات صنعتها تسلا. وذكر المطلعون أن الكاميرات مثبتة على خوذات وحقائب ظهر ثقيلة يرتديها العمال، وتلتقط الصور في جميع الاتجاهات، لتزويد نماذج الذكاء الاصطناعي ببيانات دقيقة عن تحديد المواقع في البيئة.
قال كريستيان هوبيكي، مدير مختبر الروبوتات في كلية الهندسة المشتركة بجامعة فلوريدا الزراعية والميكانيكية وجامعة ولاية فلوريدا، إن هذه الكاميرات ذات الزوايا المختلفة قد تسمح لتسلا بجمع تفاصيل أكثر دقة، "مثل مواضع المفاصل والأصابع"، وتحديد موقع الروبوت بشكل أفضل. وأضاف أن مقاطع الفيديو هذه يمكن أن تستخدم أيضًا لتكملة البيانات التي تم جمعها مسبقًا من خلال التحكم عن بعد.
يتلقى العمال تعليمات مهام محددة أثناء التدريب، خاصةً عندما يتعلق الأمر بحركات اليد، لضمان أن تبدو الحركات قريبة قدر الإمكان من حركات الإنسان. وقال أحد الموظفين إنهم قد يقضون شهورًا في أداء نفس المهمة البسيطة بشكل متكرر.
قال خبير الروبوتات في جامعة شيفيلد، جوناثان أيتكين، إن تسلا قد تحتاج إلى إيجاد طريقة لتعليم Optimus مجموعة متنوعة من المهام من خلال بعض الحركات القابلة للتعميم.
"بهذا الحجم، يجب أن يكون لديهم مجموعة من الحركات الشائعة، وإلا فإن تدريب جميع المهام سيستغرق وقتًا طويلاً للغاية،" كما يقول أيتكين.
وأضاف أن تسلا قد تتبنى استراتيجية مماثلة لتلك التي تتبعها شركة Physical Intelligence، والتي تعلم الروبوتات المهارات القابلة للنقل وتطبيقها بمرونة، بدلاً من حفظ مهمة واحدة عن ظهر قلب، عن طريق إدخال كميات كبيرة من بيانات العرض التوضيحي.
"طريقة تسلاوية للغاية لتطوير الروبوتات"
تتماشى هذه الاستراتيجية الجديدة مع الطريقة التي تدرب بها تسلا برنامج القيادة الذاتية الخاص بها. تستخدم شركات القيادة الذاتية الأخرى أجهزة استشعار مثل الليدار والرادار الموجي المليميتري لتدريب البرنامج، بينما تعتمد تسلا بشكل أساسي على الكاميرات.
تستخدم الشركة الملايين من سيارات تسلا المزودة بـ 8 إلى 9 كاميرات لجمع البيانات. قال ماسك إن إطلاق تسلا لبرنامج مساعدة السائق في الصين تحقق بعد تدريب نظام الذكاء الاصطناعي بفضل مقاطع فيديو الشوارع الآسيوية المتاحة للجمهور.
اعترف ماسك في مكالمة أرباح في يناير/كانون الثاني بأن "احتياجات تدريب الروبوت البشري Optimus قد تكون في النهاية 10 أضعاف ما هو مطلوب للسيارات على الأقل".
"هذه طريقة تسلاوية للغاية لتطوير الروبوتات. لا توجد شركة أخرى تحاول القيام بذلك بهذا الحجم،" كما يقول أيتكين. "إنهم بحاجة إلى كمية هائلة من البيانات مثلما يفعلون في تدريب السيارات."
قال آلان فيرن، خبير الذكاء الاصطناعي والروبوتات في جامعة ولاية أوريغون، إن تدريب Optimus يمثل تحديًا أكبر بالنسبة لتسلا من تطوير السيارات ذاتية القيادة.
"القيادة هي مجرد مهمة واحدة،" كما يقول. الاعتماد بشكل أساسي على التعلم المرئي "يتطلب من الروبوت فهم ما يحدث في الفيديو واكتساب مهارات لإكمال المهمة. يمكن تعلم بعض الأشياء بالملاحظة، ولكن البعض الآخر يحتاج إلى التدريب شخصيًا في محاكاة أو في الواقع."
تحذير بالمخاطر: تعكس هذه المقالة وجهات نظر الكاتب الشخصية فقط، ولا تمثل سوى مصدر مرجعي. كما أنها لا تُعَد نصيحة استثمارية أو توجيهًا ماليًا، ولا تُعبّر عن موقف منصة Markets.com.عند التفكير في تداول الأسهم، ومؤشرات الأسهم، والفوركس (العملات الأجنبية)، والسلع، والتنبؤ بأسعارها، فتذكر أن تداول عقود الفروقات ينطوي على درجة كبيرة من المخاطرة وقد ينتج عنه تكبد خسائر فادحة.أي أداء في الماضي لا يشير إلى أي نتائج مستقبلية. المعلومات المقدمة هي لأغراض معلوماتية فقط، ولا تشكل مشورة استثمارية. تداول عقود فروقات العملات الرقمية ومراهنات فروقات الأسعار محظور لكل العملاء الأفراد في بريطانيا.