ChatGPT получил тело: Гуманоидный робот от OpenAI и Figure может полноценно общаться с людьми

14 марта, 2024  12:06

Американский стартап Figure совместно с компанией OpenAI создал робота Figure 01, который может разговаривать с человеком в режиме реального времени и выполнять его команды.

Видеоролик, опубликованный компаниями, и правда впечатляет. В ответ на вопрос человека робот четко и точно описывает, что видит перед собой на столе, а за одно и собеседника и даже его позу. А когда человек просит дать ему что-нибудь съедобное, робот протягивает ему яблоко, после чего человек вываливает перед роботом кучу мусора и просит убрать его, за одно объясняя, почему он протянул ему яблоко. И с этой задачей робот отлично справляется, как, впрочем, и со следующей.

Стартап Figure, основанный бизнесменом Бреттом Эдкоком, привлек внимание крупных игроков на рынке робототехники и технологий искусственного интеллекта, включая Boston Dynamics, Tesla Google DeepMind, Archer Aviation и других. Цель стартапа — «создать первого в мире коммерчески доступного гуманоидного робота общего назначения», и к этой цели они двигаются вполне уверенными шагами.

В октябре прошлого года Figure 01 продемонстрировал свои возможности в выполнении базовых автономных задач, а уже к концу года робот начал обучаться выполнению различных задач. Уже в январе 2024 года Figure подписала первый коммерческий контракт на использование Figure 01 на автомобильном заводе компании BMW в штате Северная Каролина. А через месяц стартап показал видео, где Figure 01 работает на складе.

Вскоре после этого стартап анонсировал разработку второго поколения робота и объявил о сотрудничестве с OpenAI «по разработке нового поколения ИИ-моделей для гуманоидных роботов». На первые результаты их совместной работы можно взглянуть уже сегодня. Эдкок утверждает, что во время демонстрации робот не управлялся дистанционно, а видео показано с реальной скоростью.

В том, что ИИ может свободно говорить с человеком, уже нет ничего удивительного. С тем же чатботом ChatGPT уже можно общаться через голосовые команды. Но как новый робот понимает то, что видит вокруг себя?

Эдкок рассказал на своей странице в X (бывший Twitter), что камеры, встроенные в Figure 01, служат его глазами и отправляют данные в большую визуально-языковую модель ИИ, обученную OpenAI. По его словам, алгоритмы OpenAI также отвечают за возможность робота понимать человеческую речь, а нейросеть Figure преобразует поток полученной информации в «быстрые, низкоуровневые и ловкие действия робота».


 
 
 
 
  • Архив