Un creciente ejército international de entrenadores está ayudándolo a escapar de nuestras computadoras y entrar en nuestras salas de estar, oficinas y fábricas enseñándole cómo nos movemos.
En una ciudad industrial del sur de la India, Naveen Kumar, de 28 años, se para en su escritorio y comienza su trabajo del día: doblar toallas de mano cientos de veces, con la mayor precisión posible.
No trabaja en un lodge; Trabaja para una startup que crea datos físicos que se utilizan para entrenar IA.
Monta una cámara GoPro en su frente y sigue una lista reglamentada de movimientos de la mano para capturar imágenes exactas del punto de vista de cómo se pliega un ser humano.
Ese día, tuvo que recoger cada toalla de una canasta en el lado derecho de su escritorio, usando solo su mano derecha, agitar la toalla con ambas manos y luego doblarla cuidadosamente tres veces. Luego tuvo que poner cada toalla doblada en la esquina izquierda del escritorio.
Si tarda más de un minuto o se salta algún paso, tiene que empezar de nuevo.
Su empresa, una empresa de etiquetado de datos llamada Objectways, envió 200 vídeos de cómo doblar toallas a su cliente en Estados Unidos. La empresa tiene más de 2.000 empleados; aproximadamente la mitad de ellos etiquetan datos de sensores de automóviles autónomos y robótica, y el resto trabaja en IA generativa.
La mayoría de ellos son ingenieros y pocos tienen experiencia en doblar toallas, por lo que se turnan para realizar el trabajo físico.
«A veces tenemos que eliminar casi 150 o 200 vídeos debido a errores tontos en la forma en que doblamos o colocamos los elementos», dijo Kumar, un graduado en ingeniería que ha trabajado en Objectways durante seis años.
Los movimientos cuidadosamente coreografiados pretenden capturar todos los matices de lo que hacen los humanos (estirar los brazos, agarrar los dedos, deslizar la tela) para doblar la ropa.
Luego, Kumar y su equipo comentan los vídeos capturados. Dibujan cuadros alrededor de las diferentes partes del vídeo, etiquetan las toallas, etiquetan si el brazo se movió hacia la izquierda o hacia la derecha y clasifican cada gesto.
Kumar y sus colegas en la ciudad de Karur, que está a unas 300 millas al sur de Bengaluru, son un grupo poco possible de tutores para la próxima generación de robots impulsados por IA.
«Las empresas están construyendo modelos básicos aptos para el mundo físico», dijo Ulrik Stig Hansen, cofundador de Encord, una plataforma de gestión de datos en San Francisco que tiene contrato con Objectways para recopilar datos de demostración humana. «Existe un enorme resurgimiento de la robótica».
Encord trabaja con empresas de robótica como Bodily Intelligence y Dyna Robotics, respaldadas por Jeff Bezos.
Tesla, Boston Dynamics y Nvidia se encuentran entre los líderes estadounidenses en la carrera por desarrollar la próxima generación de robots. Tesla ya utiliza sus robots Optimus, que a menudo parecen estar controlados de forma remota, para diferentes eventos de la empresa. Google tiene sus propios modelos de IA para robótica. OpenAI está reforzando sus ambiciones en robótica.
Nvidia, el mercado de robots humanoides, podría alcanzar los 38.000 millones de dólares durante la próxima década.
También hay muchas empresas menos conocidas que intentan proporcionar el {hardware}, el software program y los datos necesarios para hacer realidad un robotic humanoide multitarea producido en masa.
Los grandes modelos de lenguaje que impulsan los chatbots como ChatGPT han dominado el uso del lenguaje, las imágenes, la música, la codificación y otras habilidades al aspirar todo en línea. Utilizan todo Web para descubrir cómo se conectan las cosas e imitar cómo hacemos las cosas, como responder preguntas y crear movies fotorrealistas.
Los datos sobre cómo funciona el mundo físico (cuánta fuerza se requiere para doblar una servilleta, por ejemplo) son más difíciles de obtener y traducir en algo que la IA pueda usar.
A medida que la robótica mejore y se mix con la IA que sepa moverse en el mundo físico, podría traer más robots al lugar de trabajo y al hogar. Si bien muchos temen que esto pueda provocar pérdidas de empleo y desempleo, los optimistas creen que los robots avanzados liberarían a los humanos del trabajo tedioso, reducirían los costos laborales y eventualmente darían a las personas más tiempo para relajarse o concentrarse en trabajos más interesantes e importantes.
Muchas empresas han entrado en escena como vendedores de palas en la fiebre del oro de la IA, viendo una oportunidad de recopilar datos para lo que se llama IA física.
Un grupo de empresas está enseñando a la IA cómo actuar en el mundo actual haciendo que humanos guíen a los robots de forma remota.
Ali Ansari, fundador de Micro1, con sede en San Francisco, dijo que la recopilación de datos de la robótica emergente se centra cada vez más en las teleoperaciones. Los humanos con controladores hacen que el robotic haga algo como tomar una taza o preparar té. La IA recibe movies de intentos exitosos y fallidos de hacer algo y aprende a hacerlo.
La formación en management remoto puede realizarse en la misma sala que los robots o con el controlador en un país diferente. Hansen, de Encord, dijo que hay almacenes previstos en Europa del Este donde grandes equipos de operadores se sentarán con joysticks y guiarán a los robots por todo el mundo.
Hay más de estos, lo que algunos han denominado “granjas de armas”, que surgen a medida que aumenta la demanda, dijo Mohammad Musa, fundador de Deepen AI, una empresa de anotación de datos con sede en California.
«Hoy en día se utiliza una combinación de datos reales y sintéticos, recopilados de demostraciones humanas, sesiones de teleoperación y entornos escenificados», afirmó. «Gran parte de este trabajo todavía se realiza fuera de Occidente, pero la automatización y la simulación están reduciendo esa dependencia con el tiempo».
Algunos han teleoperado a humanoides por ser más chisporroteo que sustancia. Pueden ser impresionantes cuando otros los controlan, pero aún están lejos de ser completamente autónomos.
El Micro1 de Ansari también hace algo llamado captura de datos humanos. A la gente le conviene usar gafas inteligentes que capturen las acciones cotidianas. Lo está haciendo en Brasil, Argentina, India y Estados Unidos.
Determine AI, con sede en San José, se asoció con el gigante inmobiliario Brookfield para capturar imágenes del inside de 100.000 hogares. Se tratará del movimiento humano para enseñar a los robots humanoides cómo moverse en espacios humanos. La compañía dijo que gran parte de los mil millones de dólares que recaudó se destinaron a recopilar datos humanos en primera persona.
Scale AI, respaldado por meta, ha recopilado 100.000 horas de imágenes de entrenamiento similares para robótica a través de su laboratorio prototipo instalado en San Francisco.
Aun así, entrenar robots no siempre es fácil.
Dev Mandal, de veinte años, creó una empresa en Bengaluru con la esperanza de sacar provecho de la necesidad de datos físicos para entrenar la IA. Ofreció mano de obra barata de la India para capturar movimientos. Después de anunciar sus servicios, recibió solicitudes para ayudar a entrenar un brazo robótico para cocinar alimentos, así como un robotic para enchufar y desconectar cables en centros de datos.
Pero tuvo que abandonar el negocio, ya que los clientes potenciales necesitaban los datos de movimiento físico recopilados de una manera muy específica, lo que le dificultaba ganar dinero, incluso con la mano de obra barata de la India. Los clientes querían un brazo robótico exacto, por ejemplo, usando un cierto tipo de mesa con luces violetas.
“Todos, hasta el colour de la mesa, tenían que ser especificados por ellos”, dijo. “Y dijeron que este tiene que ser del colour exacto”.
Aún así, todavía queda mucho trabajo para los dobladores de toallas de Karur.
Su jefe, el fundador de Objectways, Ravi Shankar, cube que en los últimos meses su empresa ha capturado y comentado imágenes de brazos robóticos doblando cajas de cartón y camisetas y seleccionando ciertos objetos de colores sobre una mesa.
Recientemente comenzó a anotar movies de robots humanoides más avanzados, ayudándolos a entrenarlos para clasificar y doblar una mezcla de toallas y ropa, doblándolas y colocándolas en diferentes rincones de la mesa. Su equipo tuvo que anotar 15.000 vídeos de los robots realizando sus trabajos.
«A veces los brazos del robotic tiran la ropa y no la doblan correctamente. A veces dispersa la pila», pero los robots están aprendiendo rápidamente, dijo Kavin, de 27 años, un empleado de Objectways que tiene un solo nombre. “En cinco o diez años ellos podrán hacer todos los trabajos y a nosotros no nos quedará ninguno”.
Descubre más desde Breaking News 24
Suscríbete y recibe las últimas entradas en tu correo electrónico.






