Microsoft construye una cadena de herramientas de extremo a extremo para facilitar el desarrollo de sistemas autónomos y agentes inteligentes a través de las herramientas de IA y Azure para que puedan correr sistemas físicos de manera autónoma.
Por: Jennifer Langston, News Center Microsoft.
Posterior a un terremoto, un robot parecido a una serpiente puede arrastrarse a través de ellos escombros y de estrechas bolsas de aire para acceder a lugares a los que una persona no podría, o debería, llegar.
Sarcos Guardian S, una pequeña plataforma robótica de inspección visual, está diseñada justo para esos escenarios: buscar grietas en tuberías industriales, encontrar gente atrapada en edificios inestables, detectar si gases peligrosos en un lugar que tuvo un accidente podrían representar un riesgo de seguridad para los servicios de emergencia.
Hoy, el robot es controlado por alguien que trabaja a una distancia segura, que ve la escena a través de sus cámaras y lo guía con el equivalente a una palanca de un control de videojuegos. Ahora, Microsoft y Sarcos colaboran para agregar capacidades inteligentes a Guardian S que le podrían permitir navegar de manera más autónoma, para liberar al operador y permitirle enfocarse en decisiones más importantes.
La idea de aplicaciones industriales automatizadas y utilizar robots no es algo nuevo. Los brazos robóticos ahora mueven productos a través de una línea de ensamblado, las máquinas convierten pedazos de metal en partes de un producto, un auto da la vuelta sin ayuda humana.
Pero eso está muy lejos de los sistemas que en verdad son autónomos, los que son capaces de detectar su entorno y saber qué hacer cuando se enfrentan a situaciones desconocidas. En lugar de realizar tareas específicas de manera repetida sin variación, estos sistemas autónomos pueden responder de manera dinámica a entornos cambiantes para resolver un problema complicado. También tienen un vasto potencial de mejorar la manera en que la gente realiza su trabajo o desempeñar una labor que es poco segura o tiene un costo prohibitivo para que las personas la realicen.
Microsoft construye una cadena de herramientas de extremo a extremo para facilitar a cada desarrollador y organización la creación de sistemas autónomos para sus propios escenarios, ya sea un robot que pueda ayudar en situaciones que amenazan la vida de las personas, un dron que pueda inspeccionar equipo remoto o sistemas que ayuden a reducir el tiempo de inactividad en una fábrica al calibrar el equipo de manera autónoma.
“Las máquinas han progresado en su camino de ser manuales por completo a tener una función fija automatizada a volverse inteligentes en situaciones donde en verdad pueden lidiar por sí mismas con situaciones del mundo real”, comentó Gurdeep Pall, vicepresidente de Business AI para Microsoft.
“Queremos ayudar a acelerar ese trayecto, sin que nuestros clientes requieran contar con un ejército de expertos en IA”.
Durante la conferencia Microsoft Build para desarrolladores, la compañía anunció el primer componente de esta plataforma: un programa en versión previa limitada para desarrolladores que les permita trabajar con sus expertos en la construcción de agentes inteligentes a través de las herramientas de IA y Azure de Microsoft, para que puedan correr sistemas físicos de manera autónoma. Ese equipo incluye a experimentados investigadores e ingenieros de Microsoft y a expertos de Bonsai, empresa que Microsoft adquirió en 2018.
La plataforma de Microsoft para ayudar a los desarrolladores a crear sistemas autónomos emplea:
Herramientas de enseñanza automática únicas que permiten a los expertos en dominio utilizar su conocimiento para crear sistemas de IA sin la necesidad de contar con habilidades en ciencia de los datos
Tecnologías de simulación, como AirSim de Microsoft o simuladores de la industria, que permiten a las máquinas aprender en ambientes seguros pero a la vez realistas
También se basará en la diversa cartera de servicios de Internet de las Cosas de Microsoft, una plataforma fácil de utilizar de aprendizaje profundo de refuerzo y otras soluciones IA, y herramientas como ROS para Windows que permiten a los desarrolladores construir sistemas robóticos inteligentes, los cuales corren sobre una plataforma confiable y segura, ya sea desde un dispositivo o en la nube.
Los primeros clientes que participen en el programa de versión previa limitada aprenderán cómo utilizar las mismas herramientas de sistemas autónomos como las de compañías como Toyota Material Handling, que trabaja con Microsoft para desarrollar montacargas autónomos e inteligentes.
Sarcos, por ejemplo, buscaba una solución de sistemas autónomos que pudiera combinar lo mejor que las máquinas pueden ofrecer con intelecto e intuición humanas, comentó Kristi Martindale, vicepresidenta ejecutiva y jefa de mercadotecnia para Sarcos.
Hoy, la persona que controla un robot comercial Guardian S tiene que dirigir algo de su atención a oprimir botones y palancas en un control para guiarlo a través de espacios ajustados y sobre terreno variado. Puede tomar varios pasos manipular de manera apropiada cada segmento de la serpiente sobre una característica común del paisaje, como unas escaleras.
A través del uso de elementos de la cadena de herramientas de Microsoft, los ingenieros pudieron desarrollar un sistema de control autónomo que permita al robot tipo serpiente evitar obstáculos, navegar a través de escaleras y escalar una pared metálica por su cuenta.
En un escenario del mundo real, el operador aún podría jugar un rol en guiar al robot. Pero si el Guardian S puede detectar lo que lo rodea y desempeñar todos los movimientos intermedios para atravesar escaleras por su cuenta, el operador se puede enfocar en evaluar la escena y realizar juicios más críticos, comentó Martindale.
“Buscamos descargar las tareas que pueden ser automatizadas, ¿Cómo puede el robot subir una escalera? ¿Cómo se mueve alrededor de un obstáculo?, para que el operador pueda enfocarse en las partes más importantes del trabajo”, comentó. “El humano aún estará ahí para decir, ‘No, en realidad quieres pasar ese obstáculo por el otro lado porque tal vez ese obstáculo es una persona que está lastimada’”.
El trayecto de los sistemas automatizados a los sistemas autónomos
Cuando la gente piensa en sistemas autónomos, muchos van directo a la visión del auto que es autónomo por completo y que se conduce por su cuenta mientras ustedes se sientan en el asiento trasero y leen un libro, comentó Mark Hammond, ex CEO de Bonsai y gerente general para Business AI en Microsoft.
Pero los fabricantes de autos han integrado funciones autónomas en los autos por años, como el control de velocidad o los sistemas de frenos anti bloqueo que detectan lo que el conductor trata de hacer cuando encuentra una amenaza en un camino húmedo y resbaloso. Si esa persona oprime los frenos de manera tal que podría bloquear las llantas, ese sistema toma el control y previene que el auto pierda tracción.
La visión de Microsoft está basada en ayudar a otros tipos de compañías, desde empresas de edificios inteligentes y energía a fabricantes industriales, a conseguir esos pasos extra hacia la autonomía en sus propias industrias. Como muestra el ejemplo del robot Sarcos, muchos encontrarán el mayor valor con los humanos aún presentes en la ecuación, mencionó Hammond.
“En cualquier tipo de operación donde tienes un sistema mecánico que interactúa con el mundo físico, es probable que puedas volverla más inteligente y autónoma”, comentó Hammond. “Pero mantener a la gente en la ecuación es todavía muy deseable, y la meta es en verdad incrementar las capacidades de lo que los humanos son capaces de hacer”.
El aprendizaje de refuerzo es una rama de la IA en la cual los algoritmos aprender al ejecutar una serie de decisiones y son recompensados o penalizados con base en qué acciones los acercaron más al objetivo final. Es apto para ayudar a las máquinas a aprender cómo realizar tareas de control autónomo, como decidir la manera en que dirige un taladro subterráneo o inclinar una cuchilla de un tractor según si la tierra es grumosa, arenosa o rocosa.
Pero a pesar de que los algoritmos de aprendizaje profundo de refuerzo han vencido a la gente en videojuegos de manera exitosa, dominar tareas del mundo real ha sido más desafiante. En el mundo físico, los entornos dinámicos que podría encontrar un sistema autónomo, con gente y objetos que se mueven de manera impredecible o los cambios por minuto en temperatura o clima, pueden ser mucho más complicados. La detección exacta de dónde falló el sistema en una larga secuencia de pasos es una difícil tarea computacional.
Las máquinas han progresado en su camino de ser manuales por completo a tener una función fija automatizada a volverse inteligentes en situaciones donde en verdad pueden lidiar por sí mismas con situaciones del mundo real. Queremos ayudar a acelerar ese trayecto, sin que nuestros clientes requieran contar con un ejército de expertos en IA.
La plataforma de sistemas autónomos de Microsoft supera algunos de esos retos al utilizar un enfoque único llamado enseñanza automática. Se apoya en el conocimiento del desarrollador o del experto en la materia, alguien que tal vez no tenga antecedentes en IA pero entiende cómo dirigir un taladro o mantener el flujo de aire a un nivel seguro en un edificio de oficinas, para romper un problema grande en pedazos pequeños.
En lugar de hacer que los algoritmos de aprendizaje de refuerzo exploren cómo resolver un problema de manera aleatoria o nativa, lo que podría durar una eternidad, esa persona utiliza un lenguaje de programación llamado Inkling para mostrar al sistema cómo resolver problemas más simples primero y brindar pistas sobre lo que es importante. Esto acorta el proceso de aprendizaje y permite a los algoritmos llegar a una solución mucho más rápido.
La plataforma de Microsoft también permite a los que no son expertos en IA, establecer y torcer el sistema de recompensas, lo que es clave para llegar a una solución que en verdad funcione. Y esta selecciona y configura los algoritmos para enfrentar la tarea, lo que elimina la necesidad de que los expertos en aprendizaje automático personalicen soluciones de construcción.
Por ejemplo, los miembros del equipo trabajaron con Schneider Electric, una compañía global que trabaja para transformar de manera digital la gestión de energía en hogares, edificios e industrias, para probar si la IA puede ayudar a reducir la huella de carbono en sistemas HVAC que son utilizados para calentar y enfriar grandes edificios comerciales.
“Schneider está muy enfocado en la sustentabilidad, y los grandes edificios son de los principales contribuyentes de contaminación por carbono. Así que hay un importante mandato en hacer más eficientes a nivel energético a los sistemas HVAC”, comentó Barry Coflan, vicepresidente y jefe de tecnología de la división EcoBuildings en Schneider Electric.
Centrado en una larga relación que viene de tiempo atrás, se realizó una prueba de concepto con la cadena de herramientas de Microsoft y Schneider brindó la simulación para entrenar a un sistema de IA a que operara de manera autónoma los sistemas HVAC que controlaban el flujo de aire y calefacción en una sala de conferencias. Tenía que balancear el ahorro de energía con otras metas, como mantener la temperatura agradable para las personas que estaban dentro y asegurar que había suficiente aire fresco para evitar que se elevaran los niveles de dióxido de carbono.
Optimizar todos esos factores, que son controlados por diferentes sistemas físicos, requiere mucha más inteligencia que la de un simple termostato, comenta Hammond, de Microsoft. El sistema debe tomar en cuenta variables ambientales que cambian de manera constante: costos de energía que fluctúan durante el día, la gente que entra y sale de la sala, cómo está el clima en el exterior, la física que involucra cómo fluye el aire.
A través de un enfoque de enseñanza automática, expertos de Schneider y Microsoft primero enseñaron al sistema de aprendizaje de refuerzo a controlar bien la temperatura. Luego el sistema de IA aprendió cómo controlar los flujos de aire para mantener la calidad del aire a niveles saludables. Luego aprendió a considerar cómo la ocupación del cuarto afectaba a esos resultados.
Al tomar en cuenta todos esos factores, el sistema de IA de Microsoft pudo reducir el consumo de energía en el cuarto alrededor de 20 por ciento, a la vez que preservó el confort y la alta calidad del aire cuando era necesario. Los equipos ahora se han embarcado en una segunda fase de colaboración para escalar la simulación a través de diferentes tipos de salas e impulsar aún más los ahorros de energía.
Coflan comentó que el enfoque escalonado para la enseñanza y la capacidad de acumular diferentes recompensas, permitió a Schneider Electric entender cómo aprendía el sistema de IA y rastrear qué factores contribuyeron a las mayores ganancias.
“Mucho de lo que hacemos tiene ramificaciones de seguridad por lo que tenemos que entender de verdad cómo toma las decisiones un sistema de IA”, comentó Coflan. “Este enfoque te permite ver cómo se vuelve más inteligente el sistema y te brinda una ruta de auditoría que es esencial para la seguridad y la capacidad de ser reproducido. Nuestros clientes podrían querer eso también, no puedes sólo poner un sistema ahí afuera y decir ‘Confíen en nosotros’”.
La plataforma de sistemas autónomos de Microsoft utiliza un ambiente simulado de almacén en AirSim para entrenar a un montacargas inteligente a levantar y entregar cargas de manera autónoma mientras reconoce y evita otros obstáculos. El video ilustra la visión de un almacén futuro con montacargas inteligentes entrenados de manera previa que asisten a las personas en actividades diarias.
Correr una simulación a escala en Azure
Dado que una compañía no puede permitirse dejar a un robot o a un sistema de control inteligente que tengan millones de errores en una fábrica o granja eólica del mundo real mientras aprenden, los algoritmos de aprendizaje de refuerzo necesitan practicar en un ambiente simulado que pueda replicar los miles de millones de diferentes escenarios del mundo real que podrían encontrar.
La cadena de herramientas de Microsoft también incluye AirSim, una plataforma de simulación de código abierto desarrollada de manera original por los investigadores de Microsoft para utilizar IA para entrenar drones, autos de conducción autónoma o robots para que aprendan en ambientes simulados de alta fidelidad. O, el equipo puede trabajar con los clientes para entrenar a los sistemas autónomos a través de simuladores existentes específicos de cada industria.
En cualquier caso, ejecutar esas simulaciones hambrientas de datos en la nube de Azure permite al sistema probar en paralelo miles de diferentes secuencias de toma de decisiones, lo que permite a los modelos de IA aprender más rápido qué funciona y qué no.
“Si tengo la capacidad de genera miles de simulaciones a la vez y en cada uno el peatón que cruza la calle es diferente y la curva del camino es diferente, de pronto el sistema de IA podrá ser capaz de reunir una experiencia mucho más diversa en una menor cantidad de tiempo”, comentó Ashish Kapoor, gerente de investigación en Microsoft. “Azure nos brinda la capacidad de ejecutar a escala esas simulaciones, lo cual es muy importante”.
AirSim también permite a los desarrolladores entrenar diferentes IA y herramientas de control para resolver diferentes partes de problemas más complejos. Por ejemplo, en el proceso de ayudar a desarrollar los montacargas autónomos para Toyota Material Handling, los investigadores separaron la tarea en subconceptos que son más simples de aprender y depurar: navegar hacia la carga, alinearse con la tarima, recogerla, detectar a otras personas y a otros montacargas, entregar la tarima, regresar a la estación de carga.
En estos complejos escenarios, comentó Kapoor, hace sentido utilizar el aprendizaje de refuerzo para entrenar a un montacargas en tareas básicas de control, como recoger una tarima. La enseñanza automática ayuda al sistema a aprender en pasos que son más difíciles de manera progresiva, como alinear la grúa de manera horizontal y luego encontrar los ángulos apropiados.
Pero tal vez otras partes del problema serían resueltas de mejor manera por herramientas muy diferentes como los algoritmos de detección y evasión de obstáculos, planeación de ruta robótica o técnicas clásicas de control. Descomponer una tarea más grande en partes más pequeñas permite a los desarrolladores seleccionar e implementar la mejor herramienta para ese trabajo en particular.
“Trabajamos en brindar una plataforma integral para los clientes que quieren construir sistemas autónomos inteligentes, que cubre desarrollo, operación y gestión de extremo a extremo del ciclo de vida”, finalizó Hammond.