Interesante artículo el que nos comparte hoy una estimada colega. Se trata una publicación escrita por Anders Törneholm, publicada el 9 de junio de 2022 en el boletín digital de Linköping University en Suecia, y traducido por nosotros para este espacio. Veamos de qué se trata…
Lograr la diversidad en la visión humana es uno de los principales desafíos para la investigación en Inteligencia Artificial (IA). En la gran mayoría de los casos, somos mejores que las máquinas para comprender el mundo que nos rodea. Pero las máquinas se están poniendo al día, de forma lenta pero segura.
"En un solo día, los humanos podemos pasar de conducir un automóvil a bucear libremente, y continuar leyendo el periódico y luego caminar por un denso bosque, todo sin mucho esfuerzo. Para un robot, hacer las mismas cosas actualmente sería imposible, " dice Michael Felsberg, profesor de la Universidad de Linköping y uno de los principales investigadores de Suecia en visión por computadora e inteligencia artificial (IA).
Que los humanos podamos hacer todo esto, y mucho más, se debe en gran parte a la visión. Las estimaciones dicen que alrededor del 80% de nuestras impresiones nos llegan a través de nuestra visión. Es el sentido más importante para percibir lo que sucede a nuestro alrededor. La investigación de Michael Felsberg se centra principalmente en lo que se denomina el sistema visual artificial, cuyo objetivo es conseguir que los ordenadores vean tan bien como los humanos.
"Los sistemas biológicos simplemente funcionan en forma excelente. Los humanos son notablemente hábiles en la percepción y el análisis general, habilidades que queremos emular en las computadoras. Hoy podemos construir sistemas técnicos que son buenos para realizar una tarea en particular, como los vehículos autónomos. Pero si en el futuro queremos poder colaborar con robots, ellos deben ser capaces de ver y comprender exactamente lo que nosotros vemos", dice Michael Felsberg.
Imitar la visión humana puede parecer fácil a primera vista. Cuando comenzó la investigación de IA, la sensación era que la visión por computadora se resolvería con una simple cámara, tal vez un proyecto para las vacaciones de verano. Ahora, casi 60 años después, la visión general por computadora se ha convertido en uno de los desafíos más destacados en la investigación de IA.
El código es el cerebro.
Michael Felsberg y sus compañeros de trabajo prueban muchas de las soluciones que desarrollan en el laboratorio de visión en Campus Valla en Linköping. Por ejemplo, entre las enormes paredes de vidrio, se prueban drones autónomos y pequeños autos sin conductor equipados con sensores y cámaras avanzados. Pero el cerebro real en la visión por computadora está detrás de la lente.
"La cámara es solo un sensor de luz; no puede hacer nada más. El código y el software detrás de la cámara hacen el trabajo real. Lo mismo ocurre con las personas: el ojo registra la luz y el cerebro hace el trabajo, ", dice Michael Felsberg.
Ha habido muchos intentos de emular el cerebro humano, con resultados variables. Hoy en día, se suele utilizar un método de aprendizaje automático llamado aprendizaje profundo. En pocas palabras, significa que la computadora aprende sus modelos organizados en redes neuronales a partir de grandes cantidades de datos. Los algoritmos se alimentan con enormes cantidades de datos, que se analizan en varios niveles. Esto puede sonar complicado, y lo es. La verdad es que nadie puede decir exactamente qué sucede en cada activación en una red profunda.
Michael Felsberg traza paralelos con el cerebro humano:
"En un escáner cerebral, puede ver qué partes del cerebro están activas durante diferentes estímulos. Pero aún no sabemos qué sucede realmente y cómo se forma un pensamiento en el cerebro. El aprendizaje profundo funciona de manera algo similar. Vemos que funciona, pero no cómo funciona en detalle", dice.
El camino a seguir
Pero, ¿por qué es tan difícil para una computadora ver lo que vemos? La respuesta radica en nuestra capacidad para adaptarnos rápidamente a diferentes situaciones y el circuito de retroalimentación entre nuestra percepción de nuestro entorno y nuestra capacidad cognitiva constantemente activa.
Mirar a través del cristal de una ventana sucia es un ejemplo cotidiano de una situación en la que las computadoras luchan, pero los humanos nos las arreglamos a la perfección. Vemos inmediatamente lo que sucede fuera de la ventana, a pesar de nuestra visión ligeramente obstruida. Por otro lado, una computadora primero se enfocará automáticamente en la suciedad del panel. Pero una vez que ha encontrado el enfoque correcto, en la escena exterior, todavía no entenderá completamente lo que está sucediendo, porque parte de la vista está bloqueada por la suciedad.
Aún así, hay áreas donde las computadoras ya ven mejor que los humanos, en particular cuando se trata de cálculos exactos y evaluaciones de distancias, temperaturas y patrones. En estos casos, la visión artificial puede complementar nuestra propia visión, en lugar de sacar sus propias conclusiones y actuar en consecuencia.
“Un sistema técnico funciona bien siempre que todo sea como se espera. Pero ante algo inesperado, tendrá problemas. Debemos trabajar para que los sistemas sean más robustos”, dice Michael Felsberg.
Pero desarrollar software que pueda superar la flexibilidad de la visión humana lleva tiempo. Y según Michael Felsberg, la investigación debe llevar tiempo para ser sólida. La ciencia es un proceso, y cada nuevo artículo de investigación agrega otra pequeña pieza a un enorme rompecabezas. Los avances que dan un gran salto a la investigación son muy raros.
"La conciencia situacional general en una computadora posiblemente podría existir en nuestra vida. Pero crear el vínculo entre la cognición y la conciencia situacional general en una computadora probablemente esté muy lejos en el futuro", dice Michael Felsberg.
Una vez que exista la visión general por computadora, él cree que habrá muchas aplicaciones diferentes, p.e. robots sociales, vehículos autónomos más seguros y producción más eficiente. Pero la IA no deja de ser controvertida. Muchos campos de uso corren el riesgo de invadir la privacidad individual cuando se procesan grandes volúmenes de datos personales.
Por esta razón, Michael Felsberg y su equipo de investigación se están enfocando en cómo la IA puede brindar una mejor comprensión de cómo podemos prevenir un cambio climático adicional:
"El cambio climático es una de las mayores amenazas a las que se enfrenta la humanidad. Con el uso de visión artificial avanzada, podremos analizar rápidamente grandes extensiones de tierra y su importancia para el clima. Lo que los humanos tardarían varios años en trazar manualmente podría terminarse en un santiamén (pocas semanas) con la ayuda de la IA".
Fuente: https://liu.se/en/news-item/mansklig-syn-en-utmaning-for-ai
animal.”