Ads-728

Ads-728

Psicología

Astrofísica

Genética

Neurociencia

» » El "arte" de la Inteligencia Artificial


Al igual que muchos niños, Antonio Torralba empezó a jugar con los ordenadores cuando tenía 13 años de edad. A diferencia de muchos de sus amigos, no pasaba el tiempo jugando con juegos de video, sino que escribía sus propios programas de inteligencia artificial (IA).

Creció en la isla de Mallorca, España, y pasó su adolescencia diseñando algoritmos para reconocer los números escritos a mano, o que detectaran el verbo y el sustantivo de una oración. Pero quizás de lo que se sentía más orgulloso es de un programa que podía mostrar a la gente cómo se vería el cielo nocturno en una dirección determinada. "O si pudieras mudarte a otro planeta, te diría cómo se verían las estrellas desde allí", comenta.

Hoy en día, Torralba es profesor adjunto de ingeniería eléctrica y ciencias de la computación en el MIT, y  en el Computer Science and Artificial Intelligence Laboratory (CSAIL), donde desarrolla sistemas de inteligencia artificial (IA) capaces de interpretar imágenes y entender lo que las escenas y objetos contienen.

Torralba se empezó a interesar por una visión por ordenador cuando trabajaba en su doctorado en el Instituto Politécnico de Grenoble en Francia. "La visión es un área muy importante", subraya él. Es un un gran desafío, que requiere una gran cantidad de potencia de cálculo. "Alrededor de un 30 por ciento del cerebro está dedicado o conectado a la visión."

En este momento, la mayoría de los investigadores de la visión por ordenador, se ocupan de detección facial y el reconocimiento, tratando el resto de la imagen casi como ruido molesto. Sin embargo, Torralba estaba mucho más interesado en el reconocimiento y la comprensión de otros objetos dentro de una imagen. "Quería crear sistemas que pudiesen poner los objetos en su contexto, e intentar omprender cómo los diferentes objetos se relacionan entre sí", explica.

Así que, comenzó a desarrollar sistemas que usaban la información obtenida de una imagen completa, para ayudar a identificar objetos individuales. Si una imagen contiene un objeto posado en lo alto de una mesa, por ejemplo, dicho objeto es poco probable que sea algo muy grande, acortando considerablemente la cantidad de cosas que podría ser.

En última instancia, estos sistemas podrían ser utilizados para anotar todas las imágenes que se muestran en línea y hacerlos más fáciles de localizar. También podría permitir que los robots puedan reconocer dónde se encuentra una casa o un edificio de oficinas, basándose en los muebles u objetos que se vean a su alrededor.

Torralba también está tratando de desarrollar sistemas que puedan escanear un clip de vídeo de corta duración y predecir lo que va a ocurrir a continuación, basándose igualmente en las personas u objetos de la escena. Para ello, los sistemas deberán entender lo que pueden lograr las acciones de cada objeto o persona de la escena y cuáles son sus limitaciones. Esto permitirá que los sistemas puedan hacer predicciones sobre lo que cada una de estas entidades sea capaz de hacer en un futuro próximo.

Si los sistemas de IA pueden de esta manera aprender a predecir lo que sucederá después, dada toda la información disponible acerca de una situación en particular, debería ayudarles a anticiparse el cómo sus acciones influirán en los acontecimientos futuros, igual que pueden los humanos.

Antes de pertenecer al CSAIL, Torralba pasaba su tiempo libre produciendo su propia obra de arte digital mediante la superposición de varias imágenes. Para una imagen en particular, Torralba tomaba 150 fotografías, cada una de las cuales contenía una persona en el centro de la imagen, entonces las combinaba. El resultado es una imagen digital que parece haber sido dibujada a mano, dice: "La superposición de todas estas imágenes ofrece esta calidad que parece como hecha con un lápiz, pero son fotografías digitales."

Él utilizó un enfoque similar para crear un "diccionario visual", que consiste en una imagen formada por miles de imágenes individuales, que ilustran el trabajo de su grupo. Cada cuadro representa una de las aproximadamente 50.000 palabras de la lengua inglesa que se corresponden con un concepto visual. Al pulsar en cualquier punto de la imagen nos trae una determinada palabra representada por las imágenes individuales y su definición.

Aunque su sitio web es un interesante proyecto artístico por derecho propio, también sirve para un propósito práctico, actuar como base de datos de todas las imágenes que, tanto él como su equipo han recogido, y sobre los cuales entrenan sus sistemas de visión por ordenador, como él mismo señala, "nuestro objetivo es desarrollar un sistema capaz de reconocer totalmente los 50.000 objetos."

Una meta, por cierto, que probablemente  mantenga ocupado a Torralba durante algún tiempo.




«
Next
Entrada más reciente
»
Previous
Entrada antigua
Editor del blog Pedro Donaire

Filosofía

Educación

Deporte

Tecnología

Materiales