Ads-728

Ads-728

Psicología

Astrofísica

Genética

Neurociencia

» » » » El conocimiento especializado es inútil

Referencia: NewScientist.com .
Por Peter Aldhous, 7 de diciembre 2012

Kaggle.com ha convertido la predicción de datos en un deporte. Las personas que compiten para resolver problemas se imponen a los especialistas, dice su presidente, Jeremy Howard, a quien entrevistamos a continuación:


Kaggle se ha descrito como "un mercado en línea para cerebros". Hábleme de ello.

Es un sitio web que aloja los concursos para la predicción de datos. Hemos hecho un montón de competiciones sorprendentes. Una de ellas fue el de desarrollar algoritmos automatizados para evaluar ensayos de los estudiantes. Uno que terminó hace poco desafiaba a los competidores a desarrollar un sistema de aprendizaje gesticular para el Microsoft Kinect. La idea era mostrar al controlador un gesto una sóla vez, y el algoritmo ya lo reconocería en el futuro. Otra competición predecía las propiedades biológicas de las moléculas pequeñas siendo analizados como posibles fármacos.

¿Exactamente cómo trabajar estas competencias?

Se basan en técnicas como la minería de datos y el aprendizaje automático para predecir las tendencias futuras de los datos actuales. Las empresas, los gobiernos y los investigadores presentaron conjuntos de datos y problemas, y ofrecen premios en metálico por las mejores soluciones. Cualquier persona puede participar: tenemos cerca de 64.000 usuarios registrados. Hemos descubierto que los científicos de datos creativos pueden resolver los problemas en todos los campos mejor que los propios expertos en esos campos.

Estas competiciones tratan temas muy especializados. ¿Vienen expertos?

Oh, sí. Cada vez que sale una nueva competición, los expertos dicen: "Hemos construido toda una industria alrededor de esto. Conocemos las respuestas". Y después de un par de semanas, consiguen salir a la superficie.

Entonces, ¿a quién le va bien en las competiciones?

Esa gente que ve lo que en realidad los datos están diciendo, sin distraerse con los supuestos de la industria o los del conocimiento especializado. Jason Tigg, que dirige un gran fondo de inversión en Londres, lo hace así una y otra vez. También lo hace Xavier Conort, que dirige una consultora de análisis predictivo en Singapur.

Tú estuviste una vez en la clasificación. ¿Cómo participar?

Fue un camino largo y extraño. Me especialicé en filosofía en Australia, trabajé en una consultora de gestión durante ocho años, y en 1999 fundé dos start-ups, una fue una empresa de correo electrónico y la otra ayudaba a aseguradores a optimizar los riesgos y beneficios. Para 2010, ya había vendido las dos. Comencé a aprender chino, y a construir amplificadores y altavoces, aunque no hacía nada con mis manos. Yo viajaba. Pero aquello no era un desafío intelectual suficiente. Más tarde, en una reunión de usuarios de estadísticas en Melbourne, alguien me habló de Kaggle, y pensé: "Esto se ve intimidante y muy interesante".

¿Cómo fue su primera competición?

Aunque situé mis expectativas a la baja, mi objetivo no estaba en último lugar. Y en realidad lo gané. Se trató de la previsión de llegadas y salidas de turistas diferentes destinos. En el época en que fui a la siguiente reunión de estadísticas yo había ganado dos de las tres competiciones que me presenté. Anthony Goldbloom, el fundador de Kaggle, estaba allí. Él dijo: "¿Tú no eres Jeremy Howard?, Nunca hemos tenido a nadie que ganara dos de tres competiciones antes?".

¿Cómo llegaste a ser jefe científico de Kaggle?

Me ofrecí para ser el salvaguarda inversionista; pero simplemente no podía mantener mis manos fuera del negocio. Le dije a Anthony que el sitio se ejecutaba lentamente y volvió a escribir todo el código desde cero. Luego, él y yo pasamos tres meses en Estados Unidos el año pasado, tratando de recaudar dinero. Ahí fue cuando las cosas empezaron a ponerse realmente en serio, porque recaudamos 11 millones de dólares. Tuve que trasladarme a San Francisco y comprometerme a hacer esto a tiempo completo.

¿Compites aún?

Puedo competir, pero no ganar premios. En la práctica, he estado muy ocupado.

¿Cómo se explica el éxito Kaggle en la resolución de problemas de análisis predictivo?

El aspecto competitivo es importante. Cuantas más personas participen en estos concursos, mejor modelo predictivo se consigue. No hay otro lugar en el mundo que yo sepa, al margen del deporte profesional, donde puedas obtener una retroalimentación tan clara, dura y libre sobre lo que estás haciendo. Queda meridianamente claro lo que funciona y lo que no. Es una especie de proceso evolutivo, acelerando la supervivencia del más apto y viendo lo que sucede justo enfrente de nosotros. Cada vez más, nuestros principales competidores se van uniendo entre sí.

¿Qué métodos estadísticos funcionan mejor?

Uno que surge una y otra vez se llama el bosque aleatorio. Este tiene diversas pequeñas muestras aleatorias de datos y crea un "árbol de decisiones" para cada uno, y se ramifica de acuerdo a las cuestiones formuladas sobre los datos. Cada árbol, por sí mismo, tiene poco poder predictivo. Pero si se hace una "media" de todos ellos, al final se termina con un poderoso modelo. En conjunto, se trata de una caja negra sin enfoque cerebral. No tienes que pensar, simplemente funciona.

¿Qué separa a los ganadores de los perdedores?

La diferencia entre los participantes buenos y los malos es la información que alimenta los algoritmos. Usted tiene que decidir qué hacer desde una abstracción de datos. Los ganadores de las competiciones Kaggle tienden a ser curiosos y creativos. Ellos vienen con una docena de formas totalmente nuevas de pensar acerca de un problema. Lo bueno de los algoritmos como el del bosque aleatorio es que se pueden sacar ideas locas tantas como quieras y con los algoritmos averiguar cuál funciona.

Eso suena muy diferente del enfoque tradicional para la construcción de modelos predictivos. ¿Cómo han reaccionado los expertos?

Los mensajes son incómodos para un montón de gente. Es controvertido porque les estamos diciendo: "Sus décadas de conocimientos especializados, en realidad son inútiles; tus sofisticadas técnicas son peores que los métodos genéricos". Es difícil para la gente que está acostumbrada a ese viejo modelo de la ciencia. Ellos pasan mucho tiempo discutiendo si una idea tiene sentido. Revisan las visualizaciones y se comen el coco sobre ello. Todo esto es activamente inútil.

¿Hay algún papel para el conocimiento experto?

Algún tipo de experiencia se requiere al principio para intentar averiguar cuál es el problema que estamos tratando de resolver. La experiencia que usted necesita es su propia estrategia para responder a estas cuestiones.

¿Hay desventajas en el enfoque de caja negra, en la conducción de datos que predomina en Kaggle?

Algunas personas consideran que no acaban con una comprensión más profunda del problema. Pero eso no es cierto, los algoritmos te dicen qué es importante y qué no. Podrías preguntarte por qué estas cosas son importantes, pero creo que eso es lo menos interesante. Se termina con un modelo predictivo que funciona. No hay mucho que discutir ahí.


- Autor: Cuando Jeremy Howard se graduó en filosofía en la Universidad de Melbourne, Australia, ya estaba trabajando como consultor de gestión en McKinsey & Company. Más tarde fundó FastMail y Optimal Decisions Group. Actualmente es presidente y director científico de Kaggle, San Francisco.
- Imagen: Equipo de Kaggle.
- Artículo original: "Specialist knowledge is useless and unhelpful"
.

,

,

«
Next
Entrada más reciente
»
Previous
Entrada antigua
Editor del blog Pedro Donaire

Filosofía

Educación

Deporte

Tecnología

Materiales