Ads-728

Ads-728

Psicología

Astrofísica

Genética

Neurociencia

» » » Minería de textos: ¿qué tienen los editores en contra de esta avanzada herramienta de investigación?

Los investigadores están presionando para que decenas de miles de documentos con base en los trabajos de investigación,  para encontrar vínculos entre los genes y las enfermedades, estén disponibles en los sitios de acceso abierto, frente a la prohibición por parte de los editores sobre la minería de textos que se puede hacer a través del análisis informático.


Eso permitiría a los investigadores sondear el contenido libremente, sin necesidad de solicitar ningún permiso adicional.

Con frecuencia, los investigadores necesitan tener acceso a decenas de miles de trabajos de investigación a la vez, y de esta manera, pueden usar las computadoras para buscar patrones y asociaciones no vistos a través de los millones de palabras de los artículos.

Esta técnica, llamada minería de textos, es una parte vital de los métodos de investigación de este siglo XXI. Se utilizan ordenadores potentes para encontrar vínculos, por ejemplo, entre los fármacos y sus efectos secundarios, o entre genes y sus enfermedades, que están ocultos dentro de la vasta literatura científica. Esto da lugar a descubrimientos que una persona por más que rebusque, de uno en uno, entre ingente cantidad de documentos nunca podrá notar.

Es una técnica con un gran potencial. Un informe publicado por McKinsey Global Institute el año pasado, señalaba que las tecnologías de "grandes datos", como la minería de texto y datos, tendrían el potencial de crear 250 mil millones de euros de valor anual para la economía europea, si a los investigadores se les permitiese hacer un uso completo de ello.

La magnitud de la información novedosa en la ciencia moderna es asombrosa: Cada año se publican más de 1,5 millones de artículos científicos, y el volumen de datos se duplica cada tres años. Ningún individuo puede mantenerse al día con un volumen de información tan enorme, y los científicos necesitan computadoras para ayudarles a digerir y dar sentido a toda esa información.


- Referencia: Kurzweilai.net, 25 mayo 2012
- Artículo completo en The Guardian .
- Acerca de text2genome | Source Forge (descargar) .
- Imagen: La aplicación text2Genome está usando una forma única de mapear los artículos científicos con ubicaciones del genoma: A partir de un artículo científico de texto completo y de sus archivos de datos complementarios, todas las palabras que se asemejen a las secuencias de ADN son extraídas y luego asignadas a las secuencias del genoma públicos. A continuación, se muestran los sitios web del visor del genoma, y se utilizan las aplicaciones de minería de datos. (Crédito: text2Genome).

.

,

«
Next
Entrada más reciente
»
Previous
Entrada antigua
Editor del blog Pedro Donaire

Filosofía

Educación

Deporte

Tecnología

Materiales