Ads-728

Ads-728

Psicología

Astrofísica

Genética

Neurociencia

» » Semántica basada en la conectividad de las palabras

Referencia: Alpha.Galileo.org, 3 de julio 2013

Ahora es posible identificar el significado de las palabras con múltiples significados, sin usar su contexto semántico.

Dos físicos brasileños han ideado un método para dilucidar automáticamente el significado de las palabras con varios sentidos, para ello se han basado únicamente en sus patrones de conectividad con las palabras cercanas en una oración dada, y no en la semántica.

Thiago Silva y Diego Amancio, de la Universidad de São Paulo, Brasil, en un trabajo que será publicado en EPJ B, revelan cómo han modelado unos textos clásicos como redes complejas, a fin de adivinar su significado. Este tipo de modelo juega un papel clave en diversas tareas de procesamiento del lenguaje natural, como la traducción automática, la recuperación de información, el análisis de contenido y el procesamiento de textos.

En este estudio, los autores optaron por un conjunto de diez, de las así llamadas palabras polisémicas, es decir, con múltiples significados, como 'bear', 'jam', 'just', 'rock' o 'present'. Luego verificaron sus patrones de conectividad con las palabras cercanas del texto de clásicos literarios, tal como "Orgullo y prejuicio" de Jane Austen. En concreto, establecieron un modelo que consistía en un conjunto de nodos que representan palabras conectadas por sus 'extremos', cuando son adyacentes en un texto.

Los autores compararon los resultados de su ejercicio de desambiguación con el enfoque tradicional basado en la semántica. Observaron tasas de precisión importantes en la identificación de los significados apropiados cuando se utilizaban ambas técnicas. El enfoque descrito en este estudio, basado en la llamada  caracterización determinista del paseo turístico, donde se puede considerar una metodología complementaria para distinguir entre los sentidos de las palabras.

En trabajos futuros, los autores tienen previsto establecer nuevas medidas para la conexión no sólo de palabras adyacentes, sino las que también hay dentro de un intervalo dado, con el fin de mejorar la capacidad de este modelo para aprehender los factores semánticos. Este enfoque se apoya en otro estudio reciente, realizado por los mismos autores, donde demostraban que las medidas tradicionales de redes complejas dependen principalmente de la sintaxis.


- Ref: Springer Science+Business Media.
- Más información: European Physical Journal .
- Publicación: T. C. Silva and D. R. Amancio (2013), Discriminating word senses with tourist walks in complex networks, European Physical Journal B, DOI 10.1140/epjb/e2013-40025-4.
.

«
Next
Entrada más reciente
»
Previous
Entrada antigua
Editor del blog Pedro Donaire

Filosofía

Educación

Deporte

Tecnología

Materiales