La mina de oro en los textos


INNOVACIÓN. El reto de la computación, es utilizar la minería de textos para extraer información útil, con herramientas de análisis estadístico y lingüístico.

ARTICULO No 166En el mundo de los textos, el principal reto de la tecnología computacional, es extraer conocimiento de grandes colecciones de documentos. Para ello, se utilizan tecnologías capaces de descubrir tendencias, patrones y dependencias. Nos referiremos a la Minería de Textos, como el método de extraer información útil de textos no estructurados.

Como su nombre lo indica no tiene estructura definida, es decir ninguna parte de su contenido tiene más importancia que otra. Para identificar los mayores rasgos de este tipo de textos,  estos no cuentan con una organización de campos, registros, orden alfabético o numérico, es más parecido a un editorial periodístico.

La Minería de Textos es aplicable a problemas relacionados con la información textual, en la que destacan la extracción de información. Esta aplicación consiste en extraer información relevante de grandes volúmenes de textos, permitiendo obtener relaciones, tendencias, por ejemplo, aplicaciones que exploran sitos web para obtener números de teléfonos, direcciones o correos electrónicos.

Otra de las aplicaciones, es la utilización del análisis de opiniones, que se generan en las redes sociales, por ejemplo, la salida de una nueva bebida al mercado, la empresa puede analizar las opiniones y comentarios del producto por Facebook o Twitter. De este modo, se puede analizar, si el nuevo sabor de la bebida es de gusto de los clientes, la empresa podrá tomar la decisión sobre el destino de la bebida.

Una tercera aplicación, tenemos la clasificación de documentos, que consiste en la recuperación de documentos, por ejemplo, la clasificación de correos electrónicos como spam o no spam, clasificación de textos de acuerdo a una determinada temática. Para llevar a cabo estos procesos se apoyan de la estadística y el análisis lingüístico, haciendo posible el descubrimiento de contenidos relevantes.

Para entender mejor el tema de la Minería de textos; la minería tradicional explota en montañas de rocas y piedras, con la finalidad de extraer metales preciosos, mediante equipo especializados de extracción; mientras la Minería de Textos examina grandes volúmenes de textos con la finalidad de encontrar información valiosa, por medio de herramientas de análisis estadístico y lingüístico.

El análisis sobre el cual se lleva a cabo en los textos, es la exploración de particularidades, por ejemplo, la lengua española y sus diversas variantes formales, como antónimos, sinónimos. De este modo, las palabras que tengan sentidos muy diferentes cuyos conceptos relevantes pueden que se encuentre interrelacionados entre sí.

La Minería de Textos es relativamente nueva, conjuntamente con la computación avanzada y la lingüística, permiten comprender, reconocer e interpretar en grandes volúmenes de textos. Todos ellos han conllevado a la generación de mecanismos automáticos de clasificación, extracción y recuperación de textos.

Anuncios
Publicado en Sin categoría

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Al día de hoy tenemos
  • 42,987 visitas
Calendario
abril 2015
L M X J V S D
« Mar   May »
 12345
6789101112
13141516171819
20212223242526
27282930  
Archivo del blog
A %d blogueros les gusta esto: