ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Lenguaje De Marcado


Enviado por   •  17 de Marzo de 2015  •  858 Palabras (4 Páginas)  •  209 Visitas

Página 1 de 4

Tema 4: Representación de Documentos

1.- Introducción

La representación de documentos es fundamental para poder procesar estos y es una fase previa en el tiempo a la recuperación de información, pero es parte integrante del conjunto.

El objetivo de la representación de documentos es la traducción de los mismos a términos del sistema. Esta representación se lleva a cabo mediante un conjunto de fases que contribuyen mediante ciertas simplificaciones y generalizaciones a presentar una vista lógica de los documentos que permita su comparación con las consultas. Es por tanto un proceso imprescindible para la recuperación de información.

En general podríamos equiparar la representación de documentos al análisis documental, aunque con algunos matices. El primero de ellos hace referencia al ámbito automatizado en que tienen lugar estos procesos. Las representaciones que generaremos serán aptas para su procesamiento por parte de aplicaciones informáticas según diversos modelos. Además la representación de los documentos se hace en torno a criterios temáticos, y para ser más exactos, en torno a criterios temáticos analíticos. En este sentido existen ciertas similitudes con el proceso de indización que hacen que muchos especialistas hablen directamente de un proceso de indización automática para referirse al conjunto de las operaciones conducentes a la representación de los documentos.

Nosotros preferimos hablar de representación de documentos en conjunto y de indización automática para una de las fases en concreto. Podemos dividir estas en:

- Elección y selección de unidades de representación

- Creación del léxico de la colección

- Indización automática

Que a su vez incorporan fases más específicas de representación que detallaremos a continuación. Una parte importante de los subprocesos son independientes al modelo de recuperación de información elegido, aunque otros no. De igual forma algunos subprocesos son más adecuados para ciertas técnicas mientras que otros no lo son. Presentamos una visión concisa de los procesos más comunes a continuación.

2.- Elección y selección de elementos de representación

El término “elemento de representación” hace referencia a la unidad de sentido mínima utilizada para representar un documento. Como describiremos más tarde, estas unidades de representación pueden tomar la forma de un descriptor unitérmino, un descriptor sintagmático, una agrupación artificial de palabras...etc. El elemento de representación está formado por tanto de una o más palabras que forman un descriptor u otra construcción con valor representativo, de manera que cada una de las partículas que forman dicho elemento de representación en principio no poseen carga de significación autónoma.

2.1.- Términos sencillos

Hasta el momento no hemos establecido cuáles serían dichas unidades de representación que

...

Descargar como (para miembros actualizados)  txt (5.9 Kb)  
Leer 3 páginas más »
Disponible sólo en Clubensayos.com