ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Tesauros


Enviado por   •  25 de Abril de 2013  •  Exámen  •  1.832 Palabras (8 Páginas)  •  337 Visitas

Página 1 de 8

Tesauros

Un tesauro es un vocabulario controlado y estructurado formalmente, formado por términos que guardan entre sí relaciones semánticas y genéricas: de equivalencia, jerárquicas y asociativas. Se trata de un instrumento de control terminológico que permite convertir el lenguaje natural de los documentos en un lenguaje controlado, ya que representa, de manera unívoca, el contenido de estos, con el fin de servir tanto para la indización, como para la recuperación de los documentos.

La norma ISO 2788-1986 define un tesauro como "un vocabulario controlado y dinámico, compuesto por términos que tienen entre ellos relaciones semánticas y genéricas y que se aplica a un dominio particular del conocimiento". Por su parte, Georges van Slype en Los lenguajes de indización, define un tesauro como "una lista estructurada de conceptos destinados a representar de manera unívoca el contenido de los documentos y de las consultas dentro de un sistema documental determinado y a ayudar al usuario en la indización de los documentos y de las consultas".

Frente a los lenguajes clasificatorios cuya función es describir el tema de un documento, los términos contenidos en un tesauro responden al análisis del texto o materia. Un tesauro recoge todos los conceptos y no sólo los que corresponden al título o el texto. Un único tema (aquello de lo que trata el documento) suele desarrollarse mediante una serie de ideas o conceptos que se pueden describir por medio de una serie de términos o descriptores. El tesauro incorporará todos esos términos en una base de datos y cada uno de ellos se convertirá en un punto de acceso para la recuperación del documento. La potencia de un tesauro radica además, en la posibilidad de combinar todos esos términos o descriptores, lo que le convierte en un lenguaje combinatorio mucho más rico que las tradicionales encabezamientos de materias. Un tesauro es pues, una herramienta de control terminológico muy útil para el análisis, descripción y recuperación automatizados.

La estructura de un tesauro se basa en los siguientes elementos:

Unidades léxicas: que pueden comportar las siguientes categorías: grupos de descriptores que agrupan los términos de indización bien por campos (temas), bien por clases de términos (facetas).

descriptores: términos permitidos. Un descriptor es una palabra o conjunto de palabras del lenguaje corriente que responden a un concepto. Esto es, los descriptores son términos o unidades lingüísticas que expresan conceptos. Un concepto se expresa con un único término y ese término responde a un único concepto. Dicho término será utilizado para el análisis y la recuperación del documento.

términos simples o unitérminos: se emplean cuando el concepto es claro en sí mismo, sin necesidad de añadir ninguna otra palabra, o cuando se usa como genérico de términos más concretos o específicos. Ejemplo: Documentos.

términos compuestos: la mayoría de los términos de un tesauro adquieren su verdadero sentido cuando se convierten en términos compuestos, ya que así se logra una mayor especificidad. La estructura sintáctica de los términos compuestos suele ser la siguiente:

sustantivo + adjetivo: Documentos digitales

sustantivo + sintagma preposicional: Documentos de archivo

sustantivo + sintagma aposicional: Documentos RDF/XML

no descriptores: términos prohibidos. Al elegir un único término para eliminar la sinonimia del lenguaje natural, se rechazan los términos restantes, que serán los no descriptores.

Relaciones semánticas: son todas aquellas relaciones que se establecen entre los términos de un tesauro. Podemos distinguir las siguientes:

relaciones de equivalencia: se derivan de la gran proximidad fonética o sémica entre los descriptores y no descriptores (sinónimos, cuasi-sinónimos, etc). Este tipo de relaciones se suelen representar mediante el término USE (relación entre el término no preferente y el término preferente, o término a usar más aceptado) y las siglas UP (Usado por), que en inglés son USE y UF. Ejemplo: Dictablanda GOBIERNO BERENGUER. USE GOBIERNO BERENGUER U.P (Usado por) Dictablanda

relaciones jerárquicas: son relaciones asimétricas, establecidas entre los descriptores, en la que un término es superior o genérico de otro. Esta estructura clasificatoria distingue al tesauro de las listas alfabéticas de materias o palabras clave, así como de diccionarios y léxicos. De esta forma se crean campos conceptuales que clasifican los términos y los agrupan en un campo delimitado de significados o facetas que se van agrupando en disciplinas y sub-disciplinas. Para la presentación de las relaciones jerárquicas se suelen utilizar determinadas siglas como T.G. (Término Genérico) y T.E. (Término Específico); o por su siglas en inglés, BT (Broad Term o término más amplio), NT (Narrow Term o término más específico), SY (sinónimo), RT (término relacionado), etc. Si un descriptor tiene un sólo descriptor por encima de él es monojerárquico, si tiene dos o más es polijerárquico. Las relaciones jerárquicas pueden ser de dos tipos:

Relaciones género-especie: se aplica a acciones, propiedades y agentes. (T.G. Armas/T.E. Armas blancas)

Relaciones parte-todo: el nombre de una parte implica y evoca la del todo poseedor. Se aplica a objetos, lugares, disciplinas y sus partes de estudio, estructuras sociales, etc. (T.G. Guerra/T.E. Guerra de Irak)

relaciones asociativas: son las relaciones asimétricas establecidas entre descriptores de distintas familias, distintas a las jerárquicas o de equivalencia, y que designan conceptos capaces de evocar mutuamente, por asociación de ideas, relaciones entre ellos. Este tipo de relación se suele representar mediante las siglas T.R. (Término Relacionado) o en inglés RT (Related Term). La mayoría de las relaciones asociativas se establecen entre términos que comparten un lexema común (por ejemplo, POLÍTICA. T.R. POLÍTICOS) o que mantienen unas relaciones de hiperonimia o hiponimia (CARGOS MUNICIPALES. T.R. ADMINISTRACIÓN LOCAL). También podemos añadir Notas de Alcance (N.A.) con el fin de ofrecer una explicación o descripción del significado del término.

Atendiendo a diferentes aspectos, los tesauros pueden ser de diferentes tipos,

...

Descargar como (para miembros actualizados)  txt (12.5 Kb)  
Leer 7 páginas más »
Disponible sólo en Clubensayos.com