ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

ONIX, DILVE Y Archivos CSV

b3t0_8612 de Mayo de 2013

5.660 Palabras (23 Páginas)380 Visitas

Página 1 de 23

Índice

1 Introducción 1

1.1 ONIX, DILVE y archivos CSV 1

1.2 Necesidad de estandarizar los nombres de archivos 1

2 Campos de contenidos ricos 3

2.1 Enumeración 3

2.1.1 Descripciones y otros textos de apoyo 3

2.1.2 Archivos de imagen, audio y vídeo 4

2.2 Campos CSV 4

2.2.1 Introducción 4

2.2.2 Nombres de los campos 4

2.2.3 Contenido de los campos CSV 5

2.2.4 Textos embebidos en campos CSV 6

3 Gestión de los contenidos 8

3.1 Carga física vs. Referencia (Archivos de imágenes) 8

3.1.1 Envío físico del archivo 9

3.1.2 Envío de referencias a los archivos 9

3.2 Archivos de imágenes 10

3.2.1 Formas de envío 10

3.2.2 Formato 11

3.2.3 Tamaños 11

3.3 Campos de texto 13

3.3.1 Contenido de los campos CSV 13

3.3.2 Formato de los contenidos textuales 14

4 Nomenclatura de archivos 16

4.1 Convenios 16

4.1.1 Convenio general: 16

4.1.2 Convenio simplificado, para archivos de imagen 17

5 Envío de archivos CSV con archivos adjuntos 18

5.1 Proceso 18

5.1.1 Paso 1: Agrupación de ficheros en una misma carpeta 18

5.1.2 Paso 2: Selección y empaquetado en .zip 19

5.1.3 Paso 3: Envío del archivo a DILVE 21

6 Servicio de asistencia y soporte DILVE 22

Distribuidor de información del libro español en venta

Cargas de textos e imágenes mediante CSV. v1 r10 (07/2012)

1

1 Introducción

1.1 ONIX, DILVE y archivos CSV

Al estar basada en ONIX, la estructura interna de DILVE permite la inclusión en la ficha del libro de referencias a una gran variedad de contenidos ricos: imágenes, textos, etc.

Estos contenidos se dividen en tres grandes bloques1: Descripciones y otros textos de apoyo, que se detallan en el grupo ONIX PR-15. Las categor-ías de contenidos correspondientes se enumeran en la Lista ONIX 33. Enlaces a archivos de imagen, audio y vídeo, que se detallan en el grupo ONIX PR-16. Las categorías de elementos de este grupo se enumeran en la Lista ONIX 38. Elementos de contenido (en forma estructurada), que se detallan en el grupo ONIX PR-18. Las categorías de contenidos correspondientes se enumeran en la Lista ONIX 42.

Con el fin de permitir la gestión de contenidos ricos, para aquellas editoriales que no utilicen el formato ONIX, DILVE ha preparado un subconjunto de campos que permiten la carga y extracción de un elevado número de contenidos mediante archivos CSV.

Esos campos se enmarcan en los dos primeros bloques mencionados: Descripciones y otros tex-tos de apoyo, y Enlaces a archivos de imagen, audio y vídeo.

Los elementos del tercer bloque, Elementos de contenido, necesitan ONIX para su carga y requie-ren estar integrados en una estructura de campos jerarquizada por lo que sólo se pueden expre-sar, razonablemente, en formato XML-ONIX nativo.

En cualquier caso, es importante recordar, que todo elemento de contenido gestionado mediante campos en archivos CSV en DILVE, debe corresponder a algún elemento de contenido definido en ONIX, como es el caso de los expuestos en el presente documento.

En este documento se describen los campos de contenido que pueden cargarse o referenciarse mediante archivos CSV, así como los formatos requeridos por cada uno.

Este documento es un complemento del manual "Campos en archivos CSV", disponible en el web www.dilve.es.

1.2 Necesidad de estandarizar los nombres de archivos

En general, la finalidad de los archivos cargados o referenciados en DILVE es su visualización en la pantalla de un ordenador (o dispositivos similares), fundamentalmente en entornos web. Esto entraña unas características determinadas en cuanto a su formato, y su resolución, tamaño, peso (en el caso de imágenes) etc.

Por otra parte, la explotación de los recursos de DILVE por parte de los distintos usuarios se reali-zará, en general, mediante métodos automáticos: descargas masivas o periódicas para alimentar otras bases de datos (p.ej. CEGAL en Red), generación automática de catálogos, etc.

1 En esta relación se indican las Listas ONIX en las que se enumeran cada uno de los elementos de conte-nido, ya que estas tienen un papel importante en la creación de los nombres de los archivos correspondien-tes. Sin embargo, no es necesario conocer las listas. En este manual se dan todas las claves necesarias.

Distribuidor de información del libro español en venta

Cargas de textos e imágenes mediante CSV. v1 r10 (07/2012)

2

Dado que en DILVE coexisten muchos archivos correspondientes a distintos recursos de obras muy variadas, es fundamental adoptar un convenio en la nomenclatura de los archivos que simpli-fique su tratamiento automático, permitiendo saber, por ejemplo, de qué recurso se trata así como sus características: a qué obra corresponde, qué tamaño tiene, etc.

Efectivamente, una aplicación que realice una descarga masiva de datos de DILVE, se puede encontrar con varios miles de archivos de textos o imágenes. Sin un convenio estricto para los nombres de estos recursos, se pueden producir efectos no deseados: Si dos archivos distintos tienen el mismo nombre, uno de ellos "machacará" al otro. Por ejem-plo, supongamos que las editoriales A y B utilizan, ambas, el nombre cervantes.jpg para las imágenes de las cubiertas de sus libros Biografía de Cervantes (Editorial A) y Lectura crítica de los entremeses de Cervantes (Editorial B). Si ambos libros figuran en una descarga de DILVE, sólo se puede enviar un archivo con el nombre cervantes.jpg, con lo que ambos libros aparecerán con la misma imagen de la cubierta. Para uno de ellos, evidentemente, esta ima-gen será incorrecta. Si en el nombre del archivo figuran caracteres no aceptables en el entorno informático que procesa las extracciones de DILVE, se producirá un error en la aplicación, resultando imposi-ble procesar el archivo correspondiente, con lo cual se perderá la posibilidad de mostrar o procesar la imagen.

Es conveniente que, ante distintas versiones de un mismo archivo, se puedan determinar, de for-ma automática las características de cada uno.

En el Apartado 4 - Nomenclatura de archivos (pág. 16) se presenta el convenio para nombres de archivos recomendado por DILVE.

Distribuidor de información del libro español en venta

Cargas de textos e imágenes mediante CSV. v1 r10 (07/2012)

3

2 Campos de contenidos ricos

2.1 Enumeración

2.1.1 Descripciones y otros textos de apoyo

Dado que toda la información gestionada en DILVE sigue el estándar ONIX, todos los campos cargados deben estar recogidos en este estándar. En el caso de descripciones y otros textos de apoyo los campos correspondientes se almacenan en el bloque PR.15 del registro ONIX y su tipología está enumerada en la Lista de códigos ONIX número 332.

De los tipos enumerados en esa lista estándar, DILVE permite actualmente la carga mediante archivos CSV, de los siguientes contenidos:

Contenido

Cód. lista ONIX 33

Resumen del libro / Descripción principal

01

Extracto del libro

23

Índice / Tabla de materias

04

Primer capítulo

24

Texto de la solapa

17

Texto de contracubierta

18

Comentario del autor

11

Reseña

07

Cita de reseña

08

Descripción para el lector

12

Descripción para las librerías

31

Descripción para los medios (prensa, etc.)

26

Titular promocional.

09

Resumen breve

02

En la tabla se indica el código de la lista 33 de ONIX asignado a cada tipo de contenido, ya que este valor es necesario para crear el nombre del archivo correspondiente si el texto se envía o recibe en forma de archivo adjunto al archivo CSV.

Para cada uno de los contenidos enumerados se puede indicar, además, el idioma en que está escrito.

El contenido de cada campo debe corresponder, lógicamente, al nombre del campo: no se debe incluir una Reseña en el campo Índice/Tabla de materias. DILVE no realiza ninguna comprobación en este sentido.

La finalidad última de estos campos textuales es, en general, su inclusión en entornos web. Por ello es conveniente que no sean excesivamente extensos y que su redacción permita una lectura

2 No es necesario conocer el funcionamiento interno de ONIX para gestionar estos contenidos mediante archivos CSV.

Distribuidor de información del libro español en venta

Cargas de textos e imágenes mediante CSV. v1 r10 (07/2012)

4

fácil en dichos entornos. Lógicamente, para aquellos campos que se correspondan con una parte del libro (tabla de materias, primer capítulo), la extensión vendrá obligada.

Aunque DILVE no impone ninguna norma respecto a la extensión y estilo del contenido de estos campos, es posible que alguna entidad usuaria de DILVE sí establezca determinados criterios para poder explotar estos contenidos en entornos concretos. En estos casos, esos conjuntos de crite-rios se harán públicos en DILVE para que las editoriales que quieran incorporar sus datos a dichas entidades puedan hacer los ajustes pertinentes en los datos cargados.

Por otra parte, la editorial que cargue cualquier contenido en DILVE debe asegurarse de que dis-pone de los permisos necesarios y que su publicación en DILVE, y su posterior descarga por parte de los usuarios de DILVE no infringe los derechos de

...

Descargar como (para miembros actualizados) txt (38 Kb)
Leer 22 páginas más »
Disponible sólo en Clubensayos.com