ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Documentos pdf


Enviado por   •  8 de Septiembre de 2021  •  Informes  •  1.746 Palabras (7 Páginas)  •  66 Visitas

Página 1 de 7
  1. Documentos PDF
  1. Introducción

PDF es un formato de archivo para representar documentos de una forma independiente de la aplicación software, hardware o sistema operativo que se haya usado para su creación, así como del dispositivo de salida por el que se muestra o imprime. Un documento PDF consiste en una colección de objetos que juntos, describen la apariencia de una o más páginas, posiblemente acompañados por elementos interactivos adicionales y datos de aplicación de alto nivel. Un archivo PDF contiene los objetos que componen un documento PDF, así como la información estructural asociada, todo ello representado como una única secuencia autocontenida de bytes.

Las páginas de un documento (y otros elementos visuales) pueden contener cualquier combinación de texto, gráficos e imágenes. La apariencia de una página se describe mediante un flujo de contenidos PDF, que contiene una secuencia de objetos gráficos para que sean representados en la pantalla.

Además de describir la apariencia estática de la página, un documento PDF puede contener elementos interactivos que son sólo posibles en una representación electrónica. PDF soporta anotaciones (annotations en lenguaje PDF) de muchos tipos, como notas de texto, enlaces de hipertexto, marcas, ficheros adjuntos, sonidos y películas. Un documento puede definir su propia interfaz de usuario; las entradas de ratón y teclado pueden activar ciertas acciones que están especificadas en los objetos PDF. Un documento también puede contener campos de un formulario interactivo para que sean rellenados por el usuario, y puede importar o exportar los valores de esos campos a otras aplicaciones (veremos más adelante que estas características no se pueden incluir en un documento para enviar al IEEE Xplore).

  1. Componentes de un archivo PDF

Para conocer la estructura de un documento PDF nos remitiremos a la referencia de Adobe, en la que podemos comprobar como un documento PDF se divide en cuatro partes:

𝖮 Objetos: Un documento PDF es una estructura de datos compuesta por un pequeño conjunto de tipos básicos de objetos de datos.

𝖮 Estructura de Archivo: La estructura del archivo PDF determina como se almacenan los objetos en un archivo PDF, como se accede a ellos , y como se actualizan. Esta estructura es independiente de la semántica del objeto.

𝖮 Estructura de Documento: La estructura de un documento PDF especifica como se usan los tipos básicos de objetos para representar los componentes de un documento PDF, es decir, páginas, anotaciones, fuentes, etc.

𝖮 Flujos de contenido: Un flujo de contenido PDF contiene una secuencia de instrucciones que describen la apariencia de una página u otra entidad gráfica. Estas instrucciones, a pesar de que también se representan como objetos, son conceptuelmante distintas de los objetos que componen un PDF, y por eso se describen aparte.

Dentro de los objetos, podemos encontrarnos con los siguientes tipos:

𝖮 Booleanos.

𝖮    Números Enteros y Reales.

𝖮  Cadenas de texto.

𝖮  Nombres.

𝖮 Arrays.

𝖮  Diccionarios.

𝖮  Streams.

𝖮   El Objeto Nulo.

Por su especial relevancia en el proyecto, describiremos los objetos de tipo diccionario. También haremos lo propio con los objetos indirectos, ya que nos ayudará a leer un archivo PDF por dentro, al abrirlo en modo texto.

  1. Objetos de Diccionario.

Un Objeto Diccionario es una tabla asociativa que contiene pares de objetos, conocidos como Entradas de Diccionario. El primer elemento de cada entrada es la Clave, y el segundo elemento es el Valor. La clave debe ser un nombre, pero el valor puede ser cualquier clase de objeto, incluyendo otro diccionario. Una entrada de diccionario cuyo valor sea Null, es equivalente a una entrada ausente.

Dos entradas distintas de un diccionario no pueden tener la misma clave.

Un diccionario se escribe como una secuencia de pares Clave-Valor, delimitados por los símbolos << y >>. Veamos un ejemplo:

<< /Type /Example

/SubType /DictionaryExample

/version 0.01

/IntegerItem 12

/StringItem (una cadena de texto)

.

.

.

>>

Los Objetos de tipo Diccionario son los pilares básicos de un documento PDF. Se usan

principalmente para agrupar y unir los atributos de un objeto complejo, como una fuente o una página de un documento, con cada entrada del diccionario especificando un valor para un atributo. Por convenio, la entrara Type de un diccionario identifica el tipo de objeto que describe el diccionario. En algunos casos, la entrada Subtype se usa para referirse a una subcategoría de un tipo más general. El Valor de las entradas Type o Subtype siempre es un nombre. Por ejemplo, un diccionario de Tipo Fuente, el valor de la entrada Type es Font, mientras que el subtipo puede ser Type1, TrueType, etc.

El valor de la entrada Type casi siempre se puede extraer del contexto. El operando de un operador Tf, por ejemplo, debe ser una fuente. Por lo tanto, la entrada Type sirve principalmente para documentación y corrección de errores. La entrada Type, por tanto, no es obligatoria a no ser que así se describa en el documento. Pero, de existir, ha de tener el valor correcto.

  1. Objetos Indirectos.

Cualquier objeto de un archivo PDF puede ser etiquetado como un objeto Indirecto. Esto le proporciona al objeto un identificador de objeto único que pueden usar otros objetos para referirse a él, por ejemplo, como elemento de un Array o el valor de una entrada en un objeto Diccionario. Un identificador de objetos consta de dos partes:

𝖮 Un Numero de Objeto entero positivo. Los objetos indirectos a menudo se enumeran secuencialmente en un archivo PDF, pero no es necesario, pudiendo numerarse de forma arbitraria.

𝖮 Un número entero no negativo de generación. Se usa para las actualizaciones del documento.

Juntos, la combinación de un objeto número y un número de generación, identifican unívocamente un objeto indirecto.

La definición de un objeto indirecto en un archivo PDF consiste en su número de objeto, y un número de generación (por defecto, todos empiezan con número de generación 0), seguidos del valor del objeto, delimitado por las palabras clave obj y endobj. Por ejemplo, la definición:

...

Descargar como (para miembros actualizados)  txt (10.9 Kb)   pdf (147.1 Kb)   docx (16.4 Kb)  
Leer 6 páginas más »
Disponible sólo en Clubensayos.com