miércoles, 1 de junio de 2011

EAD (Encoded Archival Description).






INTRODUCCIÓN .

Tal como puede leerse en la página principal del sitio web oficial de EAD (Encoded Archival Description, Descripción Archivística Codificada, http://lcweb.loc.gov/ead/), la DTD (Document Type Definition, Definición de Tipo de Documento) de EAD es un estándar para codificar instrumentos de descripción archivística por medio de SGML (Standard Generalized Markup Language, ISO 8879:1986) y XML (eXtended Markup Language), mantenido en la Network Development and MARC Standards Office de la LC (Library of Congress, Biblioteca del Congreso de Estados Unidos) en colaboración con la Society of American Archivists (EAD Working Group). Es el primer estándar de estructura de datos para facilitar la distribución en Internet de información detallada sobre colecciones y fondos archivísticos a través de la herramienta estándar de acceso a los archivos: el instrumento de descripción.

Sin embargo, la intención de publicar en Internet instrumentos de descripción no es la única razón para usar EAD, ya que su estable pero flexible estructura jerárquica es aplicable igualmente a instrumentos de descripción en cualquier formato, ya sea publicado en Internet, producido por una base de datos o un procesador de textos, o impreso en papel.

Los orígenes

Su desarrollo comenzó con un proyecto de la Biblioteca de la Universidad de California en Berkeley, en 1993 (Proyecto Berkeley, dirigido por Daniel Pitti), sobre la conveniencia de desarrollar un estándar de codificación no propietario para instrumentos de descripción legibles por máquina como inventarios, registros, índices y otros documentos creados por archivos, bibliotecas, museos y repositorios de manuscritos para apoyar el uso de sus fondos. Se reconocía el creciente papel de las redes en el acceso a la información sobre fondos y se pretendía incluir información adicional a la proporcionada por los tradicionales registros MARC (MAchine-Readable Cataloging, Z39.2/ISO 2709).


Daniel Pitti desarrolló los requerimientos del estándar de codificación, que incluía estos criterios:

  1. capacidad de presentar información descriptiva extensiva e interrelacionada presente en los instrumentos de descripción archivística,
  2. capacidad de preservar las relaciones jerárquicas existentes entre niveles de descripción,
  3. capacidad de representar información descriptiva heredada por un nivel jerárquico desde otro,
  4. capacidad para moverse dentro de una estructura informativa jerárquica, y
  5. apoyo para la indización y recuperación de un elemento específico.

Al comienzo del proyecto llegaron a considerarse como candidatos para la técnica del estándar de codificación la presentación Gopher de texto ASCII plano, HTML (HyperText Markup Language), implementaciones existentes o nuevas de la estructura de registros de MARC, y marcado conforme a SGML. SGML se reveló como técnica capaz de cumplir todos los requerimientos funcionales, estando soportado además por un número elevado y creciente de productos de software disponibles para una variedad de sistemas operativos.

EAD como estándar de facto: las versiones de EAD

La primera versión de EAD (EAD DTD Version 1.0) es de 1998. La segunda, conocida como Version 2002 (colocada en el servidor web oficial de EAD el 19-12-2002) fue oficialmente anunciada el 20 de diciembre de ese año.

Hay tres documentos técnicos asociados a EAD:

  • La DTD: EAD DTD (Document Type Definition), EAD Technical Document No. 1 (http://www.loc.gov/ead/ead2002a.html), adaptable a SGML o XML, con material complementario como archivos de entidades opcionales.
  • La biblioteca de etiquetas: EAD Tag Library Version 2002, EAD Technical Document No. 2 (http://www.loc.gov/ead/tglib/), documento de referencia sobre cada uno de los elementos y atributos definidos en EAD, con apéndices útiles como pasarelas (crosswalks) a otros estándares (ISAD(G) 2000 y MARC21) y ejemplos de uso.
  • Las directrices de aplicación: EAD Version 2002 Application Guidelines, EAD Technical Document No. 3 (http://www.loc.gov/ead/ag/aghome.html) [A fecha 02-03-2005 aún no disponibles; las que están en las web son las de EAD Version 1.0 (1998)]

LAS DIRECTRICES.

Las Directrices de Aplicación de EAD (EAD Application Guidelines) son la tercera pieza de la documentación de EAD. De momento sólo contamos con las de la versión 1.0 (junto a la DTD y la biblioteca de etiquetas, que ya responden a la nueva versión, EAD 2002). Debe ser la primera consultada por administradores y archiveros interesados en implementar EAD.

Su objetivo es presentar EAD desde la perspectiva administrativa, técnica y, sobre todo, archivística.

No establecen prácticas específicas de codificación (las prácticas descriptivas internacionales actuales son tan divergentes que las reglas estrictas no serían prácticas), sino que ilustran y discuten pros y contras de diversas opciones. Tampoco intentan articular un contenido estándar para los instrumentos de descripción, aunque los creadores de EAD esperan que este trabajo prepare el camino hacia un futuro estándar internacional de contenido archivístico.

Están diseñadas par asistir a quienes están considerando usar EAD y quienes están codificando activamente la información descriptiva que se encuentra generalmente en los instrumentos de descripción archivística. Tratan las varias etapas y niveles de implementación de EAD y sus actividades asociadas desde una perspectiva de gestión y de codificación. También pretenden dar perspectivas sobre la base lógica, procesos e implicaciones de la codificación EAD para una audiencia muy amplia, incluyendo administradores, distribuidores de recursos, gestores y supervisores, archiveros y bibliotecarios de referencia, codificadores de instrumentos de descripción, programadores y administradores de sistemas.



Visión general del proceso de implementación de EAD


Una vez decidida la implementación, las etapas principales para crear instrumentos de búsqueda codificados con EAD incluirán los siguientes:

  • Evaluar las prácticas de descripción del Archivo, para desarrollar soluciones consistentes para la conversión de instrumentos de descripción existentes y la creación de otros nuevos en EAD.
  • Tomar decisiones sobre reglas y protocolos para las convenciones y estilo de descripción, profundidad de marcado, asignación de encabezados de acceso controlado y la relación entre los instrumentos de descripción codificados con EAD y los registros de catalogación MARC.
  • Elegir un software apropiado para crear ficheros EAD.
  • Adquirir (descargando) los ficheros oficiales necesarios, como la DTD de EAD y otros varios para aplicaciones software específicas, y cargarlos correctamente en su entorno local.
  • Validar los ficheros EAD usando analizadores SGML o XML.

Finalmente los Archivos deben considerar métodos posibles de "publicación" y distribución de instrumentos de descripción electrónica para ponerlos a disposición de los investigadores. Como con la creación de instrumentos de descripción codificados, se dispone de una variedad de escenarios y opciones de software, que van desde el simple enlace de los instrumentos de descripción en un sitio Web, al empleo de potentes (y a menudo caros) motores de búsqueda para facilitar la capacidad de los investigadores de localizar materiales relevantes. Todos requieren el uso de una combinación de scripts y/o hojas de estilo que interpreten la codificación EAD para la presentación pública y la recuperación. Deben considerarse también aspectos relativos a la impresión de instrumentos de descripción electrónica.

En cualquier caso, sea cual sea el uso que pretendemos hacer de EAD, tenemos que examinar nuestras prácticas de descripción para asegurarnos de que estamos sirviendo a los investigadores información inteligible y útil sobre nuestras colecciones.

La DTD

El esquema de codificación de EAD está diseñado para ser práctico y puede aplicarse gradualmente: los usuarios pueden elegir codificar tanto o tan poco como quieran.

La referencia a campos o elementos de datos de otros estándares relacionados, como ISAD(G) 2000 o MARC21, puede hacerse por dos métodos:

  • Si sólo se hará referencia a otro estándar, se puede usar el atributo relatedencoding de , o , dándole el valor, por ejemplo isad o marc, y a continuación dando al atributo encodinganalog de cada elemento que se corresponda con un campo o elemento de datos del otro estándar el valor concreto aplicable (p.ej.: 3.2.2 o bien 650).
  • Si se van a mezclar referencias a varios estándares, al atributo encodinganalog de cada elemento que se corresponda con un campo o elemento de datos del otro estándar se le dará el valor concreto aplicable (p.ej.: isad3.2.2 o marc650).

La estructura básica de un instrumento de descripción electrónico marcado con EAD: ead y adgrp

En el nivel más básico, los instrumentos de descripción archivística codificada consisten en dos segmentos: uno proporciona información sobre el propio instrumento de descripción (su título, compilador, fecha de compilación, etc.) y otro sobre un cuerpo de materiales de archivo: una colección, un grupo de registros, un fondo o una serie. La DTD de EAD parte el primero en dos elementos y recoge el segundo en un tercer elemento de alto nivel, hijos del elemento raíz (o elemento de documento) (Encoded Archival Description) que engloba todo el documento.

  • Cabecera EAD (EAD Header) . Contiene información similar a la de la portada de un texto impreso, pero relativa al documento electrónico, que identifica la versión electrónica del instrumento de descripción y puede también documentar las prácticas de descripción y codificación seguidas en su creación.
  • Material Inicial (Front Matter) , opcional. Puede usarse para codificar estructuras como prefacios, dedicatorias u otro texto relativo a la creación, publicación o uso del instrumento de descripción, y para generar una portada adaptada a las necesidades o gustos locales.
  • Descripción Archivística (Archival Description) . Contiene la descripción archivística propiamente dicha, y puede ser de nivel único (un único fondo, serie, expediente...) o contener una descripción multinivel con la descripción de componentes subordinados (las series de un fondo, las unidades documentales de éstas, en dos o más niveles).

Todo ello iría precedido de una declaración de tipo de documento, referencia explícita al archivo externo que contiene la DTD que se aplicará al texto por el analizador SGML o XML, y, en su caso, por la referencia a la hoja de estilo pertinente.

Además, se puede englobar un conjunto de instrumentos de descripción electrónicos ya marcados con EAD agrupándolos dentro de un elemento raíz (que obviamente tiene su DTD propia, la del Grupo EAD, EAD Group, y no será detallada aquí) en lugar de , que altera la estructura de un documento EAD simple incluyendo elementos propios como en lugar de y, como elemento hijo de éste, en lugar de ; puede llevar como hijos elementos .

La cabecera EAD: eadheader

La cabecera EAD (EAD Header), , está basada en la cabecera TEI (Text Encoding Initiative), una iniciativa internacional para desarrollar y mantener un conjunto de DTDs para codificar textos literarios o lingüísticos u otros objetos de estudio de interés en las humanidades. Con objeto de promover la máxima uniformidad posible en la provisión de metadatos entre tipos de documentos, EAD usa una cabecera similar a la de TEI para capturar información sobre la creación, revisión, publicación y distribución de instrumentos de descripción concretos. La secuencia de elementos y subelementos en se especifica en la DTD, permitiendo búsquedas entre repositorios más predecibles ya que los elementos están uniformemente ordenados (título, fecha, repositorio, lengua, etc.). Al ser obligatoria fuerza a los archiveros a incluir información esencial sobre sus instrumentos de descripción electrónicos. Estos elementos, que pueden usarse para generar portadas electrónicas e impresas para aquellos, deben seguir un orden determinado para asegurar la uniformidad entre instrumentos de descripción.

La cabecera resultante consiste en cuatro subelementos, algunos de los cuales están subdivididos:

  • El Identificador EAD (EAD Identifier) (obligatorio) proporciona un número o código de identificación único para el instrumento de descripción y puede indicar la localización, fuente y tipo del identificador.
  • La Descripción del fichero (File Description) (obligatorio) contiene buena parte de la descripción bibliográfica sobre el instrumento de descripción, así como la edición, empresa editora, serie y notas relacionadas codificadas separadamente. Posteriormente se detallará su contenido.
  • La Descripción del perfil (Profile Description) registra una descripción detallada de los aspectos no bibliográficos de un texto, en concreto la lengua del instrumento de descripción (, que puede incluir uno más elementos ) e información sobre quién creó la versión codificada del documento y cuándo se hizo (). En la versión 2002 se introdujo el subelemento Reglas de Descripción (Description Rules) (ISAD(G) 3.7.2 Reglas y normas).
  • La Descripción de la Revisión (Revision Description) resume las revisiones hechas al documento EAD, control de cambios muy importante en grandes proyectos. Cada subelemento tiene dos sublementos: e (uno o más).

A su vez, tiene los siguientes elementos:

  • Mención de título (Title Statement) (obligatorio), que agrupa información sobre el título de la obra y los responsables de su contenido intelectual, incluyendo en subelementos el nombre del autor, , título, (obligatorio), subtítulo, , y patrocinador, .
  • Mención de edición (Edition Statement) , que contiene información relativa a la edición del instrumento de descripción electrónico, que puede incluirse en un elemento .
  • Mención de publicación (Publication Statement) , con la información relativa a la publicación y distribución del instrumento electrónico, con elementos como , ,
    y .
  • Mención de serie (Series Statement) , con información sobre la serie, en su caso, a la que pertenece la publicación, con elementos básicos como y .
  • Mención de nota (Note Statement) , agrupa todas las notas (cada una en un subelemento ) que den información sobre un texto adicional al indicado en otras partes del instrumento de descripción.

Ciertos atributos de permiten expresar con valores fijos la norma ISO seguida para normalizar otros aspectos del documento:

  • dateencoding (valor fijo iso8601): para las fechas, allá donde se use un elemento (o , elemento hijo de , para la fecha de la unidad descrita), que se codifican de acuerdo con la norma ISO 8601, dando el valor correspondiente al atributo normal (de o ). El formato puede ser, entre otros, alguno de los siguientes: aaaa, aaaa-mm, aaaa-mm-dd, aaaa-Wss, aaaaWss-d, aaaa-ddd, hh:mm:ss, hh:mm, hh, hh:mm:ssZ, hh:mm:ss+hh:mm:ss, aaaa-mm-ddThh:mm:ss, aaaa-mm-ddThh:mm:ss/aaaa-mm-ddThh:mm:ss (los guiones o dos puntos pueden omitirse).
  • langencoding (valor fijo iso6392b): para las lenguas, que se codifican con la norma ISO 639-2B, dando el valor pertinente a los atributos langcode (de y ): tres letras, como en spa (español, o es, si usáramos la ISO 639-1).
  • scriptencoding (valor fijo iso15924): para las escrituras, con la norma ISO 15924, dando el valor correspondiente al atributo scriptcode (de ): dos letras, como en la (latina)
  • countryencoding (valor fijo iso3166-1): los países, con la ISO 3166-1, dando el valor correspondiente al atributo countrycode (de o ): dos letras, como en ES (España). [-2: subdivisiones; -3: nombres antiguos]
  • repositoryencoding (valor fijo iso15511): los repositorios, con la norma ISO 15511 (Information and documentation - International Standard Identifier for Libraries and Related Organisations [ISIL]), dando el valor correspondiente al atributo mainagencycode (de ) y repositorycode (de ): varios caracteres, como en AMCO (o ES-AMCO).


Para una práctica sencilla con EAD, es más fácil copiar la siguiente cabecera EAD y reemplazar el texto entre corchetes con la información pertinente sobre el instrumento de descripción que se está codificando. Esta cabecera contiene los elementos mínimos (obligatorios en la DTD) y además aquellos que permiten codificar datos contemplados en ISAD(G) 2000 y que están en la cabecera EAD y no, como la mayoría, en .


Material preliminar y portadas: frontmatter y titlepage

Frente a la mayor sistematización de los datos presentes en la cabecera , el elemento opcional puede usarse para codificar más libremente estructuras como portadas, prefacios, dedicatorias u otro texto relativo a la creación, publicación o uso del instrumento de descripción. El subelemento reutiliza, sin un orden fijo, muchos subelementos designados en y puede usarse para generar una portada que siga preferencias locales para secuenciar la información. El resto de secciones del material preliminar, como las citadas, pueden encerrarse en elementos

, que pueden anidarse (tener elementos hijos
) y llevar un encabezado . Lo que sigue es un elemento típico.

Description of Subordinate Components) , que se tratará más adelante. Los elementos de datos disponibles en o nivel de la unidad se repiten en los diversos niveles de componente dentro de , y la información se hereda de un nivel jerárquico al siguiente.

La descripción archivística: archdesc

El elemento contiene información sobre un cuerpo de materiales de archivo, información organizada jerárquicamente que describe una unidad de registros o documentos junto con las partes o divisiones que lo componen. Incluye información sobre el contenido, contexto y extensión de los materiales de archivo y otra opcional suplementaria que facilita su uso por los investigadores. Los instrumentos de descripción generalmente describen una unidad de registros o documentos en varios niveles de detalle diferentes pero relacionados. El elemento integra estos niveles desplegables y jerár

rchdesc> identifica, a través del atributo level el nivel más alto de los materiales que se describen (ISAD(G) 3.1.4 Nivel de descripción); el nivel puede ser uno de los siguientes: fonds, subfonds, recordgrp (aproximadamente equivalente a fondo en USA), subgrp, series, subseries, class (aproximadamente equivalente a serie en UK), file, item, collection, otherlevel.

En un escenario típico, un archivero empieza a codificar un instrumento de descripción abriendo en primer lugar el elemento y creando el requerido . Luego puede añadir algún material preliminar opcional antes de abrir el elemento y dar a su atributo level el valor (collection, fonds, series... ) que refleje mejor el carácter de la unidad completa que se está describiendo en el instrumento de descripción.

El elemento opcional (una variante de para el elemento ) permite incluir una cabecera para el conjunto de la descripción archivística.

La identificación descriptiva:

Los subelementos de se conciben como los más importantes para asegurar una buena descripción básica de una unidad o componente de archivo. Esta agrupación de elementos tiene varios propósitos: asegura que los mismos elementos y estructura de datos están disponibles en cada nivel de descripción en la jerarquía EAD, facilita la difusión y recuperación de un cuerpo coherente de elementos para el descubrimiento y reconocimiento de recursos, y puesto que los elementos aparecerían juntos en la biblioteca de etiquetas y en los menús y plantillas de software, ayuda a que los codificadores recuerden capturar información descriptiva que de otra manera podrían pasar por alto.

El elemento puede contener, además del genérico , y en cualquier orden, uno o más de los siguientes subelementos descriptivos, que son los puntales familiares de la catalogación archivística:

  • Identificación de la Unidad (Identification of the Unit) : número de acceso, número de clasificación, número de lote u otro identificador único y permanente (ISAD(G) 3.1.1 Código de referencia)
  • Título de la Unidad (Title of the Unit) : título de los materiales de archivo a cualquier nivel que se estén describiendo, como título de colección, de serie, de subserie, de expediente (file), o de ítem (ISAD(G) 3.1.2 Título).
  • Fecha de la unidad (Date of the Unit) : designa las fechas de creación de los materiales de archivo (ISAD(G) 3.1.3 Fechas).
  • Descripción Física (Physical Description) : identifica, por medio o no de elementos hijos, la extensión , dimensiones , género o forma y otras características físicas de la unidad descrita (ISAD(G) 3.1.5 Volumen y soporte de la unidad de descripción: cantidad, tamaño o dimensiones).
  • Origen (Origination) : denota los individuos u organizaciones responsables de la creación o recopilación (assembly) de los materiales de archivo. (ISAD(G) 3.2.1 Nombre del productor(es)).
  • Lengua del material (Language of the Material) : Añadido en la versión 2002, contiene la lengua del material descrito. (ISAD(G) 3.4.3 Lengua/escritura(s) de los documentos).
  • Archivo (o depósito, Repository) : designa la institución responsable de proporcionar acceso intelectual. Puede llevar el elemento hijo Subárea .
  • Localización Física (Physical Location) : identifica el número de la estantería y el estante u otra localización de almacenamiento.
  • Contenedor (Container) : identifica el número de cartón, caja, carpeta, u otra unidad de agrupación en la que los materiales de archivo se colocan y almacenan.

El elemento también cuenta con un elemento Resumen (Abstract) , Detalles de material especial (Material Specific Details) , y un elemento general Nota (Note) , así como elementos Objeto archivístico digital (Digital Archival Object) y Grupo de objetos archivísticos digitales (Digital Archival Object Group) , que pueden contener copias digitales del material que se describe en el instrumento de descripción.

Los subelementos de llevan atributos como label, type y encodinganalog, para permitir una designación de contenidos más específicos. El último permite la designación del elemento de ISAD(G) o del campo o subcampo MARC aplicable junto con la forma autorizada de los datos (contenida en el elemento), permitiendo a los archiveros generar registros ISAD(G) o MARC básicos a nivel de colección automáticamente desde instrumentos de descripción EAD, así como ayudar a los sistemas de indización y recuperación identificar elementos de datos comparables en registros bibliográficos e instrumentos de descripción.