
INTRODUCCIÓN .
Tal como puede leerse en la página principal del sitio web oficial de EAD (Encoded Archival Description, Descripción Archivística Codificada, http://lcweb.loc.gov/ead/), la DTD (Document Type Definition, Definición de Tipo de Documento) de EAD es un estándar para codificar instrumentos de descripción archivística por medio de SGML (Standard Generalized Markup Language, ISO 8879:1986) y XML (eXtended Markup Language), mantenido en la Network Development and MARC Standards Office de la LC (Library of Congress, Biblioteca del Congreso de Estados Unidos) en colaboración con la Society of American Archivists (EAD Working Group). Es el primer estándar de estructura de datos para facilitar la distribución en Internet de información detallada sobre colecciones y fondos archivísticos a través de la herramienta estándar de acceso a los archivos: el instrumento de descripción.
Sin embargo, la intención de publicar en Internet instrumentos de descripción no es la única razón para usar EAD, ya que su estable pero flexible estructura jerárquica es aplicable igualmente a instrumentos de descripción en cualquier formato, ya sea publicado en Internet, producido por una base de datos o un procesador de textos, o impreso en papel.
Los orígenes
Su desarrollo comenzó con un proyecto de la Biblioteca de la Universidad de California en Berkeley, en 1993 (Proyecto Berkeley, dirigido por Daniel Pitti), sobre la conveniencia de desarrollar un estándar de codificación no propietario para instrumentos de descripción legibles por máquina como inventarios, registros, índices y otros documentos creados por archivos, bibliotecas, museos y repositorios de manuscritos para apoyar el uso de sus fondos. Se reconocía el creciente papel de las redes en el acceso a la información sobre fondos y se pretendía incluir información adicional a la proporcionada por los tradicionales registros MARC (MAchine-Readable Cataloging, Z39.2/ISO 2709).
Daniel Pitti desarrolló los requerimientos del estándar de codificación, que incluía estos criterios:
- capacidad de presentar información descriptiva extensiva e interrelacionada presente en los instrumentos de descripción archivística,
- capacidad de preservar las relaciones jerárquicas existentes entre niveles de descripción,
- capacidad de representar información descriptiva heredada por un nivel jerárquico desde otro,
- capacidad para moverse dentro de una estructura informativa jerárquica, y
- apoyo para la indización y recuperación de un elemento específico.
Al comienzo del proyecto llegaron a considerarse como candidatos para la técnica del estándar de codificación la presentación Gopher de texto ASCII plano, HTML (HyperText Markup Language), implementaciones existentes o nuevas de la estructura de registros de MARC, y marcado conforme a SGML. SGML se reveló como técnica capaz de cumplir todos los requerimientos funcionales, estando soportado además por un número elevado y creciente de productos de software disponibles para una variedad de sistemas operativos.
EAD como estándar de facto: las versiones de EAD
La primera versión de EAD (EAD DTD Version 1.0) es de 1998. La segunda, conocida como Version 2002 (colocada en el servidor web oficial de EAD el 19-12-2002) fue oficialmente anunciada el 20 de diciembre de ese año.
Hay tres documentos técnicos asociados a EAD:
- La DTD: EAD DTD (Document Type Definition), EAD Technical Document No. 1 (http://www.loc.gov/ead/ead2002a.html), adaptable a SGML o XML, con material complementario como archivos de entidades opcionales.
- La biblioteca de etiquetas: EAD Tag Library Version 2002, EAD Technical Document No. 2 (http://www.loc.gov/ead/tglib/), documento de referencia sobre cada uno de los elementos y atributos definidos en EAD, con apéndices útiles como pasarelas (crosswalks) a otros estándares (ISAD(G) 2000 y MARC21) y ejemplos de uso.
- Las directrices de aplicación: EAD Version 2002 Application Guidelines, EAD Technical Document No. 3 (http://www.loc.gov/ead/ag/aghome.html) [A fecha 02-03-2005 aún no disponibles; las que están en las web son las de EAD Version 1.0 (1998)]
LAS DIRECTRICES.
Las Directrices de Aplicación de EAD (EAD Application Guidelines) son la tercera pieza de la documentación de EAD. De momento sólo contamos con las de la versión 1.0 (junto a la DTD y la biblioteca de etiquetas, que ya responden a la nueva versión, EAD 2002). Debe ser la primera consultada por administradores y archiveros interesados en implementar EAD.
Su objetivo es presentar EAD desde la perspectiva administrativa, técnica y, sobre todo, archivística.
No establecen prácticas específicas de codificación (las prácticas descriptivas internacionales actuales son tan divergentes que las reglas estrictas no serían prácticas), sino que ilustran y discuten pros y contras de diversas opciones. Tampoco intentan articular un contenido estándar para los instrumentos de descripción, aunque los creadores de EAD esperan que este trabajo prepare el camino hacia un futuro estándar internacional de contenido archivístico.
Están diseñadas par asistir a quienes están considerando usar EAD y quienes están codificando activamente la información descriptiva que se encuentra generalmente en los instrumentos de descripción archivística. Tratan las varias etapas y niveles de implementación de EAD y sus actividades asociadas desde una perspectiva de gestión y de codificación. También pretenden dar perspectivas sobre la base lógica, procesos e implicaciones de la codificación EAD para una audiencia muy amplia, incluyendo administradores, distribuidores de recursos, gestores y supervisores, archiveros y bibliotecarios de referencia, codificadores de instrumentos de descripción, programadores y administradores de sistemas.
Visión general del proceso de implementación de EAD
Una vez decidida la implementación, las etapas principales para crear instrumentos de búsqueda codificados con EAD incluirán los siguientes:
- Evaluar las prácticas de descripción del Archivo, para desarrollar soluciones consistentes para la conversión de instrumentos de descripción existentes y la creación de otros nuevos en EAD.
- Tomar decisiones sobre reglas y protocolos para las convenciones y estilo de descripción, profundidad de marcado, asignación de encabezados de acceso controlado y la relación entre los instrumentos de descripción codificados con EAD y los registros de catalogación MARC.
- Elegir un software apropiado para crear ficheros EAD.
- Adquirir (descargando) los ficheros oficiales necesarios, como la DTD de EAD y otros varios para aplicaciones software específicas, y cargarlos correctamente en su entorno local.
- Validar los ficheros EAD usando analizadores SGML o XML.
Finalmente los Archivos deben considerar métodos posibles de "publicación" y distribución de instrumentos de descripción electrónica para ponerlos a disposición de los investigadores. Como con la creación de instrumentos de descripción codificados, se dispone de una variedad de escenarios y opciones de software, que van desde el simple enlace de los instrumentos de descripción en un sitio Web, al empleo de potentes (y a menudo caros) motores de búsqueda para facilitar la capacidad de los investigadores de localizar materiales relevantes. Todos requieren el uso de una combinación de scripts y/o hojas de estilo que interpreten la codificación EAD para la presentación pública y la recuperación. Deben considerarse también aspectos relativos a la impresión de instrumentos de descripción electrónica.
En cualquier caso, sea cual sea el uso que pretendemos hacer de EAD, tenemos que examinar nuestras prácticas de descripción para asegurarnos de que estamos sirviendo a los investigadores información inteligible y útil sobre nuestras colecciones.
La DTD
El esquema de codificación de EAD está diseñado para ser práctico y puede aplicarse gradualmente: los usuarios pueden elegir codificar tanto o tan poco como quieran.
La referencia a campos o elementos de datos de otros estándares relacionados, como ISAD(G) 2000 o MARC21, puede hacerse por dos métodos:
- Si sólo se hará referencia a otro estándar, se puede usar el atributo relatedencoding de
, o , dándole el valor, por ejemplo isad o marc, y a continuación dando al atributo encodinganalog de cada elemento que se corresponda con un campo o elemento de datos del otro estándar el valor concreto aplicable (p.ej.: 3.2.2 o bien 650). - Si se van a mezclar referencias a varios estándares, al atributo encodinganalog de cada elemento que se corresponda con un campo o elemento de datos del otro estándar se le dará el valor concreto aplicable (p.ej.: isad3.2.2 o marc650).
La estructura básica de un instrumento de descripción electrónico marcado con EAD: ead y adgrp
En el nivel más básico, los instrumentos de descripción archivística codificada consisten en dos segmentos: uno proporciona información sobre el propio instrumento de descripción (su título, compilador, fecha de compilación, etc.) y otro sobre un cuerpo de materiales de archivo: una colección, un grupo de registros, un fondo o una serie. La DTD de EAD parte el primero en dos elementos y recoge el segundo en un tercer elemento de alto nivel, hijos del elemento raíz (o elemento de documento)
- Cabecera EAD (EAD Header)
. Contiene información similar a la de la portada de un texto impreso, pero relativa al documento electrónico, que identifica la versión electrónica del instrumento de descripción y puede también documentar las prácticas de descripción y codificación seguidas en su creación. - Material Inicial (Front Matter)
, opcional. Puede usarse para codificar estructuras como prefacios, dedicatorias u otro texto relativo a la creación, publicación o uso del instrumento de descripción, y para generar una portada adaptada a las necesidades o gustos locales. - Descripción Archivística (Archival Description)
. Contiene la descripción archivística propiamente dicha, y puede ser de nivel único (un único fondo, serie, expediente...) o contener una descripción multinivel con la descripción de componentes subordinados (las series de un fondo, las unidades documentales de éstas, en dos o más niveles).
Todo ello iría precedido de una declaración de tipo de documento, referencia explícita al archivo externo que contiene la DTD que se aplicará al texto por el analizador SGML o XML, y, en su caso, por la referencia a la hoja de estilo pertinente.
Además, se puede englobar un conjunto de instrumentos de descripción electrónicos ya marcados con EAD agrupándolos dentro de un elemento raízLa cabecera EAD: eadheader
La cabecera EAD (EAD Header),
La cabecera resultante consiste en cuatro subelementos, algunos de los cuales están subdivididos:
- El Identificador EAD (EAD Identifier)
(obligatorio) proporciona un número o código de identificación único para el instrumento de descripción y puede indicar la localización, fuente y tipo del identificador. - La Descripción del fichero (File Description)
(obligatorio) contiene buena parte de la descripción bibliográfica sobre el instrumento de descripción, así como la edición, empresa editora, serie y notas relacionadas codificadas separadamente. Posteriormente se detallará su contenido. - La Descripción del perfil (Profile Description)
registra una descripción detallada de los aspectos no bibliográficos de un texto, en concreto la lengua del instrumento de descripción ( , que puede incluir uno más elementos ) e información sobre quién creó la versión codificada del documento y cuándo se hizo ( ). En la versión 2002 se introdujo el subelemento Reglas de Descripción (Description Rules) (ISAD(G) 3.7.2 Reglas y normas). - La Descripción de la Revisión (Revision Description)
resume las revisiones hechas al documento EAD, control de cambios muy importante en grandes proyectos. Cada subelemento tiene dos sublementos: e - (uno o más).
A su vez,
- Mención de título (Title Statement)
(obligatorio), que agrupa información sobre el título de la obra y los responsables de su contenido intelectual, incluyendo en subelementos el nombre del autor, , título, (obligatorio), subtítulo, , y patrocinador, . - Mención de edición (Edition Statement)
, que contiene información relativa a la edición del instrumento de descripción electrónico, que puede incluirse en un elemento . - Mención de publicación (Publication Statement)
, con la información relativa a la publicación y distribución del instrumento electrónico, con elementos como , , y . - Mención de serie (Series Statement)
, con información sobre la serie, en su caso, a la que pertenece la publicación, con elementos básicos como y . - Mención de nota (Note Statement)
, agrupa todas las notas (cada una en un subelemento ) que den información sobre un texto adicional al indicado en otras partes del instrumento de descripción.
Ciertos atributos de
- dateencoding (valor fijo iso8601): para las fechas, allá donde se use un elemento
(o , elemento hijo de , para la fecha de la unidad descrita), que se codifican de acuerdo con la norma ISO 8601, dando el valor correspondiente al atributo normal (de o ). El formato puede ser, entre otros, alguno de los siguientes: aaaa, aaaa-mm, aaaa-mm-dd, aaaa-Wss, aaaaWss-d, aaaa-ddd, hh:mm:ss, hh:mm, hh, hh:mm:ssZ, hh:mm:ss+hh:mm:ss, aaaa-mm-ddThh:mm:ss, aaaa-mm-ddThh:mm:ss/aaaa-mm-ddThh:mm:ss (los guiones o dos puntos pueden omitirse). - langencoding (valor fijo iso6392b): para las lenguas, que se codifican con la norma ISO 639-2B, dando el valor pertinente a los atributos langcode (de
y ): tres letras, como en spa (español, o es, si usáramos la ISO 639-1). - scriptencoding (valor fijo iso15924): para las escrituras, con la norma ISO 15924, dando el valor correspondiente al atributo scriptcode (de
): dos letras, como en la (latina) - countryencoding (valor fijo iso3166-1): los países, con la ISO 3166-1, dando el valor correspondiente al atributo countrycode (de
o ): dos letras, como en ES (España). [-2: subdivisiones; -3: nombres antiguos] - repositoryencoding (valor fijo iso15511): los repositorios, con la norma ISO 15511 (Information and documentation - International Standard Identifier for Libraries and Related Organisations [ISIL]), dando el valor correspondiente al atributo mainagencycode (de
) y repositorycode (de ): varios caracteres, como en AMCO (o ES-AMCO).
Para una práctica sencilla con EAD, es más fácil copiar la siguiente cabecera EAD y reemplazar el texto entre corchetes con la información pertinente sobre el instrumento de descripción que se está codificando. Esta cabecera contiene los elementos mínimos (obligatorios en la DTD) y además aquellos que permiten codificar datos contemplados en ISAD(G) 2000 y que están en la cabecera EAD y no, como la mayoría, en
Material preliminar y portadas: frontmatter y titlepage
Frente a la mayor sistematización de los datos presentes en la cabecera
La descripción archivística: archdesc
El elemento
rchdesc> identifica, a través del atributo level el nivel más alto de los materiales que se describen (ISAD(G) 3.1.4 Nivel de descripción); el nivel puede ser uno de los siguientes: fonds, subfonds, recordgrp (aproximadamente equivalente a fondo en USA), subgrp, series, subseries, class (aproximadamente equivalente a serie en UK), file, item, collection, otherlevel.
En un escenario típico, un archivero empieza a codificar un instrumento de descripción abriendo en primer lugar el elemento
El elemento opcional
Los subelementos de
El elemento
- Identificación de la Unidad (Identification of the Unit)
: número de acceso, número de clasificación, número de lote u otro identificador único y permanente (ISAD(G) 3.1.1 Código de referencia) - Título de la Unidad (Title of the Unit)
: título de los materiales de archivo a cualquier nivel que se estén describiendo, como título de colección, de serie, de subserie, de expediente (file), o de ítem (ISAD(G) 3.1.2 Título). - Fecha de la unidad (Date of the Unit)
: designa las fechas de creación de los materiales de archivo (ISAD(G) 3.1.3 Fechas). - Descripción Física (Physical Description)
: identifica, por medio o no de elementos hijos, la extensión , dimensiones , género o forma y otras características físicas de la unidad descrita (ISAD(G) 3.1.5 Volumen y soporte de la unidad de descripción: cantidad, tamaño o dimensiones). - Origen (Origination)
: denota los individuos u organizaciones responsables de la creación o recopilación (assembly) de los materiales de archivo. (ISAD(G) 3.2.1 Nombre del productor(es)). - Lengua del material (Language of the Material)
: Añadido en la versión 2002, contiene la lengua del material descrito. (ISAD(G) 3.4.3 Lengua/escritura(s) de los documentos). - Archivo (o depósito, Repository)
: designa la institución responsable de proporcionar acceso intelectual. Puede llevar el elemento hijo Subárea . - Localización Física (Physical Location)
: identifica el número de la estantería y el estante u otra localización de almacenamiento. - Contenedor (Container)
: identifica el número de cartón, caja, carpeta, u otra unidad de agrupación en la que los materiales de archivo se colocan y almacenan.
El elemento
Los subelementos de