Volvamos a repasar algunas ideas que vimos sobre marcado. Dicha acción refiere a la selección de una parte del documento, que puede poseer un significado de forma o semántico, y señalarlo con una etiqueta, es decir una marca digital. Estas nos indican una intrucción que será interpretada por la computadora, además delimita, con su apertura y cierre, donde comienza y termina dicho código.
Se entiende por elementos a la información semántica que compone a una etiqueta, de apertura y de cierre (aunque existen etiquetas que pueden fundirse en una sola). Dentro de las etiquetas se encuentran los identificadores, y entre las etiqueta de apertura y cierre del elemento está el contenido. En nuestro ejemplo de documento TEI observamos que el prologo de la carta aparece marcado con el elemento <head type="dedicatoria">, y el contenido que se encuentra entre dicha etiqueta:
<head type="dedicatoria">Carta de <name>doña Isabel de Guevara</name> a la princesa gobernadora doña Juana, exponiendo los trabajos hechos en el descubrimiento y conquista del Río de la Plata por las mugeres, para ayudar á los hombres, y pidiendo un repartimiento para su marido. Asunción, <date>2 de julio de 1556</date></head>
Además, como observan en el elemento head, estos pueden contener uno o más atributos que añaden característica adicionales al elemento, complementando el marcado. El formato que deben tener los atributos es: primero su nombre, en nuestro ejemplo sería type, seguido por =, y entre comillas el valor de dicho atributo. Este debe estar formado por una cadena de caracteres sin espacio, y siempre tengan en cuenta que XML-TEI es sensible al uso de mayúsculas y minúsculas.
Recuerde mi recomendación de no utilizar signos especiales como tildes, espacios, puntos, etc., al nombrar documentos, carpetas u otros archivos, con el objetivo de evitar problemas en los procesos informáticos. En su lugar, es preferible usar guiones bajos (_) para separar palabras. Este consejo es útil especialmente al trabajar con sistemas operativos, programación o en ambientes donde los nombres de archivos y rutas pueden generar errores o dificultades en su procesamiento.
Ahora, pasemos a detallar la estructura de un documento XML-TEI. Su composición más sencilla:
Veamos algunos detalles de cada uno. La primera línea donde se indica la declaración XML no debe ir precedido por ningún otro elemento ni comentarios, así como tampoco por espacio en blanco. Tiene como función crucial indicar el tipo de documento, la versión de estándar XML y la codificación utilizada, cada uno de estos debe ser respetado y señalado correctamente.
Luego sigue la declaración de modelo XML, en esta línea indicaremos el esquema RelaxNG. Este especificará el conjunto de reglas que sigue nuestro documento para ser válido. Esto declara los elementos obligatorios, los optativos, atributos que pueden agregarse, etc. La opción que utilizaramos, RelaxNG es altamente recomendada y utilizada por la TEI. Asimismo, este esquema puede personalizarse, esta posibilidad se debe a la forma modular del marcado TEI, a la que nos hemos referido en ¿Qué es TEI?1. Es importante que recuerden que el esquema se encuentre en la misma carpeta que el archivo marcado, para que la interación sea correcta, y VS Code pueda indicarnos si el XML-TEI es válido y bien formado.
A continuación encontraremos la línea de elemento raíz y declaración del espacio de nombres. El elemento raíz es el contenedor principal de un documento TEI, siempre debe ser <TEI>, y todo el contenido del archivo debe estar dentro de este elemento; además agrupa y organiza otros subelementos, como <teiHeader>, que contiene los metadatos descriptivos (autor, título, fecha, etc.) y <text>, donde se encuentra el cuerpo del texto. Por su parte, el espacio de nombres (Namespace), representa una convención que evita conflictos entre nombres de elementos al combinarse diferentes vocabularios XML.
En el encabezado de TEI <teiHeader>, como se mencionó, se añaden los metadatos del texto y sobre el proceso de codificación. Dentro de este, el único elemento obligatorio es el <fileDesc> (recuerden que es sensible a las mayúsculas y minúsculas), allí se encontrará <titleStmt>, <publicationStmt> y <sourceDesc>, es decir, la información más importante sobre el documento XML-TEI. El primero de estos tres, refiere al título de la obra a codificar, también puede contener información sobre autor, edición, etc. En publicationStmt se presentará información sobre la publicación digital, editorial, fecha, tipo de licencia, etc. Mientras que en sourceDesc añadiremos la información sobre la fuente primaria, si es manuscrita o impresa, si es obra singular o corpus, etc. En este segmento, también podemos agregar información relativa a la codificación de TEI por medio de <encodingDesc>; al perfil del texto mediante <profileDesc>; y con <revisionDesc> podemos registrar los cambios realizados en el texto digital.
En el cuerpo del texto, delimitado con la etiqueta <text>, podremos marcar <front>, <body> y <back>. La primera es para codificar paratextos, como ser prefacios, prólogos, etc. Con body, etiqueta obligatoria, marcaremos el texto propiamente dicho; y finalmente con back se puede codificar índices, cronologías, bibliografías, etc.
Dentro del cuerpo del documento, uno de los elementos más importantes es <div>, que podrá utilizarse para marcar cualquier tipo de sección estructural del texto, por ejemplo, tomos, volúmenes, capítulos, etc. Identificar diferentes secciones del texto es una buena práctica, y podremos además sumarle un atributo del tipo <type> que nos ayudará a particularizar cada sección. El valor type se ajustará a nuestros interes. Otro atributo muy utilizado es <id> que asigna un identificador único, permitiendo aislar una parte del texto, facilitando así la recuperación de la misma en el texto general.También dentro de <body> podremos señalar <head> que nos permitirá el marcado de elementos como títulos, epígrafes, etc., al mismo podremos añadirle atributos como en los elementos anteriormente mencionados. Los párrafos serán la unidad básica de los textos en prosa y se codificarán con <p>, asimismo se podrían delimitar segmentos por medio de <s>, indicando con el atributo <type> su especifidad según nuestras necesidades.
En esta unidad trabajaremos con la Carta de Isabel de Guevara a la princesa, publicada en 1903 en la obra Viaje al Río de la Plata: (1534-1554) de Ulrich Schmídel. La misma fue obtenida de Cervantes Virtual.
La carta de Isabel fue codificada con elementos básicos mencionados en este apartado. Asimismo los invito a realizar su propia codificación con el archivo de texto plano. Les recomiendo que primero lo guarden con XML, luego que vayan añadiendo los elementos obligatorios para un XML-TEI bien formado y válido, y finalmente que observen si su archivo es correcto según las Guidelines de TEI.2
Burnard, L. & Sperberg-McQueen, C. M. (2012). TEI Lite: Encoding for Interchange: an introduction to the TEI. Final revised edition for TEI P5. TEI. https://tei-c.org/release/doc/tei-p5-exemplars/html/tei_lite.doc.html
Calarco, G. & Márquez Molins, C. (2022). "Edición filológica con Visual Studio Code." TTHub. Hub de Tecnologías del Texto. https://tthub.io/aprende/tutorial/edicion-digital-con-VS-code/
Desenclos, C. (2016). 10. Early Modern Correspondence: A New Challenge for Digital Editions. En Open Book Publishers (pp. 183-200). https://doi.org/10.11647/obp.0095.10
Puede acceder a diversos esquemas personalizados desde https://tei-c.org/guidelines/customization/. En el siguiente apartado trabajaremos sobre las posibilidades de diseñar nuestro propio RelaxNG.↩
Pueden observar los pasos seguidos en la codificación de la carta en el siguiente vídeo.↩