Tema 1. - Reconocimiento de Las Características de Lenguajes de Marcas.
Tema 1. - Reconocimiento de Las Características de Lenguajes de Marcas.
Tema 1. - Reconocimiento de Las Características de Lenguajes de Marcas.
de lenguajes de marcas.
1.- Lenguajes de marcas.
Un "lenguaje de marcas" es un modo de codificar un documento donde, junto con el texto, se incorporan
etiquetas, marcas o anotaciones con información adicional relativa a la estructura del texto o su formato de
presentación. Permiten hacer explícita la estructura de un documento, su contenido semántico o cualquier
otra información lingüística o extralingüística que se quiera hacer patente.
Todo lenguaje de marcas está definido en un documento denominado DTD (Document Type Definition). En él
se establecen las marcas, los elementos utilizados por dicho lenguaje y sus correspondientes etiquetas y
atributos, su sintaxis y normas de uso.
Ejemplo:
Aunque en la práctica, en un mismo documento pueden combinarse varios tipos diferentes de lenguajes de
marca los lenguajes de marcas, éstos se pueden clasificar como sigue:
● De presentación: Define el formato del texto.
● De procedimientos: Orientado también a la presentación pero, en este caso, el programa que
representa el documento debe interpretar el código en el mismo orden en que aparece.
● Descriptivo o semántico: Describen las diferentes partes en las que se estructura el documento pero
sin especificar cómo deben representarse.
XML HTML
Fichero HTML
2.6.- Comparación de XML con SGML.
XML SGML
3.- Etiquetas.
Los lenguajes de marcas utilizan una serie de etiquetas especiales intercaladas en un documento de texto sin
formato. Dichas etiquetas serán posteriormente interpretadas por los intérpretes del lenguaje y ayudan al
procesado del documento.
Las etiquetas se escriben encerradas entre ángulos, es decir < y >. Normalmente, se utilizan dos
etiquetas: una de inicio y otra de fin para indicar que ha terminado el efecto que queríamos presentar. La
única diferencia entre ambas es que la de cierre lleva una barra inclinada "/" antes del código.
<etiqueta>texto que sufrirá las consecuencias de la etiqueta</etiqueta>
Ejemplo: <u>Esto está subrayado</u>
Esto está subrayado
Las últimas especificaciones emitidas por el W3C indican la necesidad de que vayan escritas siempre en
minúsculas para considerar que el documento está correctamente creado.
5.1.- El prólogo.
Si se incluye, el prólogo debe preceder al ejemplar del documento. Su inclusión facilita el procesado de la
información del ejemplar. El prólogo está dividido en dos partes:
La declaración XML: En el caso de incluirse ha de ser la primera línea del documento, de no ser así se
genera un error que impide que el documento sea procesado.
El hecho de que sea opcional permite el procesamiento de documentos HTML y SGML como si fueran XML,
si fuera obligatoria éstos deberían incluir una declaración de versión XML que no tienen.
El prólogo puede tener tres funciones:
○ Declaración la versión de XML usada para elaborar el documento.
Para ello se utiliza la etiqueta: <?xml versión= “1.0” ?>
En este caso indica que el documento fue creado para la versión 1.0 de XML.
○ Declaración de la codificación empleada para representar los caracteres.
Determina el conjunto de caracteres que se utiliza en el documento. Para ello se escribe:
<?xml versión= “1.0” encoding=”iso-8859-1” ?>
En este caso se usa el código iso-8859-1 (Latin-1) que permite el uso de acentos o caracteres
como la ñ.
Los códigos más importantes son:
● Para utilizar caracteres especiales, como £, ©, ®,... hay que usar las expresiones &#D; o &#H; donde
D y H se corresponden respectivamente con el número decimal o hexadecimal correspondiente al
carácter que se quiere representar en el código UNICODE. Por ejemplo, para incluir el carácter de
Euro, €, se usarían las cadenas € o €
En el siguiente enlace encontrarás una tabla con los caracteres ASCII, el nombre HTML, y el número HTML
de cada uno de ellos que te será imprescindible a la hora de realizar documentos en HTML y XML.
https://ascii.cl/es/codigos-html.htm
5.2.1.- Atributos.
Permiten añadir propiedades a los elementos de un documento. Los atributos no pueden organizarse en
ninguna jerarquía, no pueden contener ningún otro elemento o atributo y no reflejan ninguna estructura lógica.
No se debe utilizar un atributo para contener información susceptible de ser dividido.
Vemos que los elementos aparecen coloreados en ciruela, los nombres de los atributos en negro y sus
valores en azul.
Como se observa en el ejemplo, los atributos se definen y dan valor dentro de una etiqueta de inicio o de
elemento vacio, a continuación del nombre del elemento o de la definición de otro atributo siempre separado
de ellos por un espacio. Los valores del atributo van precedidos de un igual que sigue al nombre del mismo y
tienen que definirse entre comillas simples o dobles.
Los nombres de los atributos han de cumplir las mismas reglas que los de los elementos, y no pueden
contener el carácter menor que, <.
Falso: Ni está cerrada la etiqueta <asunto> ni el prólogo tiene una declaración xml completa.
Esta etiqueta se denomina "nombre cualificado". Al definir el prefijo hay que tener en cuenta que no se
pueden utilizar espacios ni caracteres espaciales y que no puede comenzar por un digito.
Antes de poder utilizar un prefijo de un espacio de nombres, para resolver la ambigüedad de dos o más
etiquetas, es necesario declarar el espacio de nombres, es decir, asociar un índice con el URI asignado al
espacio de nombres, mediante un atributo especial xmlns. Esto se hace entre el prólogo y el ejemplar de un
documento XML y su sintaxis es la siguiente:
<conexion>://<direccionservidor>/<apartado1>/<apartado2>/...
Sean los documentos XML que organizan la información sobre los profesores y los alumnos del DAW
respectivamente:
Al hacer un documento sobre los miembros del curso DAW no se distinguirían los profesores de los alumnos,
para resolverlo definiremos un
espacio de nombres para cada
contexto: