Apunte Assembler
Apunte Assembler
Apunte Assembler
Una computadora digital o, mejor dicho, su parte física, sólo distingue datos de tipo binario, es
decir, constituidos por dos únicos valores a los que se denomina valor 0 y valor 1 y que,
físicamente, se materializan con tensiones comprendidas entre 0 y 4.0 voltios y entre 4 y 5
voltios, respectivamente. Para representar datos que contengan una información se utilizan una
serie de unos y ceros cuyo conjunto indica dicha información.
La información que hace que el hardware de la computadora realice una determinada actividad
de llama instrucción. Por consiguiente una instrucción es un conjunto de unos y ceros. Las
instrucciones así formadas equivalen a acciones elementales de la máquina, por lo que al
conjunto de dichas instrucciones que son interpretadas directamente por la máquina se
denomina lenguaje máquina.
El lenguaje máquina fue el primero que empleo el hombre para la programación de las
primeras computadoras. Una instrucción en lenguaje máquina puede representarse de la
siguiente forma:
011011001010010011110110
Esta secuencia es fácilmente ejecutada por la computadora, pero es de difícil interpretación,
siendo aun mas difícil la interpretación de un programa (conjunto de instrucciones) escrito de
esta forma. Esta dificultad hace que los errores sean frecuentes y la corrección de los mismos
costosa, cuando no imposible, al igual que la verificación y modificación de los programas.
Si lo vemos escrito de esta forma, lo entenderemos fácilmente, ya que está en nuestro lenguaje
natural, pero la máquina elemental será incapaz de entender nada. Vemos, pues, que la forma
de indicar a la máquina lo que debe hacer es totalmente diferente de la indicar a un ser humano
lo mismo, por lo que deben emplearse sistemas de traducción de una forma a otra.
Las ventajas de esto son evidentes, ya que para el hombre resulta mas fácil manipular grupos
de caracteres y la traducción se haría de manera automática. Por ejemplo, se podría escribir:
TRASLADAR 11010110, 00011101
Esto indicaría que el contenido de la posición 11010110 había que pasarlo a la posición
00011101 si se sabe que al grupo alfabético TRASLADAR le corresponde la secuencia de bits
11110101. La máquina traduciría la anterior instrucción como:
De esta forma aparecieron los lenguajes ensambladores (Assembler, en inglés). Poco a poco,
con el avance de la programación (Software), estas primeras y sencillas ayudas se fueron
haciendo más complejas, permitiendo que, además de los mnemotécnicos correspondientes a
la operación a realizar, se pudieran emplear otros para indicar, por ejemplo, los operandos. La
anterior instrucción se podría escribir de la siguiente forma:
A los programas que permiten pasar del programa escrito de esta manera (programa fuente, en
ensamblador) al lenguaje máquina también se les denomina normalmente ensambladores.
Estos traductores, como ya se ha dicho, se fueron complicando cada vez más para que la labor
del programador fuera más fácil, incluyendo los denominados directivos del ensamblador, que
son órdenes o informaciones que el programador da al traductor, no instrucciones de lenguaje
máquina.
Aun con todas estas sofisticaciones y ayudas, el programador de lenguaje ensamblador debe
conocer perfectamente el sistema físico (Hardware) de la máquina con que trabaja, pues
aunque emplee mnemotécnicos, etiquetas, etc., éstas sirven para indicar una posición de
memoria determinada, un registro o cualquier otra parte de la máquina.
Por eso se dice que el lenguaje ensamblador es un lenguaje de bajo nivel, es decir, ligado con
el <<hard>> concreto de una determinada máquina. Aquí radica la diferencia importante con los
lenguajes más complejos, llamados de alto nivel, como el Basic, Pascal, Cobol, etc., ya que en
éstos el programador no tiene porque reconocer el <<hard>> de la máquina. Trabaja con
variables, constantes e instrucciones simbólicas, y es el traductor quien las transforma en las
direcciones apropiadas.
Después, Intel desarrollo una variación del 8086 para ofrecer un diseño sencillo y
compatibilidad con los dispositivos de entrada/salida de ese momento. Este nuevo procesador,
el 8088, fue seleccionado por IBM para su computadora personal en 1981. Una versión
mejorada del 8088 es el 80188, y versiones mejoradas del 8086, son los 80186, 80286, 80386,
80486 y el Pentium, cada uno de ellos permite operaciones adicionales y más procesamiento.
Los lenguajes de alto nivel fueron diseñados para eliminar las particularidades de una
computadora especifica, mientras que un lenguaje ensamblador esta diseñado para una
computadora especifica, o, de manera más correcta, para una familia especifica de
microprocesadores.
La CPU constituye el cerebro de una computadora digital, pues realiza todas las operaciones
aritméticas y lógicas sobre los datos y además controla todos los procesos que se desarrollan
en la computadora. Por ejemplo, para que se ejecute un a instrucción, ésta debe estar en el
interior de la CPU, concretamente en la UC y si hay que realizar cálculos, interviene la UAL.
Veamos como funciona cada una de ellas.
• Unidad de Control.
Para realizar su tarea la UC necesita conocer, por un lado, la instrucción y, por otro, una serie
de informaciones adicionales que deberá tener en cuenta para coordinar, de forma correcta, la
ejecución de la instrucción. El resultado de la interpretación de dichas informaciones son una
serie de órdenes a los diferentes elementos de la computadora.
La UC no emite todas las órdenes a la vez, sino siguiendo una determinada secuencia. Para
ello utiliza un elemento que le va indicando el instante en que debe ejecutar una determinada
fase de la instrucción. A este elemento se le denomina Reloj, y se dice que sincroniza las
acciones de la UC; cuanto más rápido marque el tiempo, más rápida será la ejecución de la
instrucción. Sin embargo, hay un limite, ya que, si marca excesivamente rápido, es posible que
no puedan cumplir adecuadamente las órdenes de los diferentes elementos, por lo que se
producirán errores.
En la figura 2.2 se esquematiza el conjunto de señales que utiliza la UC y las que genera.
Como informaciones adicionales a las instrucciones podemos ver los impulsos de reloj y los
indicadores de estado. Los indicadores de estado son una serie de bits que se modifican según
resultados de las operaciones anteriores guardando una memoria histórica de los
acontecimientos precedentes para que, en función de dichos acontecimientos, pueda la UC
tomar decisiones.
Figura 2.2. Señales que intervienen en la UC.
La unidad de control esta formada, básicamente por un elemento que interpreta las
instrucciones y varios elementos de memoria denominados registros. Uno de estos registros
almacena la instrucción mientras el intérprete está traduciendo su significado, por lo que se
denomina Registro de Instrucción (RI). El resto de las instrucciones permanecen en la
memoria, esperando que les toque su turno de ejecución.
La UC por otra parte deberá conocer cuál es la dirección de la próxima instrucción, para poder
ir a buscarla una vez que finaliza la ejecución de la instrucción en curso; dirección que guarda
el registro llamado Contador de Programa (CP).
Para que el operador realice la operación, los operandos se llevan a la UAL y se guardan en
unos registros denominados registros de trabajo. El resultado de la operación se guarda
también en un registro antes de ser llevado a la memoria o a la Unidad de Entradas y Salidas.
Frecuentemente se utiliza un mismo registro para guardar uno de los operandos y, también, el
resultado, denominado registro Acumulador.
En la figura 2.4 se muestran los elementos de la UAL y las señales que intervienen.
(a)
(a) UAL con tres registros: 2 para los operandos y 1 para el resultado.
(b)
La memoria principal esta formada por un conjunto de unidades llamadas palabras. Dentro de
cada una de estas palabras se guarda la información que constituye una instrucción o parte de
ella (puede darse el caso de que una sola instrucción necesite varia palabras), o un dato o
parte de un dato (también un dato puede ocupar varias palabras).
Una palabra esta formada a su vez de unidades mas elementales llamadas bits, del mismo
modo que en el lenguaje natural una palabra esta formada por letras. Cada bit solo puede
guardar dos valores, el valor 0 o el valor 1; por eso se dice que son elementos binarios.
El numero de bits que forman una palabra se llama longitud de palabra. Por regla general, las
computadoras potentes tienen memorias con longitud de palabra grande, mientras que las
computadoras pequeñas tienen memorias con longitud de palabra menor.
En la figura 2.5 se muestra como se puede estar organizada una Memoria Principal.
Figura 2.5. Organización de una unidad de memoria.
Las palabras forman una matriz de 10 filas y 10 columnas. La primera palabra corresponderá
con la dirección 00, la segunda con la 01, y la ultima, con la 99. La capacidad de la memoria
será de 10 * 10 = 100 palabras. También se muestra la longitud de la palabra 38, que es de 8
bits, al igual que las demás, y la información que contiene, que es el valor binario 10011010.
Las palabras se distinguen entre si por la posición que ocupan en la MP, y se puede guardar
una información y luego recuperarla indicando el numero de dicha posición. A los números que
señalan las posiciones de memoria se les da el nombre de direcciones de memoria.
En la tabla 2.1 (a) se muestra un acceso de escritura. Obsérvese que la UC debe indicar,
además de la posición donde se debe guardar el dato, el valor del dato y las indicaciones de
control que le digan a la memoria que se desea guardar el dato y el momento en que debe
iniciarse la operación de escritura.
Esta ultima orden la dará la UC cuando este segura de que los datos anteriores han llegado
correctamente a la MP. Después de esta ultima orden, la UC espera un tiempo para asegurar
que se ha escrito la información en la MP.
En la tabla 2.1 (b) se muestra como se realiza un acceso de lectura. En este caso, la UC no
indica el dato, puesto es precisamente lo que espera recibir. Los demás pasos son idénticos a
los del acceso de escritura.
Desde que se inicia la secuencia hasta que finaliza transcurre un tiempo, denominado tiempo
de acceso, cuya duración depende de la tecnología con que esta fabricada la MP.
Ya se ha visto en las secciones precedentes como funcionan la CPU y la MP, pero puede
decirse que es necesaria la comunicación entre el interior de la computadora y su entorno o
periferia. Esta comunicación se consigue a través de dispositivos de muy diversos tipos, como
son: teclados, impresoras, pantallas, discos magnéticos, etc. Es estos dispositivos se les
conoce con el nombre genérico de periféricos.
En la figura 2.6 se muestran algunos periféricos conectados a la Unidad de E/S, la cual hace de
intermediaria entre los periféricos y la CPU. Las flechas indican el sentido en que fluye la
información.
Figura 2.6. La unidad de E/S hace de intermediaria entre la UCP y los periféricos.
Cada periférico o parte de un periférico tendrá asignado un numero o dirección que servirá para
identificarlo. Cuando la UC quiera seleccionarlo enviara dicho numero a la Unidad de E/S.
Lo mas sencillo es que la CPU, cuando desee hacer una transferencia de información con un
periférico, pregunte a la Unidad de E/S si dicho periférico se encuentra disponible. Si no lo esta,
debe repetir la pregunta una y otra vez hasta obtener una respuesta afirmativa, en cuyo caso
se inicia la transferencia de información.
Si se desea obtener mayor rendimiento del ordenador, se puede emplear otro método que se
denomina sincronización mediante interrupción. La característica de este método es que la
CPU, en lugar de dedicarse a preguntar a la Unidad de E/S por el periférico que desea utilizar,
lo que hace es indicar a la Unidad de E/S que desea hacer una transferencia con el periférico, y
seguidamente, si no esta el periférico preparado, empieza otra tarea, olvidándose
momentáneamente del periférico.
Cuando este preparado, la Unidad de E/S indicara a la CPU que puede realizarse la
transferencia; entonces, la CPU interrumpirá la tarea que esta realizando y atenderá al
periférico. De esta forma, la CPU no pierde tiempo esperando al periférico.
En los apartados anteriores hemos visto las funciones que realiza cada unidad de la
computadora, y que se deben de comunicar entre ellas para pasarse información. Estas
informaciones se transmiten en forma de señales eléctricas y, por tanto, circulan a través de
conductores eléctricos.
Cuando la CPU quiere leer o escribir en una determinada posición de memoria, enviara la
dirección, en paralelo, a la memoria por un conjunto de conductores eléctricos al que se
denomina bus de direcciones, ya que se utiliza exclusivamente para enviar direcciones. Así
mismo, los datos leídos o los que se quieren escribir se trasladan mediante un conjunto de
conductores eléctricos denominado bus de datos. Las ordenes de la CPU a la MP y las
respuestas de la MP a la CPU son enviadas por un tercer conjunto de conductores llamado bus
de control.
En la figura 2.7 se muestran las conexiones de la CPU con la MP. Se han dibujado en la figura
2.7 (a) todos los conductores eléctricos suponiendo que se emplean 8 hilos para el bus de
datos, 16 para el de direcciones y 3 para el de control. En la practica no se dibujan todos los
hilos para simplificar las figuras y se hace como en las figuras 2.7 (b) y 2.7 (c).
(b) Indicando sobre una línea el número de conductores.
Existen varias formas de interconectar las unidades funcionales de la computadora entre si.
Una de ellas emplea un único conjunto de buses, como puede apreciarse en la figura 2.8 (a), al
que se conectan todas las unidades. Esto obliga a que, en un determinado instante, solo dos
unidades puedan estar haciendo uso del mismo; si hay que enviar algo a la tercera unidad, se
deberá esperar a que quede libre.
Los registros del procesador se emplean para controlar instrucciones en ejecución, manejar
direccionamiento de memoria y proporcionar capacidad aritmética. Los registros son
direccionables por medio de un nombre. Los bits por convención, se numeran de derecha a
izquierda, como en:
... 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0
Registros de segmento
Registro CS. El DOS almacena la dirección inicial del segmento de código de un programa en
el registro CS. Esta dirección de segmento, mas un valor de desplazamiento en el registro
apuntador de instrucción (IP), indica la dirección de una instrucción que es buscada para su
ejecución.
Registros ES. Alguna operaciones con cadenas de caracteres (datos de caracteres) utilizan el
registro extra de segmento para manejar el direccionamiento de memoria. En este contexto, el
registro ES esta asociado con el registro DI (índice). Un programa que requiere el uso del
registro ES puede inicializarlo con una dirección de segmento apropiada.
Los registros de propósito general AX, BX, CX y DX son los caballos de batalla del sistema.
Son únicos en el sentido de que se puede direccionarlos como una palabra o como una parte
de un byte. El ultimo byte de la izquierda es la parte "alta", y el ultimo byte de la derecha es la
parte "baja". Por ejemplo, el registro CX consta de una parte CH (alta) y una parte Cl (baja), y
usted puede referirse a cualquier parte por su nombre.
Registro AX. El registro AX, el acumulador principal, es utilizado para operaciones que
implican entrada/salida y la mayor parte de la aritmética. Por ejemplo, las instrucciones para
multiplicar , dividir y traducir suponen el uso del AX. También, algunas operaciones generan
código mas eficiente si se refieren al AX en lugar de a los otros registros.
Registro BX. El BX es conocido como el registro base ya que es el único registro de propósito
general que puede ser índice para direccionamiento indexado. También es común emplear el
BX para cálculos.
Registros Apuntadores.
Registro SP. El apuntador de la pila de 16 bits esta asociado con el registro SS y proporciona
un valor de desplazamiento que se refiere a la palabra actual que esta siendo procesada en la
pila. Los procesadores 80386 y posteriores tienen un apuntador de pila de 32 bits, el registro
ESP. El sistema maneja de forma automática estos registros.
Registros Indice.
Los registros SI y DI están disponibles para direccionamiento indexado y para sumas y restas.
Registro SI. El registro índice fuente de 16 bits es requerido por algunas operaciones con
cadenas (de caracteres). En este contexto, el SI esta asociado con el registro DS. Los
procesadores 80386 y posteriores permiten el uso de un registro ampliado de 32 bits, el ESI.
Registro DI. El registro índice destino también es requerido por algunas operaciones con
cadenas de caracteres. En este contexto, el DI esta asociado con el registro ES. Los
procesadores 80386 y posteriores permiten el uso de un registro ampliado de 32 bits, el EDI.
Registro de Banderas.
De los 16 bits del registro de banderas, nueve son comunes a toda la familia de procesadores
8086, y sirven para indicar el estado actual de la maquina y el resultado del procesamiento.
Muchas instrucciones que piden comparaciones y aritmética cambian el estado de las
banderas, algunas cuyas instrucciones pueden realizar pruebas para determinar la acción
subsecuente. En resumen, los bits de las banderas comunes son como sigue:
IF (interrupción). Indica que una interrupción externa, como la entrada desde el teclado, sea
procesada o ignorada.
TF (trampa). Permite la operación del procesador en modo de un paso. Los programas
depuradores, como el DEBUG, activan esta bandera de manera que usted pueda avanzar en la
ejecución de una sola instrucción a un tiempo, para examinar el efecto de esa instrucción sobre
los registros de memoria.
AF (acarreo auxiliar). Contiene un acarreo externo del bit 3 en un dato de 8 bits para
aritmética especializada.
PF (paridad). Indica paridad par o impar de una operación en datos de 8 bits de bajo orden
(mas a la derecha).
CF (acarreo). Contiene el acarreo de orden mas alto (mas a la izquierda) después de una
operación aritmética; también lleva el contenido del ultimo bit en una operación de corrimiento o
de rotación.
3.1. SEGMENTO.
Un segmento es un área especial en un programa que inicia en un limite de un párrafo, esto es,
en una localidad de regularmente divisible entre 16, o 10 hexadecimal. Aunque un segmento
puede estar ubicado casi en cualquier lugar de la memoria y, en modo real, puede ser hasta de
64K, solo necesita tanto espacio como el programa requiera para su ejecución.
Un segmento en modo real puede ser de hasta 64K. Se puede tener cualquier numero de
segmentos; para direccionar un segmento en particular basta cambiar la dirección en el registro
del segmento apropiado. Los tres segmentos principales son los segmentos de código, de
datos y de la pila.
• Segmento de código.
El segmento de código (CS) contiene las instrucciones de maquina que son ejecutadas por lo
común la primera instrucción ejecutable esta en el inicio del segmento, y el sistema operativo
enlaza a esa localidad para iniciar la ejecución del programa. Como su nombre indica, el
registro del CS direcciona el segmento de código. Si su área de código requiere mas de 64K,
su programa puede necesitar definir mas de un segmento de código.
• Segmento de datos.
El segmento de datos (DS) contiene datos, constantes y áreas de trabajo definidos por el
programa. El registro DS direcciona el segmento de datos. Si su área de datos requiere mas de
64K, su programa puede necesitar definir mas de un segmento de datos.
• Segmento de pila.
En términos sencillos, la pila contiene los datos y direcciones que usted necesita guardar
temporalmente o para uso de sus "llamadas" subrutinas. El registro de segmento de la pila (SS)
direcciona el segmento de la pila.
Los registros de segmentos contienen la dirección inicial de cada segmento. La figura 3.1
presenta un esquema de los registros CS, DS y SS; los registros y segmentos no
necesariamente están en el orden mostrado. Otros registros de segmentos son el ES
(segmento extra) y, en los procesadores 80386 y posteriores, los registros FS y GS, que
contienen usos especializados.
Coma ya dijimos, un segmento inicia en un limite de párrafo, que es una dirección por lo común
divisible entre el 16 decimal o 10 hexadecimal. Suponga que un segmento de datos inicia en la
localidad de memoria 045F0H.
Ya que en este y todos los demás casos el ultimo dígito hexadecimal de la derecha es cero, los
diseñadores de computadora decidieron que seria innecesario almacenar el dígito cero en el
registro del segmento. Así, 045F0H se almacena como 045F, con el cero de la extrema
derecha sobrentendido. En donde sea apropiado, el texto indica al cero de la derecha con
corchetes, como 045F[0].
Figura 3.1. Segmentos y registros.
3.2. DESPLAZAMIENTO.
Un desplazamiento de dos bytes (16 bits) puede estar en el rango de 0000H hasta FFFFH, o
bien, desde cero hasta 65, 535. Así el primer byte del segmento de código tiene un
desplazamiento 00, el segundo byte tiene un desplazamiento 01, etc. hasta el desplazamiento
65, 535. Para referir cualquier dirección de memoria en un segmento, el procesador combina la
dirección del segmento en un registro de segmento con un valor de desplazamiento.
Por lo tanto, la localidad real de memoria del byte referido por la instrucción es 04622H;
Dirección del segmento DS: 045F0H
Desplazamiento: +0032H
Dirección real: 04622H
Note que un programa tiene uno o mas segmentos, los cuales pueden iniciar casi en cualquier
lugar de memoria, variar en tamaño y estar en cualquier orden.
Hay un registro en la computadora llamado contador de programa o PC, que lleva un registro
de las instrucciones del programa almacenado en la memoria. Pc contiene la dirección de la
siguiente instrucción que se va a ejecutar y se incrementa cada vez que se recupera una
instrucción de la memoria. La decodificación realizada en el paso 2 determina la operación que
se va a ejecutar, el modo de direccionamiento de la instrucción y la posición de los operandos.
MODO IMPLICITO.
Las instrucciones de dirección cero en una computadora organizada con pila son instrucciones
de modo implícito porque esta implícito que los operandos están en la parte superior de la pila.
MODO INMEDIATO.
Se menciono antes que el campo de dirección de una instrucción puede especificar una
palabra de memoria o un registro de procesador. Cuando el campo de dirección especifica un
registro de procesador se dice que la instrucción esta en modo de registro.
MODO DE REGISTRO.
En este modo, los operandos están en registros que residen dentro de la CPU. Se selecciona el
registro particular de un campo de registro en la instrucción. Un campo k bits puede especificar
cualquiera de 2 a la k registros.
La distancia entre la dirección inicial y la dirección del operando es el valor del índice
almacenado en el registro de índice. Cualquier operando en el arreglo puede accesarse con la
misma instrucción siempre y cuando el registro índice contenga el valor de índice correcto. El
registro índice puede incrementarse para facilitar el acceso a operandos consecutivos. Nótese
que si una instrucción de tipo índice no incluye un campo de dirección en su formato, la
instrucción se convierte al modo de operación de indirecto por registro.
Algunas computadoras dedican un registro de CPU para que funcione exclusivamente como un
registro índice. De manera implícita este registro participa cuando se utiliza una instrucción de
modo índice. En las computadoras con muchos registros de procesador, cualquiera de los
registros de la CPU pueden contener el numero de índice. En tal caso, el registro debe estar
especificado en forma explícita en una campo de registro dentro del formato de instrucción.
Una interrupción es una operación que suspende la ejecución de un programa de modo que el
sistema pueda realizar una acción especial. La rutina de interrupción ejecuta y por lo regular
regresa el control al procedimiento que fue interrumpido, el cual entonces reasume su
ejecución.
4.2. TABLA DE SERVICIO DE INTERRUPCION.
El operando de una instrucción de interrupción como INT 05H identifica el tipo de solicitud.
Como existen 256 entradas, cada una de cuatro bytes, la tabla ocupa los primeros 1, 024 bytes
de memoria, desde 000H hasta 3FFH. Cada dirección en la tabla relaciona a una ruina de BIOS
o del DOS para un tipo especifico de interrupción. Por lo tanto los bytes 0-3 contienen la
dirección para la interrupción 0, los bytes 4-7 para la interrupción 1, y así sucesivamente:
Una interrupción guarda en la pila el contenido del registro de banderas, el CS, y el IP. por
ejemplo, la dirección en la tabla de INT 05H (que imprime la que se encuentra en la pantalla
cuando el usuario presiona Ctrl + PrtSC) es 0014H (05H x 4 = 14H). La operación extrae la
dirección de cuatro bytes de la posición 0014H y almacena dos bytes en el IP y dos en el CS.
La dirección CS:IP entonces apunta al inicio de la rutina en el área del BIOS, que ahora se
ejecuta. La interrupción regresa vía una instrucción IRET (regreso de interrupción), que saca
de la pila el IP, CS y las banderas y regresa el control a la instrucción que sigue al INT.
Una interrupción guarda en la pila el contenido del registro de banderas, el CS, y el IP. por
ejemplo, la dirección en la tabla de INT 05H (que imprime la que se encuentra en la pantalla
cuando el usuario presiona Ctrl + PrtSC) es 0014H (05H x 4 = 14H). La operación extrae la
dirección de cuatro bytes de la posición 0014H y almacena dos bytes en el IP y dos en el CS.
La dirección CS:IP entonces apunta al inicio de la rutina en el área del BIOS, que ahora se
ejecuta. La interrupción regresa vía una instrucción IRET (regreso de interrupción), que saca
de la pila el IP, CS y las banderas y regresa el control a la instrucción que sigue al INT.
Las interrupciones se dividen en dos tipos las cuales son: Externas y Internas. Una
interrupción externa es provocada por un dispositivo externo al procesador. Las dos líneas que
pueden señalar interrupciones externas son la línea de interrupción no enmascarable (NMI) y la
línea de petición de interrupción (INTR).
La línea NMI reporta la memoria y errores de paridad de E/S. El procesador siempre actúa
sobre esta interrupción, aun si emite un CLI para limpiar la bandera de interrupción en un
intento por deshabilitar las interrupciones externas. La línea INTR reporta las peticiones desde
los dispositivos externos, en realidad, las interrupciones 05H a la 0FH, para cronometro, el
teclado, los puertos seriales, el disco duro, las unidades de disco flexibles y los puertos
paralelos.
Una interrupción interna ocurre como resultado de la ejecución de una instrucción INT o una
operación de división que cause desbordamiento, ejecución en modo de un paso o una petición
para una interrupción externa, tal como E/S de disco. Los programas por lo común utilizan
interrupciones internas, que no son enmascarables, para accesar los procedimientos del BIOS
y del DOS.
INT 00H: División entre cero. Llamada por un intento de dividir entre cero. Muestra un mensaje
y por lo regular se cae el sistema.
INT 01H: Un solo paso. Usado por DEBUG y otros depuradores para permitir avanzar por paso
a través de la ejecución de un programa.
INT 02H: Interrupción no enmascarare. Usada para condiciones graves de hardware, tal como
errores de paridad, que siempre están habilitados. Por lo tanto un programa que emite una
instrucción CLI (limpiar interrupciones) no afecta estas condiciones.
INT 03H: Punto de ruptura. Usado por depuración de programas para detener la ejecución.
INT 04H: Desbordamiento. Puede ser causado por una operación aritmética, aunque por lo
regular no realiza acción alguna.
INT 05H: Imprime pantalla. Hace que el contenido de la pantalla se imprima. Emita la INT 05H
para activar la interrupción internamente, y presione las teclas Cltr + PrtSC para activarla
externamente. La operación permite interrupciones y guarda la posición del cursor.
INT 08H: Sistema del cronometro. Una interrupción de hardware que actualiza la hora del
sistema y (si es necesario) la fecha. Un chip temporizador programable genera una interrupción
cada 54.9254 milisegundos, casi 18.2 veces por segundo.
INT 09H: Interrupción del teclado. Provocada por presionar o soltar una tecla en el teclado.
INT OBH, INT OCH: Control de dispositivo serial. Controla los puertos COM1 y COM2,
respectivamente.
INT 0DH, INT OFH: Control de dispositivo paralelo. Controla los puertos LPT1 y LPT2,
respectivamente.
INT 0EH: Control de disco flexible. Señala actividad de disco flexible, como la terminación de
una operación de E/S.
INT 12H: Determinación del tamaño de la memoria. En el AX, regresa el tamaño de la memoria
de la tarjeta del sistema, en términos de kilobytes contiguos.
INT 13H: Entrada/salida de disco. Acepta varias funciones en el AH para el estado del disco,
sectores leídos, sectores escritos, verificación, formato y obtener diagnostico.
Los dos módulos del DOS, IO.SYS y MSDOS.SYS, facilitan el uso del BIOS. Ya que
proporcionan muchas de las pruebas adicionales necesarias, las operaciones del DOS por lo
general son mas fáciles de usar que sus contrapartes del BIOS y por lo común son
independientes de la maquina.
IO.SYS es una interfaz de nivel bajo con el BIOS que facilita la lectura de datos desde la
memoria hacia dispositivos externos.
Las interrupciones desde la 20H hasta la 3FH están reservadas para operaciones del DOS. A
continuación se mencionan algunas de ellas.
INT 20H: Termina programa. Finaliza la ejecución de un programa .COM, restaura las
direcciones para Cltr + Break y errores críticos, limpia los bufer de registros y regresa el control
al DOS. Esta función por lo regular seria colocada en el procedimiento principal y al salir de el,
CS contendría la dirección del PSP. La terminación preferida es por medio de la función 4CH
de la INT 21H.
INT 21H: Petición de función al DOS. La principal operación del DOS necesita una función en
el AH.
INT 22H: Dirección de terminación. Copia la dirección de esta interrupción en el PSP del
programa (en el desplazamiento 0AH) cuando el DOS carga un programa para ejecución. A la
terminación del programa, el DOS transfiere el control a la dirección de la interrupción. Sus
programas no deben de emitir esta interrupción.
INT 23H: Dirección de Cltr + Break. Diseñada para transferir el control a una rutina del DOS
(por medio del PSP desplazamiento 0EH) cuando usted presiona Ctlt + Break o Ctlr + c. La
rutina finaliza la ejecución de un programa o de un archivo de procesamiento por lotes. Sus
programas no deben de emitir esta interrupción.
INT 24H: Manejador de error critico. Usada por el dos para transferir el control (por medio del
PSP desplazamiento 12H) cuando reconoce un error critico (a veces una operación de disco o
de la impresora).Sus programas no deben de emitir esta interrupción.
INT 25H: Lectura absoluta de disco. Lee el contenido de uno o mas sectores de disco.
INT 26H: Escritura absoluta de disco. Escribe información desde la memoria a uno o mas
sectores de disco.
INT 27H: Termina pero permanece residente (reside en memoria). Hace que un programa
.COM al salir permanezca residente en memoria.
INT 33H: Manejador del ratón. Proporciona servicios para el manejo del ratón.
5.1.ELEMENTOS BASICOS.
• PALABRAS RESERVADAS.
Ciertas palabras en lenguaje ensamblador están reservadas para sus propósitos propios, y son
usadas solo bajo condiciones especiales. Por categorías, las palabras reservadas incluyen:
• Instrucciones, como MOV y ADD, que son operaciones que la computadora puede
ejecutar.
• Directivas como END o SEGMENT, que se emplean para proporcionar comandos al
ensamblador.
El uso de una palabra reservada para un propósito equivocado provoca que el ensamblador
genere un mensaje de error.
Ver palabras reservadas.
• IDENTIFICADORES.
El primer carácter de un identificador debe ser una letra o un carácter especial, excepto el
punto. Ya que el ensamblador utiliza algunos símbolos especiales en palabras que inician con
el símbolo @, debe evitar usarlo en sus definiciones.
El ensamblador trata las letras mayúsculas y minúsculas como iguales. La longitud máxima de
un identificador es de 31 caracteres (247 desde el MASM 6.0). Ejemplos de nombres validos
son COUNT, PAGE25 y $E10. Se recomienda que los nombres sean descriptivos y con
significado. Los nombres de registros, como AX, DI y AL, están reservados para hacer
referencia a esos mismos registros. En consecuencia, en una instrucción tal como:
ADD AX, BX
MOV REGSAVE, AX
el ensamblador puede reconocer el nombre REGSAVE solo si se define en algún lugar del
programa.
• INSTRUCCIONES.
1. Instrucciones, tal como MOV y ADD, que el ensamblador traduce a código objeto.
2. Directivas, que indican al ensamblador que realiza una acción especifica, como definir un
elemento de dato.
A continuación esta el formato general de un enunciado, en donde los corchetes indican una
entrada opcional:
Un identificador (si existe), una operación y un operando (si existe) están separados por al
menos un espacio en blanco o un carácter tabulador. Existe un máximo de 132 caracteres en
una línea (512 desde el MASM 6.0), aunque la mayoría de los programadores prefiere
permanecer en los 80 caracteres ya que es el numero máximo que cabe en la pantalla. A
continuación se presentan dos ejemplos de enunciados:
• IDENTIFICADOR
• OPERACION
La operación, que debe ser codificada, es con mayor frecuencia usada para la definición de
áreas de datos y codificación de instrucciones. Para un elemento de datos, una operación
como DB o DW define un campo, área de trabajo o constante.
• OPERANDO
El operando (si existe) proporciona información para la operación que actúa sobre el. Para un
elemento de datos, el operando identifica su valor inicial. Por ejemplo, en la definición siguiente
de un elemento de datos llamado COUNTER, la operación DB significa "definir byte", y el
operando inicializa su contenido con un valor cero:
Para una instrucción, un operando indica en donde realizar la acción. Un operando de una
instrucción puede tener una, dos o tal vez ninguna entrada. Aquí están tres ejemplos:
PAGE. Al inicio de un programa, la directiva PAGE designa el numero máximo de líneas para
listar en una pagina y el numero máximo de caracteres en una línea. Su formato general es:
El ejemplo siguiente proporciona 60 líneas por pagina y 132 caracteres por línea:
El numero de líneas por pagina puede variar desde 10 hasta 255, mientras que el numero de
caracteres por línea desde 60 hasta 132. La omisión de PAGE causa que el ensamblador tome
PAGE 50, 80.
TITLE. Se puede emplear la directiva TITLE para hacer que un titulo para un programa se
imprima en la línea 2 de cada pagina en el listado del programa. Puede codificar TITLE de una
vez, al inicio del programa. Su formato general es:
TITLE Texto.
Para el operando texto, una técnica recomendada es utilizar el nombre del programa como se
registra en el disco. Por ejemplo:
El enunciado SEGMENT define el inicio de un segmento. El nombre del segmento debe estar
presente, ser único y cumplir las convenciones para nombres del lenguaje. EL enunciado
ENDS indica el final del segmento y contiene el mismo nombre del enunciado SEGMENT. El
tamaño máximo de un segmento es de 64K. El operando de un enunciado SEGMENT puede
tener tres tipos de opciones: alineación, combinar y clase, codificadas en este formato:
TIPO ALINEACION. La entrada alineación indica el limite en el que inicia el segmento. Para el
requerimiento típico, PARA, alinea el segmento con el limite de un párrafo, de manera que la
dirección inicial es divisible entre 16, o 10H. En ausencia de un operando hace que el
ensamblador por omisión tome PARA.
TIPO COMBINAR. La entrada combinar indica si se combina el segmento con otros segmentos
cuando son enlazados después de ensamblar. Los tipos de combinar son STACK, COMMON,
PUBLIC y la expresión AT. Por ejemplo, el segmento de la pila por lo común es definido como:
TIPO CLASE. La entrada clase, encerrada entre apóstrofos, es utilizada para agrupar
segmentos cuando se enlazan. Se utiliza la clase 'code' para el segmento de códigos, 'data' por
segmento de datos y 'stack' para el segmento de la pila. El ejemplo siguiente define un
segmento de pila con tipos alineación, combinar y clase:
DIRECTIVA ASSUME.
OPERACION OPERANDO
ASSUME SS:nompila, DS:nomsegdatos, CS: nomsegcodigo,. . .
Los operandos pueden aparecer en cualquier orden. Al igual que otras directivas, ASSUME es
solo un mensaje que ayuda al ensamblador a convertir código simbólico a código maquina; aun
puede tener que codificar instrucciones que físicamente cargan direcciones en registros de
segmentos en el momento de la ejecución.
1 PAGE 60,132
2 TITLE P04ASM1 ESTRUCTURA DE UN PROGRAMA .EXE
3;-------------------------------------------------------------------------------
4 STACKSG SEGMENT PARA STACK 'Stack'
5 ...
6 STACKSG ENDS
7;-------------------------------------------------------------------------------
8 DATASG SEGMENT PARA 'Data'
9 ...
10 DATASG ENDS
11;-------------------------------------------------------------------------------
12 CODESG SEGMENT PARA 'Code'
13 BEGIN PROC FAR
14 ASSUME SS:STACKSG, DS:DATASG,CS:CODESG
15 MOV AX, DATASG ;Obtiene la dirección del segmento de datos
16 MOV DS, AX ;Almacena dirección en DS
17 ...
18 MOV AX, 4C00H ;Peticion
19 INT 21H ;Salida al DOS
20 BEGIN ENDP
21 CODESG ENDS
22 END BEGIN
Puede utilizar cualquiera de estos modelos para un programa autónomo (esto es, un programa
que no este enlazado con algún otro). El modelo TINY esta destinado para uso exclusivo de
programas .COM, los cuales tienen sus datos, código y pila en un segmento. El modelo SMALL
exige que el código quepa en un segmento de 64K y los datos en otro segmento de 64K. La
directiva .MODELL genera automáticamente el enunciado ASSUME necesario.
Los formatos generales (incluyendo el punto inicial) para las directivas que define los
segmentos de la pila, de datos y de código son:
.STACK [tamaño]
.DATA
.CODE [nombre]
Cada una de estas directivas hace que el ensamblador genere el enunciado SEGMENT
necesario y su correspondiente ENDS. Los nombres por omisión de los segmentos (que usted
no tiene que definir) son STACK, DATA y TEXT (para el segmento de código).
La figura 4.3 proporciona un ejemplo haciendo uso de las directivas simplificadas de segmento.
page 60,132
TITLE P04ASM2 (EXE) Operaciones de mover y sumar
;-------------------------------------------------------------------------
.MODEL SMALL
.STACK 64 ;Se define la pila
.DATA ;Se definen los datos
FLDA DW 250
FLDB DW 125
FLDC DW ?
;-------------------------------------------------------------------------
entendiendo por fuente el contenido que se va a transferir a una determinada zona o registro de
memoria denominada destino.
Esta instrucción, por tanto, nos va a permitir transferir informacion entre registros y memoria,
memoria y registros y entre los propios registros utilizando alguno de los diferentes modos de
direccionamiento. Con la instrucción MOV diremos que se pueden realizar todo tipo de
movimientos teniendo en cuenta las siguientes restricciones:
1.- No se puede realizar una transferencia de datos entre dos posiciones de memoria
directamente, por esta razón, siempre que queramos efectuarlas tendremos que utilizar un
registro intermedio que haga de puente.
Por ejemplo, para hacer la operacion DATO1 <-- DATO2, la instrucción MOV DATO2,DATO1
sería incorrecta. Lo que sí sería correcto sería utilizar el registro DX, u otro, como puente y
hacer:
MOV DX,DATO1
MOV DATO2,DX
2.- Tampoco se puede hacer una transferencia directa entre dos registros de segmento. Por
eso, como en el caso anterior, si fuera preciso se utilizaría un registro como puente.
3.- Asimismo, tampoco se puede cargar en los registros de segmento un dato utilizando
direccionamiento inmediato, es decir, una constante, por lo que también habrá que recurrir a un
registro puente cuando sea preciso.
Por ejemplo, si queremos intercambiar los contenidos de los registros AX y BX, podemos
hacer:
MOV AUX, AX
MOV AX, BX
MOV BX, AUX
en donde AUX es una variable auxiliar que hace de puente, o simplemente utilizar:
XCHG AX, BX
Las restricciones que presenta esta operación es que no se pueden efectuar intercambios
directamente entre posiciones de memoria ni tampoco entre registros de segmento.
DATOS SEGMENT
TABLA DB 2,3,5,8,16,23
DATOS ENDS
CODIGO SEGMENT
MOVE BX, OFFSET TABLA ; Inicializa BX con la dirección donde comienza la tabla
MOVE AL, 5
XLAT TABLA
CODIGO ENDS
Para finalizar con las instrucciones de transferencia veremos un grupo de tres instrucciones:
La segunda, LDS, se utiliza para cargar el valor del segmento de una variable en el registro DS
y el desplazamiento correspondiente en el registro o posición de memoria indicada en la
instrucción. Por ejemplo, la instrucción LDS BX, NUM1 haría esquemáticamente lo siguiente:
La tercera y ultima de las instrucciones, LES, es similar a LDS, con la única salvedad de que el
valor del segmento se carga sobre el registro de segmento ES en vez del DS.
Las instrucciones ADD y SUB realizan sumas y restas sencillas de datos binarios. Los números
binarios negativos están representados en la forma de complemento a dos: Invierta todos los
bits del numero positivo y sume 1. Los formatos generales para las instrucciones ADD y SUB
son:
Desbordamientos
Este alerta con los desbordamientos en las operaciones aritméticas. Ya que un byte solo
permite el uso de un bit de signo y siete de datos (desde -128 hasta +127), una operación
aritmética puede exceder con facilidad la capacidad de un registro de un byte. Y una suma en
el registro AL, que exceda su capacidad puede provocar resultados inesperados.
AND. Si ambos bits comparados son 1, establece el resultado en 1. Las demás condiciones
dan como resultado 0.
OR. Si cualquiera (o ambos) de los bits comparados es 1, el resultado es 1. Si ambos bits están
en 0, el resultado es 0.
XOR. Si uno de los bits comparados es 0 y el otro 1, el resultado es 1. Si ambos bits
comparados son iguales (ambos 0 o ambos 1), el resultado es 0.
TEST. Establece las banderas igual que lo hace AND, pero no cambia los bits de los
operandos.
Las operaciones siguientes AND, OR y XOR ilustran los mismos valores de bits como
operandos:
AND OR XOR
0101 0101 0101
0011 0011 0011
Resultado: 0001 0111 0110
Es útil recordar la siguiente regla: el empleo de AND con bits 0 es 0 y el de OR con bits 1 es 1.
Los ejemplos 2 y 6 muestran formas de limpiar un registro, y ponerlo a cero. El ejemplo 3 pone
a cero los cuatro bits mas a la izquierda de AL.
TESt actúa igual que AND, pero solo establece las banderas. Aquí están algunos ejemplos :
La instrucción NOT.
La instrucción NOT solo invierte los bits en un byte o palabra en un registro o en memoria; esto
es, convierte los ceros en unos y los unos en ceros. El formato general es:
• CORRIMIENTO DE BITS.
3. Recorre hasta 8 bits en un byte, 16 bits en una palabra y 32 bits en una palabra doble.
El segundo operando contiene el valor del corrimiento, que es una constante (un valor
inmediato) o una referencia al registro CL. Para los procesadores 8088/8086, la constante
inmediata solo puede ser 1; un valor de corrimiento mayor que 1 debe estar contenido en el
registro CL. Procesadores posteriores permiten constantes de corrimiento inmediato hasta 31.
Los corrimientos hacia la derecha (SHR y SAR) mueven los bits hacia la derecha en el registro
designado. El bit recorrido fuera del registro mete la bandera de acarreo. Las instrucciones de
corrimiento a la derecha estipulan datos lógicos (sin signo) o aritméticos (con signo):
INSTRUCCION AL COMENTARIO
MOV CL, 03
MOV AL, 10110111B ; 10110111
SHR AL, 01 ; 11011011 Un corrimiento a la derecha
SHR AL, CL ; 00001011 Tres corrimientos adicionales a la derecha
SHR AX, 03 ; Válido para 80186 y procesadores posteriores
El primer SHR desplaza el contenido de AL un bit hacia la derecha. El bit de mas a la derecha
es enviado a la bandera de acarreo, y el bit de mas a la izquierda se llena con un cero. El
segundo SHR desplaza tres bits mas al AL. La bandera de acarreo contiene de manera
sucesiva 1, 1 y 0; además, tres bits 0 son colocados a la izquierda del AL.
SAR se difiere de SHR en un punto importante: SAR utiliza el bit de signo para llenar el bit
vacante de mas a la izquierda. De esta manera, los valores positivos y negativos retienen sus
signos. Las siguientes instrucciones relacionadas ilustran SAR y datos con signo en los que el
signo es un bit 1:
INSTRUCCION AL COMENTARIO
MOV CL, 03
MOV AL, 10110111B ;; 10110111
SHR AL, 01 ; 11011011 Un corrimiento a la derecha
SHR AL, CL ; 00001011 Tres corrimientos adicionales a la derecha
SHR AX, 03 ; Válido para 80186 y procesadores posteriores
En especial, los corrimientos a la derecha son útiles para (dividir entre 2) obtener mitades de
valores y son mucho mas rápidas que utilizar una operación de división.
Al terminar una operación de corrimiento, puede utilizar la instrucción JC (Salta si hay acarreo)
para examinar el bit desplazado a la bandera de acarreo.
Los corrimientos hacia la izquierda (SHL y SAL) mueven los bits a la izquierda, en el registro
designado. SHL y SAL son idénticos en su operación. El bit desplazado fuera del registro
ingresa a la bandera de acarreo. Las instrucciones de corrimiento hacia la izquierda estipulan
datos lógicos (sin signo) y aritméticos (con signo):
Las siguientes instrucciones relacionadas ilustran SHL para datos sin signo:
INSTRUCCION AL COMENTARIO
MOV CL, 03
MOV AL, 10110111B ; 10110111
SHR AL, 01 ; 01101110 Un corrimiento a la izquierda
SHR AL, CL ; 01110000 Tres corrimientos mas
SHR AX, 03 ; Válido para 80186 y procesadores posteriores
El primer SHL desplaza el contenido de AL un bit hacia la izquierda. El bit de mas a la izquierda
ahora se encuentra en la bandera de acarreo, y el ultimo bit de la derecha del AL se llena con
cero. El segundo SHL desplaza tres bits mas a el AL. La bandera de acarreo contiene en forma
sucesiva 0, 1 y 1, y se llena con tres ceros a la derecha del AL.
Los corrimientos a la izquierda llenan con cero el bit de mas a la derecha. Como resultado de
esto, SHL y SAL don idénticos. Los corrimientos a la izquierda en especial son útiles para
duplicar valores y son mucho mas rápidos que usar una operación de multiplicación.
Al terminar una operación de corrimiento, puede utilizar la instrucción JC (Salta si hay acarreo)
para examinar el bit que ingreso a la bandera de acarreo.
Las instrucciones de rotación, que son parte de la capacidad lógica de la computadora, pueden
realizar las siguientes acciones:
4. Realizar rotación hasta 8 bits en un byte, 16 bits en una palabra y 32 bits en una palabra
doble.
El segundo operando contiene un valor de rotación, el cual es una constante (un valor
inmediato) o una referencia al registro CL. Para los procesadores 8088/8086, la constante
inmediata solo puede ser 1; un valor de rotación mayor que 1 debe estar contenido en el
registro CL. Procesadores posteriores permiten constantes inmediatas hasta el 31. El formato
general para la rotación es:
INSTRUCCION BH COMENTARIO
MOV CL, 03
MOV BH, 10110111B ; 10110111
SHR BH, 01 ; 11011011 Una rotación a la derecha
SHR BH, CL ; 00001011 Tres rotaciones a la derecha
SHR BX, 03 ; Válido para 80186 y procesadores posteriores
El primer ROR desplaza el bit de mas a la derecha del BH a la posición vacante de mas a la
izquierda. La segunda y tercera operaciones ROR realizan la rotación de los tres bits de mas a
la derecha.
RCR provoca que la bandera de acarreo participe en la rotación. Cada bit que se desplaza
fuera de la derecha se mueve al CF y el bit del CF se mueve a la posición vacante de la
izquierda.
Las rotaciones a la izquierda (ROL y RCL) desplazan a la izquierda los bits del registro
designado. Las instrucciones de rotación a la izquierda estipulan datos lógicos (sin signo) y
aritméticos (con signo):
INSTRUCCION BL COMENTARIO
MOV CL, 03
MOV BL, 10110111B ; 10110111
SHR BL, 01 ; 11011011 Una rotación a la izquierda
SHR BL, CL ; 00001011 Tres rotaciones a la izquierda
SHR BX, 03 ; Válido para 80186 y procesadores posteriores
El primer ROL desplaza el bit de mas a la izquierda del BL a la posición vacante de mas a la
derecha. La segunda y tercera operaciones ROL realizan la rotación de los tres bits de mas a la
izquierda.
De manera similar a RCR, RCL también provoca que la bandera de acarreo participe en la
rotación. Cada bit que se desplaza fuera por la izquierda se mueve al CF, y el bit del CF se
mueve a la posición vacante de la derecha.
Puede usar la instrucción JC (salta si hay acarreo) para comprobar el bit rotado hacia la CF en
el extremo de una operación de rotación.
• MULTIPLICACION
Para la multiplicación, la instrucción MUL maneja datos sin signo y la instrucción IMUL
(multiplicación entera) maneja datos con signo. Ambas instrucciones afectan las banderas de
acarreo y de desbordamiento. Como programador, usted tiene el control sobre el formato de los
datos que procesa, y tiene la responsabilidad de seleccionar la instrucción de multiplicación
apropiada. El formato general de MUL e IMUL es :
Las operaciones de multiplicación básicas son byte a byte, palabra por palabra y palabras
dobles por palabra dobles.
Para multiplicar dos números de palabras dobles, el multiplicando esta en el registro EAX y el
multiplicador es una palabra doble en memoria o en otro registro. El producto es generado en el
par EDX:EAX. La operación ignora y borra cualquier información que ya este en el EDX.
MUL CL byte AL AX
MUL BX palabra AX DX:AX
MUL EBX palabra doble EAX EDX:EAX
BYTE1 DB ?
WORD1 DW ?
DWORD1 DD ?
• DIVISION
Para la división, la instrucción DIV (dividir) maneja datos sin signo y la IDIV (división entera)
maneja datos con signo. Usted es responsable de seleccionar la instrucción apropiada. El
formato general para DIV/IDIV es:
Las operaciones de multiplicación básicas son byte entre byte, palabra entre palabra y palabras
dobles entre palabra dobles.
Para esta operación, el dividendo esta en el par DX:AX y el divisor es una palabra en memoria
o en otro registro. Después de la división, el residuo esta en el DX y el cociente esta en el AX.
El cociente de una palabra permite para datos sin signo un máximo de +32, 767 (FFFFH) y con
signo +16, 383 (7FFFH). Tenemos:
Palabra cuádruple entre palabra doble
Al dividir una palabra cuádruple entre una palabra doble, el dividendo esta en el par EDX:EAX y
el divisor esta en una palabra doble en memoria o en otro registro. Después de la división, el
residuo esta en el EDX y el cociente en el AEX.
En los ejemplos siguientes, de DIV, los divisores están en un registro, que determina el tipo de
operación:
DIV CL byte AX AL AH
DIV CX palabra DX:AX Ax DX
DIV EBX palabra doble EDX:EAX EAX EDX
BYTE1 DB ?
WORD1 DW ?
DWORD1 DD ?
... DIVISOR DIVIDENDO COCIENTE RESIDUO
6.6. COMPARACION.
• LA INSTRUCCION CMP
La instrucción CMP pro lo común es utilizada para comparar dos campos de datos, uno de los
cuales están contenidos en un registro. El formato general para CMP es:
El resultado de una operación CMP afecta la banderas AF, CF, OF, PF, SF y ZF, aunque no
tiene que probar estas banderas de forma individual. El código siguiente prueba el registro BX
por un valor cero:
X CMP BX, 00 ;Compara Bx con cero
JZ B50 ;Si es cero salta aB50
. ;(Acción si es diferente de cero)
.
B50: ... ;Destino del salto, si BX es cero
Observe que la operación compara el primer operando con el segundo; por ejemplo, el valor del
primer operando es mayor que, igual o menor que el valor del segundo operando?
• LA INSTRUCCION CMPS
Cuando se combinan con un prefijo REP y una longitud en el CX, de manera sucesiva CMPS
puede comparar cadenas de cualquier longitud.
Pero observe que CMPS proporciona una comparación alfanumérica, esto es, una
comparación de acuerdo a con los valores ASCII. Considere la comparación de dos cadenas
que contienen JEAN y JOAN. Una comparación de izquierda a derecha, tiene el resultado
siguiente:
J:J Iguales
E:O Diferentes (E es menor)
A:A Iguales
N:N Iguales
Una comparación de los 4 bytes termina con una comparación de N con N (iguales). Ahora ya
que los dos nombres no son idénticos, la operación debe terminar tan pronto como la
comparación entre 2 caracteres sea diferente.
G20:
MOV CX, 10 ;Iniciar para 10 bytes
LEA DI, NOM3
LEA SI, NOM2
REPE CMPSB ;Compare NOM2:NOM3
JE G30 ;Igual, salir
MOV BL, 02 ;No es igual, fijar BL
G30:
MOV AX, 4C00H ;Salir a DOS
INT 21H
MAIN ENDP
END BEGIN
Hasta este punto los programas que hemos examinado han sido ejecutados en forma lineal,
esto es con una instrucción secuencialmente a continuación de otra. Sin embargo, rara vez un
programa programable es tan sencillo. La mayoría de los programas constan de varios ciclos
en los que una serie de pasos se repite hasta alcanzar un requisito especifico y varias pruebas
para determinar que acción se realiza de entre varias posibles.
Requisitos como este implican la transferencia de control a la dirección de una instrucción que
no sigue de inmediato de la que se esta ejecutando actualmente. Una transferencia de control
puede ser hacia adelante, para ejecutar una serie de pasos nuevos, o hacia atrás, para volver a
ejecutar los mismos pasos.
Ciertas instrucciones pueden transferir el control fuera del flujo secuencial normal añadiendo un
valor de desplazamiento al IP.
Una operación de salto alcanza una dirección corta por medio de un desplazamiento de un
byte, limitado a una distancia de -128 a 127 bytes. Una operación de salto alcanza una
dirección cercana por medio de un desplazamiento de una palabra, limitado a una distancia de
-32, 768 a 32, 767 bytes dentro del mismo segmento. Una dirección lejana puede estar en otro
segmento y es alcanzada por medio de una dirección de segmento y un desplazamiento; CALL
es la instrucción normal para este propósito.
La tabla siguiente indica las reglas sobre distancias para la operaciones JMP, LOOP y CALL.
Hay poca necesidad de memorizar estas reglas, ya que el uso normal de estas instrucciones en
rara ocasión causa problemas.
Etiquetas de instrucciones
Las instrucciones JMP, Jnnn (salto condicional) y LOOP requieren un operando que se refiere a
la etiqueta de una instrucción. El ejemplo siguiente salta a A90, que es una etiqueta dada a una
instrucción MOV:
JMP A90
...
A90: MOV AH, 00
...
La etiqueta de una instrucción, tal como A90:, terminada con dos puntos (:) para darle atributo
de cercana - esto es, la etiqueta esta dentro de un procedimiento en el mismo segmento de
código.
Cuidado: Un error común es la omisión de los dos puntos. Note que una etiqueta de dirección
en un operando de instrucción (como JMP A90) no tiene un carácter de dos puntos.
Una operación JMP dentro del mismo segmento puede ser corta o cercana (o de manera
técnica, lejana, si el destino es un procedimiento con el atributo FAR). En su primer paso por un
programa fuente, el ensamblador genera la longitud de cada instrucción. Sin embargo, una
instrucción JMP puede ser de dos o tres bytes de longitud. Una operación JMP a una etiqueta
dentro de -128 a + 127 bytes es un salto corto.
El ensamblador genera un byte para la operación (EB) y un byte para el operando. El
operando actúa como un valor de desplazamiento que la computadora suma al registro IP
cuando se ejecuta el programa. El ensamblador ya puede haber encontrado el operando
designado (un salto hacia atrás) dentro de -128 bytes, como en:
A50:
...
JMP A50
En este caso, el ensamblador genera una instrucción de maquina de dos bytes. Una JMP que
excede -128 a 127 bytes se convierte en un salto cercano, para que el ensamblador genere un
código de maquina diferente (E9) y un operando de dos bytes (procesadores 8088/8086) o un
operando de cuatro bytes (procesadores 80386 y posteriores). En un salto hacia adelante, el
ensamblador aun no ha encontrado el operando designado:
JMP A90
...
A90:
Ya que algunas versiones del ensamblador no saben en este punto si el salto es corto o
cercano, generan de forma automática una instrucción de tres bytes.
Page 60,132
TITLE P08JUMP (COM) Uso de JMP para iterar
.MODEL SMALL
.CODE
ORG 100H
MAIN PROC NEAR
MOV AX,01 ;Iniciación de AX,
MOV BX,01 ;BX y
MOV CX,01 ;CX a 01
A20:
ADD AX, 01 ;Sumar 01 a AX
ADD BX, AX ;Sumar AX a BX
SHL CX, 1 ;Multiplicar por dos a CX
JMP A20 ;Saltar a la etiqueta A20
MAIN ENDP
END MAIN
La instrucción LOOP
La instrucción LOOP, requiere un valor inicial en el registro CX. En cada iteración, LOOP de
forma automática disminuye 1 de CX. Si el valor en el CX es cero, el control pasa a la
instrucción que sigue; si el valor en el CX no es cero, el control pasa a la dirección del
operando. La distancia debe ser un salto corto, desde -128 hasta +127 bytes. Para una
operación que exceda este limite, el ensamblador envía un mensaje como "salto relativo fuera
de rango". El formato general de la instrucción LOOP es:
| [etiqueta:] | LOOP | dirección corta |
Page 60,132
TITLE P08LOOP (COM) Ilustración de LOOP
.MODEL SMALL
.CODE
ORG 100H
MAIN PROC NEAR
MOV AX,01 ;Iniciación de AX,
MOV BX,01 ;BX y
MOV CX,01 ;CX a 01
MOV CX,10 ;Iniciar
A20: ;Número de iteraciones
ADD AX, 01 ;Sumar 01 a AX
ADD BX, AX ;Sumar AX a BX
SHL DX, 1 ;Multiplicar por dos a DX
LOOP A20 ;Iterar si es diferente de cero
MOV AX, 4C00H ;Salida a DOS
MAIN ENDP
END MAIN
LOOPNE/LOOPNZ (repite el ciclo mientras no sea igual o repite el ciclo mientras sea cero)
continua el ciclo mientras el valor en el CX no es cero o la condición de cero no esta
establecida.
El ensamblador permite usar una variedad de instrucciones de salto condicional que transfieren
el control dependiendo de las configuraciones en el registro de banderas. Por ejemplo, puede
comparar dos campos y después saltar de acuerdo con los valores de las banderas que la
comparación establece. El formato general para el salto condicional es:
DEC y JNZ realizan exactamente lo que hace LOOP. DEC decrementa en 1 CX y pone a 1 o a
0 la bandera de cero (ZF) en el registro de banderas. Después JNZ prueba la configuración de
la bandera de cero; si el CX es diferente de cero, el control pasa a A20, y si el CX es cero el
control pasa a la siguiente instrucción hacia abajo
Distinguir el propósito de los saltos condicionales debe clarificar su uso. El tipo de datos (sin
signo o con signo) sobre los que se realizan las comparaciones o la aritmética puede
determinar cual es la instrucción a utilizar. Un dato sin signo trata todos los bits como bits de
datos; ejemplos típicos son las cadenas de caracteres, tal como nombres o direcciones, y
valores numéricos tal como números de cliente. Un dato con signo trata el bit de mas a la
izquierda como un signo, en donde 0 es positivo y 1 es negativo.
CMP AX, BX
compara el contenido de AX con el contenido del BX. Para datos sin signo, el valor AX es
mayor; sin embargo, para datos con signo el valor AX es menor a causa del signo negativo.
Cada una de estas pruebas las puede expresar en uno de dos códigos simbólicos de
operación.
Saltos con base en datos con signo
No espere memorizar todas estas instrucciones; sin embargo, como recordatorio note que un
salto para datos sin signo es igual, superior o inferior, mientras que un salto para datos con
signo es igual, mayor que o menor. Los saltos que prueban banderas de acarreo, de
desbordamiento y de paridad tienen propósitos únicos.
7.1. DEFINICION.
El segmento de código contiene el código ejecutable de un programa. También tiene uno o mas
procedimientos, definidos con la directiva PROC. Un segmento que tiene solo un procedimiento
puede aparecer como sigue:
El nombre del procedimiento debe estar presente, ser único y seguir las reglas para la
formación de nombres del lenguaje. El operando far en este caso esta relacionado con la
ejecución del programa. Cuando usted solicita la ejecución de un programa, el cargador de
programas del DOS utiliza este nombre de procedimiento como el punto de entrada para la
primera instrucción a ejecutar.
Hasta ahora los segmentos de código han consistido solo en un procedimiento, codificado
como:
En este caso el operador FAR informa al sistema que la dirección indicada es el punto de
entrada para la ejecución del programa, mientras que la directiva ENDP define el final del
procedimiento. Sin embargo, un segmento de código puede tener cualquier numero de
procedimientos, todos distinguidos por PROC y ENDP. Un procedimiento llamado (o subrutina)
es una sección de código que realiza una tarea definida y clara (tal como ubicar el cursor o bien
obtener entrada del teclado).
1. Reduce la cantidad de código, ya que un procedimiento común puede ser llamado desde
cualquier lugar en el segmento de código.
3. Facilita la depuración del programa, ya que los errores pueden ser aislados con mayor
claridad.
El código objeto particular que CALL y RET generan depende de si la operación implica un
procedimiento NEAR (cercano) o un procedimiento FAR (lejano).
Llamada y regreso cercanos. Una llamada (CALL) a un procedimiento dentro del mismo
segmento es cercana y realiza lo siguiente:
• Saca el antiguo valor de IP de la pila y lo envía al IP (lo cual también vacía el resultado
de la instrucción previamente procesada).
• Incrementa el SP en 2.
Ahora el CS:IP apunta a la instrucción que sigue al CALL original en la llamada del
procedimiento, en donde se reasume la ejecución.
Llamada y regreso lejanos. Una llamada (CALL) lejana llama a un procedimiento etiquetado
con FAR, tal vez en un segmento de código separado. Un CALL lejano mete a la pila al CS y al
IP, y RET los saca de la pila.
page 60,132
TITLE P08CALLP (EXE) Llamada a procedimientos
.MODEL SMALL
.STACK 64
.DATA
;---------------------------------------------------------------------
.CODE
BEGIN PROC FAR
CALL B10 ;Llama a B10
; ...
MOV AX,4C00H ;Salida a DOS
INT 21H
BEGIN ENDP
;---------------------------------------------------------------------
B10 PROC NEAR
CALL C10 ;Llama a C10
; ...
RET ;De regreso
B10 ENDP ;Quien llama
;---------------------------------------------------------------------
END BEGIN
7.2. LLAMADA DE PROCEDIMIENTOS.
Hasta ahora los segmentos de código han consistido solo en un procedimiento, codificado
como:
En este caso el operador FAR informa al sistema que la dirección indicada es el punto de
entrada para la ejecución del programa, mientras que la directiva ENDP define el final del
procedimiento. Sin embargo, un segmento de código puede tener cualquier numero de
procedimientos, todos distinguidos por PROC y ENDP. Un procedimiento llamado (o subrutina)
es una sección de código que realiza una tarea definida y clara (tal como ubicar el cursor o bien
obtener entrada del teclado).
1. Reduce la cantidad de código, ya que un procedimiento común puede ser llamado desde
cualquier lugar en el segmento de código.
3. Facilita la depuración del programa, ya que los errores pueden ser aislados con mayor
claridad.
El código objeto particular que CALL y RET generan depende de si la operación implica un
procedimiento NEAR (cercano) o un procedimiento FAR (lejano).
Llamada y regreso cercanos. Una llamada (CALL) a un procedimiento dentro del mismo
segmento es cercana y realiza lo siguiente:
• Saca el antiguo valor de IP de la pila y lo envía al IP (lo cual también vacía el resultado
de la instrucción previamente procesada).
• Incrementa el SP en 2.
Ahora el CS:IP apunta a la instrucción que sigue al CALL original en la llamada del
procedimiento, en donde se reasume la ejecución.
Llamada y regreso lejanos. Una llamada (CALL) lejana llama a un procedimiento etiquetado
con FAR, tal vez en un segmento de código separado. Un CALL lejano mete a la pila al CS y al
IP, y RET los saca de la pila.
page 60,132
TITLE P08CALLP (EXE) Llamada a procedimientos
.MODEL SMALL
.STACK 64
.DATA
;---------------------------------------------------------------------
.CODE
BEGIN PROC FAR
CALL B10 ;Llama a B10
; ...
MOV AX,4C00H ;Salida a DOS
INT 21H
BEGIN ENDP
;---------------------------------------------------------------------
B10 PROC NEAR
CALL C10 ;Llama a C10
; ...
RET ;De regreso
B10 ENDP ;Quien llama
;---------------------------------------------------------------------
END BEGIN
Una definición de macro aparece antes de que cualquier definición de segmento. Examinemos
una definición de una macro sencilla que inicializa los registros de segmento para un
programa.EXE:
El nombre de esta macro es INICIAREGS, aunque es aceptable cualquier otro nombre valido
que sea único. La directiva MACRO en la primer línea indica al ensamblador que las
instrucciones que siguen, hasta ENDM ("fin de la macro"), son parte de la definición de la
macro. La directiva ENDM termina la definición de la macro.
Los nombres a que se hace referencia en la definición de la macro, @data, AX, DS y ES,
deben estar definidos en alguna parte del programa o deben ser dados a conocer de alguna
otra forma al ensamblador.
Un programa usaría la macroinstruccion INICIAREGS solo una vez, aunque otras macros están
diseñadas para ser utilizadas cualquier numero de veces y cada vez el ensamblador genera la
misma expansión.
Para hacer una macro flexible, puede definir nombres en ella como argumentos mudos
(ficticios).La definición de la macro siguiente, llamada DESPLEGAR_MSG, proporciona el uso
de la función 09H del DOS para desplegar cualquier mensaje. Cuando se usa la
macroinstrucción el programador tiene que proporcionar el nombre del mensaje, el cual hace
referencia a un área de datos terminada por un signo de dólar.
Un argumento mudo en una definición de macro indica al ensamblador que haga coincidir su
nombre con cualquier aparición del mismo nombre en el cuerpo de la macro. Por ejemplo, el
argumento mudo MENSAJE también aparece en la instrucción LEA.
DESPLEGAR_MSG MENSAJE2
En este caso, MENSAJE2 tiene que estar apropiadamente definido en el segmento de dato. El
parámetro en la microinstrucción corresponde al argumento mudo en la definición original de la
macro:
Definición de macro: DESPLEGAR_MSG MACRO MENSAJE (Argumento)
Macroinstruccin: DESPLEGAR_MSG MENSAJE2 (Parametro)
8.5.BIBLIOTECAS DE MACROS.
Definir una macro y usarla solo una vez en un programa no es muy productivo. El enfoque
habitual es catalogar las macros en una biblioteca en disco bajo un nombre descriptivo, como
MACRO.LIB. Usted solo tiene que reunir todas las definiciones de sus macros en un archivo y
almacenar el archivo en disco:
Macro1 MACRO
....
ENDM
Macro2 MACRO
....
ENDM
Para usar cualquiera de las macros catalogadas, en lugar de codificar las definiciones MACRO
al inicio del programa utilice la directiva INCLUDE así:
INCLUDE C: MACRO.LIB
Macro1
Macro2
El ensamblador accesa el archivo llamado MACRO en la unidad C e incluye ambas definiciones
de macro, Macro1 y Macro2, en el programa. El listado ensamblado contendrá una copia de las
definiciones de las macros.
La Directiva PURGE.
La ejecución de una instrucción INCLUDE hace que el ensamblador incluya todas las
definiciones de macros que están especificadas en la biblioteca. Sin embargo, suponga que
una biblioteca contiene las macros SUMA, RESTA, DIVIDE, pero que el programa solo necesita
SUMA. La directiva PURGE permite que usted "elimine" la macros RESTA y DIVIDE que no
necesita del ensamblado actual:
IF1
INCLUDE C:\MACRO.LIB ;Incluye la biblioteca completa
ENDIF
Una operación PURGE facilita solo el ensamblado de un programa y no tiene efecto sobre las
macros almacenadas en la biblioteca.