Tema 2. Ficheros
Tema 2. Ficheros
Tema 2. Ficheros
FICHEROS
Dispositivos de almacenamiento
Para facilitar la comprensión del temario, cuando nos refiramos a los dispositivos
de almacenamientos vamos a limitar tal definición a los dispositivos de
almacenamiento modernos como son los discos duros (magnéticos), sistemas de
almacenamiento basados en memorias tipo flash como los discos SSD,
las tarjetas de memoria o los pendrives y sistemas de almacenamientos
ópticos como los CD, DVD o Blu-ray.
Las particiones
No hay ningún tipo de regla que indique cómo debe ser particionado un dispositivo
de almacenamiento, por lo que el esquema de particionado de un dispositivo suele
estar determinado por diversos motivos tales como la flexibilidad deseada,
velocidad, seguridad o las limitaciones propias del espacio disponible. Por norma
general, es una elección propia del usuario, salvo las particiones creadas por
defecto durante la instalación de un sistema operativo.
El concepto de MBR nace en 1983 con el Sistema Operativo PC DOS 2.0 y sigue
vigente hasta nuestros días, aunque dada su antigüedad, las limitaciones de este
tipo de tabla de particiones se hacen cada vez más evidentes. Entre ellas, quizá la
más notoria sea la limitación del espacio de almacenamiento máximo
direccionable a 2TB.
Sistemas de ficheros
Boot Sector.
FAT1 y FAT 2 (copia de la FAT1).
Root folder y entradas de directorio.
Para explicar cómo los sistemas de ficheros «borran» los archivos y cómo
posteriormente podemos recuperarlos, vamos a basarnos en un ejemplo.
Imaginad que tenemos un archivo de vídeo en alta definición que ocupa 2GB de
espacio en nuestro disco duro. Este archivo se encontrará dividido en distintas
partes a lo largo del dispositivo tal que así:
Cuando eliminamos dicho archivo, lo que estamos haciendo no es
eliminarlo físicamente del dispositivo, si no marcar dicho archivo como eliminado,
indicar que el espacio ocupado por el mismo está libre, borrar el enlace a la primera
parte del mismo, eliminar la definición del archivo del índice o varias de estas
opciones, todo ello en función del sistema de ficheros utilizado.
El índice quedaría de manera similar a esta:
Vamos a verlo mejor con un ejemplo (en el ejemplo vamos a trabajar sobre un
FAT16). Contenido de la tabla FAT1 antes de borrar el único archivo contenido en
el directorio raíz del dispositivo:
Las dos primeras entradas de la FAT (coloreadas en rojo) son utilizadas por el
propio sistema de archivos. La tercera entrada (correspondiente con el clúster 2 y
coloreada en verde) está marcada como utilizada y la cuarta entrada
(correspondiente con el clúster 3 y coloreada en naranja) también está marcada
como utilizada, siendo además el último clúster del archivo.
Como vemos, indica que hay un archivo denominado «BALLOON», con extensión
«JPG» que ocupa 971bytes (en azul claro está coloreado CB03, que leyendo al
revés es 03CB = 971 en decimal) y que comienza en el clúster 2 (lo indica el valor
02 del offset 00040010A).
Ahora bien, tras el «borrado» de un archivo, el espacio que dicho archivo ocupaba pasa a
encontrarse como disponible. Por lo tanto, es posible que parte de dicho espacio
sea sobrescrito en operaciones de escritura posteriores quedando el fichero
inicial irrecuperable parcial o completamente.
En el dibujo anterior, la primera parte del archivo «video2.avi» ha sobrescrito la
segunda parte del archivo «video.avi», lo que ha provocado que se pierda el
enlace al resto de partes de dicho archivo. Por lo tanto, en este caso particular
solo se podría recuperar parcialmente el archivo «video.avi».
Veamos con una tabla los posibles escenarios existentes tras la eliminación de un
archivo y la información que se podría recuperar en cada uno de ellos.
Información que se
Acción Resultado
puede recuperar
Eliminación, vaciado
Similar a borrar el
de la papelera (o Solo el archivo, sin los
enlace al archivo o
similares) y datos asociados al
eliminar su definición
sobrescritura del mismo
de la tabla
enlace del índice
En función de la
Eliminación, vaciado cantidad de
Las zonas físicas
de la papelera (o información
donde se encontraba el
similares) y sobrescrita, es posible
archivo han sido
sobrescritura de los recuperar una parte
sobrescritas
datos del archivo o no
recuperar nada
Firma Firma
Tipo de archivo
(Hexadecimal) (ASCII)
Ejecutable
4D 5A MZ
(*.EXE)
Comprimido
50 4B 03 04 PK...
(*.ZIP)
52 61 72 21 1A Comprimido
Rar!...
00 00 (*.RAR)
89 50 4E 47 0D Imagen
.PNG....
0A 1A 0A (*.PNG)
FF D8 FF Imagen
ÿØÿà/á/è
E0/E1/E8 (*.JPG)
D0 CF 11 E0 Documentos
ÐÏ.ࡱ.á
A1 B1 1A E1 MS Office
Para ver la firma de un archivo, solo tenemos que abrir dicho archivo con un editor
hexadecimal. La firma se encuentra (por norma general) al principio del mismo,
aunque la longitud de la misma suele variar.
Aquí vemos la firma de un archivo de imagen en formato JPG abierto con un editor
hexadecimal:
Que justo antes de la utilización de dicho documento por parte de Colin Powell en
un discurso ante las Naciones Unidas, uno de los autores había copiado el informe
de su ordenador a un disquete para que Powell lo utilizara en la presentación.
Se obtuvo información sobre los autores del mismo: «P. Hamill», «J. Pratt», «A.
Blackshaw» y «M. Khan». Pudiendo averiguar, a partir de sus nombres, cuál era
su cargo y lugar de trabajo. Además, se descubrió que gran parte dicho
documento había sido plagiado de los documentos de un investigador
estadounidense.
Para ello, vamos a realizar paso a paso los procesos que el programa de
recuperación realiza de forma automática, sobre una imagen preparada para tal
propósito. En este caso, estamos trabajando sobre un Sistema de Ficheros FAT.
El primer paso consiste en leer el contenido del directorio raíz del dispositivo a
analizar. Obteniendo algo similar a lo que se observa en la siguiente imagen:
Como se observa, aparecen cuatro entradas, de las cuales, las tres últimas son
las que se corresponden con los archivos contenidos en el dispositivo, mientras
que la primera sería el nombre del volumen FAT (esto es así en FAT pero, como
ya hemos comentado al inicio, no tiene por qué serlo en otros sistemas de
ficheros).
En FAT, cada una de las entradas de esta carpeta raíz ocupa 32 bytes, los cuales
se distribuyen de la siguiente manera:
Root Folder
Size Description
Entry
11
Name Name in 8.3 format
bytes
Attribute byte 1 byte Information about the entry.
Reserved 1 byte
Creation time 5
Time and date file was created.
and date bytes
Last access 2
Date file was last accessed.
date bytes
2
Reserved
bytes
Last
4 Time and date file was last
modification
bytes modified.
time and date
4
File size Size of the file.
bytes
Para saber qué archivos han sido eliminados solo nos tenemos que fijar en que el
primer valor (hexadecimal) de su entrada:
Valor Significado
Por lo tanto, de la lista de entradas del directorio raíz podemos ver que dos de las
tres entradas se encuentran eliminadas. Estas entradas se corresponden con los
archivos «?ORMIGA» y «?EADOW».