Sistemas de Archivos Parte II
Sistemas de Archivos Parte II
Sistemas de Archivos Parte II
SISTEMAS DE ARCHIVOS
Un sistema de archivos (file system)
es una estructura de directorios con
algn tipo de organizacin el cual
nos permite almacenar, crear y
borrar archivos en diferentes
formatos.
Sistemas de Archivos
Almacenamiento Fsico de Datos
En un sistema de cmputo es evidente
que existe la necesidad por parte de los
usuarios y aplicaciones de almacenar
datos en algn medio, a veces por
periodos largos y a veces por instantes.
Sistemas de Archivos
Almacenamiento Fsico de Datos
Cada aplicacin y cada usuario debe
tener ciertos derechos con sus datos,
como son el poder crearlos y borrarlos,
o cambiarlos de lugar; as como tener
privacidad contra otros usuarios o
aplicaciones.
Sistemas de Archivos
Almacenamiento Fsico de Datos
El subsistema de archivos del sistema
operativo se debe encargar de estos
detalles, adems de establecer el
formato fsico en el cual almacenar los
datos en discos duros, cintas o discos
flexibles, cdroms, etc.
Sistemas de Archivos
Almacenamiento Fsico de Datos
Debe ser conocido por todos que
tradicionalmente la informacin en los
sistemas modernos se almacena en
discos duros, flexibles y unidades de
disco ptico,
En todos ellos se comparten algunos
esquemas bsicos para darles formato
fsico: las superficies de
almacenamiento son divididas en
crculos concntricos llamados "pistas" y
cada pista se divide en "sectores".
Sistemas de Archivos
Almacenamiento Fsico de Datos
A la unin lgica de varias pistas a travs de
varias superficies "paralelas" de
almacenamiento se les llama "cilindros", los
cuales son inspeccionados al momento de
lectura o escritura de datos por las respectivas
unidades fisicas llamadas "cabezas". Las
superficies de almacenamiento reciben el
nombre de "platos" y generalmente estn en
movimiento rotatorio para que las cabezas
accesen a las pistas que los componen.
Sistemas de Archivos
Almacenamiento Fsico de Datos
Los datos se escriben a travs de los
sectores en las pistas y cilindros
modificando las superficies por medio
de las cabezas.
Sistemas de Archivos
Sistemas de Archivos
Almacenamiento Fsico de Datos
El tiempo que una cabeza se tarda en ir de una
pista a otra se le llama "tiempo de bsqueda"
y depender de la distancia entre la posicin
actual y la distancia a la pista buscada.
El tiempo que tarda una cabeza en ir del sector
actual al sector deseado se le llama tiempo de
latencia y depende de la distancia entre
sectores y la velocidad de rotacin del disco.
Sistemas de Archivos
Almacenamiento Fsico de Datos
El impacto que tiene las lecturas y
escrituras sobre el sistema est
determinado por la tecnologa usada en
los platos y cabezas y por la forma de
resolver las peticiones de lectura y
escritura, es decir, los algoritmos de
planificacin.
Sistemas de Archivos
Sistemas de Archivos
Sistemas de Archivos
Cabezas (Heads):
Realizan la lectura fsica de
cada superficie del disco.
Hay tantas cabezas como
superficies tiles. En
principio, dos cabezas por
cada disco
Las cabezas se mueven a
la vez, pues estn unidas
al mismo brazo.
Un multiplexor se encarga
de conmutar la
lectura/escritura entre una
u otra cabeza.
Pistas (Tracks)
Cada una de las lineas
concntricas en que se
divide la superficie de
un disco.
Una pista es un anillo
circular sobre un lado
del disco. Cada pista
tiene un nmero. El
diagrama muestra 3
pistas.
Sectores
Se llama sector de un disco,
una parte en forma de cua
del mismo. Cada sector est
numerado.
En un disquete de 5 1/4 hay
40 pistas con 9 sectores cada
una.
En un disquete de 3 1/2 hay
80 pistas con 9 sectores cada
una.
De manera que, en un
disquete de 3 1/2 hay el
doble de lugares que en un
disquete de 5
Sector de pista
Es el rea de
interseccin entre
una pista y un
sector. (rea
amarilla)
Bloque (Clusters)
Un cluster es un conjunto de
sectores de pista , desde 2 a
32 o ms, dependiendo del
esquema de formateo que se
use.
El esquema ms comn para
PC determina la cantidad de
sectores de pista por cada
cluster sobre la base de la
capacidad del disco. Un disco
rgido de 1.2 gigabytes tendr
el doble de clusters que un
disco rgido de 500 MB.
Cilindro (Cylinder)
Pistas de todos los
platos que
equidistan del eje.
Es decir, pistas a
las que acceden las
cabezas
cuando el brazo no
se mueve.
Ejemplo:
Parmetros de un disquete de 35
pulgadas,144MBytes:
- 80 Cylinders, 2 Heads, 512
Bytes/Sector, 18 Sectors/Track
- Multiplicando: 80 x 2 x 18 x 512 =
1.474.560 bytes
El procedimiento para leer/escribir
datos en un disco duro tiene 4
pasos:
1. Bsqueda
2. Rotacin
3. Ubicacin
4. Transferencia de datos
Formateo:
El proceso de formateo establece un
mtodo de asignacin de direcciones
a las diferentes reas del disco.
Tambin establece un espacio para
guardar all la lista de direcciones.
Qu pasa cuando se formatea un
disco?
1. Se borran todos los datos
2. Se verifican las superficies por si
hubieran defectos fsicos o
magnticos.
3. Se crea un directorio raz que
contiene una lista especificando dnde
se encuentra la informacin en el disco.
Formateo de bajo nivel o formateo fsico:
Se llena el disco con un estructura de datos especial para
cada sector.
Esta estructura consiste en una cabecera, un rea de datos
(e.g. 512 bytes) y un apndice.
Formateo lgico:
Se realiza la creacin de un sistema de archivos. Se
almacena las estructuras de datos del sistema de archivos
inicial en el disco, es decir: mapa de espacio libres y
asignado (e.g. FAT, i-nodos) y un directorio inicial vaco.
Sistemas de Archivos
Estructura lgica de un disco duro
La estructura lgica de un disco duro
est formada por:
El sector de arranque (Master Boot
Record)
Espacio particionado
Espacio sin particionar
Sistemas de Archivos
Estructura lgica de un disco duro
El sector de arranque es el primer sector de
todo disco duro (cabeza 0, cilindro 0, sector
1). En l se almacena la tabla de particiones y
un pequeo programa master de inicializacin,
llamado tambin Master Boot. Este programa
es el encargado de leer la tabla de particiones
y ceder el control al sector de arranque de la
particin activa. Si no existiese particin
activa, mostrara un mensaje de error.
Sistemas de Archivos
Estructura lgica de un disco duro
El espacio particionado es el espacio del disco
que ha sido asignado para poder trabajar. El
espacio no particionado, es espacio no
accesible del disco ya que todava no ha sido
asignado a ninguna particin. A continuacin
se muestra un ejemplo de un disco duro con
espacio particionado (2 particiones primarias y
2 lgicas) y espacio todava sin particionar.
Sistemas de Archivos
Sistemas de Archivos
Estructura lgica de un disco duro
El caso ms sencillo consiste en un
sector de arranque que contenga una
tabla de particiones con una sola
particin, y que esta particin ocupe la
totalidad del espacio restante del disco.
En este caso, no existira espacio sin
particionar.
Sistemas de Archivos
Sistemas de Archivos
Las particiones
Cada disco duro constituye una unidad
fsica distinta. Sin embargo, los
sistemas operativos no trabajan con
unidades fsicas directamente sino con
unidades lgicas.
Dentro de una misma unidad fsica de
disco duro puede haber varias unidades
lgicas.
Sistemas de Archivos
Particiones y directorios. Ambas
estructuras permiten organizar datos
dentro de un disco duro.
Sin embargo, presentan importantes
diferencias:
1) Las particiones son divisiones de
tamao fijo del disco duro; los
directorios son divisiones de tamao
variable de la particin;
Sistemas de Archivos
Particiones y Directorios
2) Las particiones ocupan un grupo de
cilindros contiguos del disco duro
(mayor seguridad); los directorios
suelen tener su informacin
desperdigada por toda la particin;
3) Cada particin del disco duro puede
tener un sistema de archivos (sistema
operativo) distinto; todos los directorios
de la particin tienen el sistema de
archivos de la particin.
Sistemas de Archivos
Particiones y Directorios
Cada una de estas unidades lgicas
constituye una particin del disco duro.
Esto quiere decir que podemos dividir un
disco duro en, por ejemplo, dos particiones
(dos unidades lgicas dentro de una misma
unidad fsica) y trabajar de la misma
manera que si tuvisemos dos discos duros
(una unidad lgica para cada unidad fsica).
Sistemas de Archivos
Particiones y Directorios
Como mnimo, es necesario crear una
particin para cada disco duro. Esta
particin puede contener la totalidad del
espacio del disco duro o slo una parte.
Sistemas de Archivos
Particiones y Directorios
Las razones que nos pueden llevar a
crear ms de una particin por disco se
suelen reducir a tres.
Razones organizativas. Considrese el caso
de un ordenador que es compartido por dos
usuarios y, con objeto de lograr una mejor
organizacin y seguridad de sus datos
deciden utilizar particiones separadas.
Sistemas de Archivos
Particiones y Directorios
Instalacin de ms de un sistema
operativo. Debido a que cada sistema
operativo requiere (como norma
general) una particin propia para
trabajar, si queremos instalar dos
sistemas operativos a la vez en el
mismo disco duro (por ejemplo,
Windows 98 y Linux), ser necesario
particionar el disco.
Sistemas de Archivos
Particiones y Directorios
Razones de eficiencia. Por ejemplo, suele
ser preferible tener varias particiones FAT
pequeas antes que una gran particin FAT.
Esto es debido a que cuanto mayor es el
tamao de una particin, mayor es el
tamao del grupo (cluster) y, por
consiguiente, se desaprovecha ms espacio
de la particin. Ms adelante, explicaremos
esto con mayor detalle.
Sistemas de Archivos
Las particiones pueden ser de dos
tipos: primarias o extendidas.
Las particiones lgicas se definen
dentro de una particin primaria
especial denominada particin
extendida.
Sistemas de Archivos
En un disco duro slo pueden existir
4 particiones primarias.
Las particiones existentes deben
inscribirse en una tabla de
particiones de 4 entradas situada en
el primer sector de todo disco duro.
Sistemas de Archivos
De estas 4 entradas de la tabla puede que
no est utilizada ninguna (disco duro sin
particionar, tal y como viene de fbrica) o
que estn utilizadas una, dos, tres o las
cuatro entradas.
En cualquiera de estos ltimos casos
(incluso cuando slo hay una particin), es
necesario que en la tabla de particiones
figure una de ellas como particin activa.
La particin activa es aquella a la que el
programa de inicializacin (Master Boot)
cede el control al arrancar.
Sistemas de Archivos
El sistema operativo de la particin
activa ser el que se cargue al
arrancar desde el disco duro. Ms
adelante veremos distintas formas
de elegir el sistema operativo que
queremos arrancar, en caso de tener
varios instalados, sin variar la
particin activa en cada momento.
Sistemas de Archivos
De todo lo anterior se pueden
deducir varias conclusiones:
Para que un disco duro sea utilizable
debe tener al menos una particin
primaria.
Adems para que un disco duro sea
arrancable debe tener activada una de
las particiones y un sistema operativo
instalado en ella.
Sistemas de Archivos
Esto quiere decir que el proceso de
instalacin de un sistema operativo en un
ordenador consta de:
La creacin de su particin correspondiente
Activacin de la misma.
Instalacin del sistema operativo (formateo de la
particin y copia de archivos)
Un disco duro no arrancar si no se ha definido
una particin activa o si, habindose definido,
la particin no es arrancable (no contiene un
sistema operativo).
Sistemas de Archivos
No es posible crear ms de cuatro
particiones primarias. Este lmite,
ciertamente pequeo, se logra subsanar
mediante la creacin de una particin
extendida (como mximo una).
Esta particin ocupa, al igual que el resto
de las particiones primarias, una de las
cuatro entradas posibles de la tabla de
particiones.
Sistemas de Archivos
Dentro de una particin extendida se
pueden definir particiones lgicas
sin lmite. El espacio de la particin
extendida puede estar ocupado en su
totalidad por particiones lgicas o
bien, tener espacio libre sin
particionar.
Sistemas de Archivos
Mtodos de acceso en los sistemas
de archivos
Los mtodos de acceso se refiere a las
capacidades que el subsistema de
archivos provee para accesar datos
dentro de los directorios y medios de
almacenamiento en general.
Sistemas de Archivos
Mtodos de acceso en los sistemas
de archivos
Se ubican tres formas generales:
Acceso secuencial
Acceso directo
Acceso directo indexado.
Sistemas de Archivos
Mtodos de acceso en los sistemas
de archivos
Acceso secuencial:
Es el mtodo ms lento y consiste en
recorrer los componentes de un archivo uno
en uno hasta llegar al registro deseado. Se
necesita que el orden lgico de los registros
sea igual al orden fsico en el medio de
almacenamiento.
Este tipo de acceso se usa comnmente en cintas
y cartuchos.
Sistemas de Archivos
Mtodos de acceso en los sistemas
de archivos
Acceso directo:
Permite accesar cualquier sector o registro
inmediatamente, por medio de llamadas al
sistema como la de seek(mtodo de
bsqueda).
Este tipo de acceso es rpido y se usa
comnmente en discos duros y discos o archivos
manejados en memoria de acceso aleatorio.
Sistemas de Archivos
Mtodos de acceso en los sistemas
de archivos
Acceso directo indexado:
Este tipo de acceso es til para grandes
volmenes de informacin o datos.
Sistemas RAID
RAID (Redundant array of independent
disks):
Utiliza un esquema de discos paralelos
que el sistema operativo los trata como si
fuera un solo disco lgico.
La idea es aumentar por una parte el
desempeo en la transferencia de datos y
por otra parte la fiabilidad de los datos
introduciendo informacin redundante.
RAID 0
Raid 0 : Data Stripping without parity (DSA)
Datos en banda de discos sin paridad sin correccin de errores.
Este nivel no incorpora redundancia de datos . Es el nivel de Raid
que brinda mejor rendimiento en escritura y lectura, sin
proporcionar tolerancia a fallas. No obstante almacena y recupera
los datos con mayor rapidez que el almacenamiento de datos en
serie en un nico disco, gracias al empleo de una tcnica
denominada distribucin de datos que mejoran la velocidad de
transferencia del disco. La distribucin de datos dividen los datos
en segmentos que se transfieren a distintas unidades de disco. Su
inconveniente es que no se resuelve el problema de la fiabilidad,
pues los datos no se almacenan de manera redundante.
Este tipo de arreglo utiliza una tcnica llamada Striping, la cual
distribuye la informacin en bloques entre los diferentes discos.
Se requieren como mnimo dos discos.
RAID 0
Ventajas
Proporcionan un alto rendimiento
No tiene un costo adicional
Toda la capacidad del disco se emplea
Permite acceder a mas de un disco a la vez, logrando una tasa de
transferencia mas elevada y un rpido tiempo de acceso.
Inconvenientes
No es verdaderamente un disco Raid ya que no tienen integridad
de datos.
Un error en uno de los discos implica la perdida total de los datos
Ambiente en donde implementarlo
Es una buena alternativa en sistemas en donde sea mas
importante el rendimiento que la seguridad de los datos es decir
ambientes que puedan soportar una perdida de tiempo de
operacin para poder reemplazar el disco que falle y reponer toda
la informacin.
RAID 1
Raid 1 : Mirrored Disk Array (MDA)
Conjunto de discos en espejo
La configuracin de nivel 1 de Raid o disco en espejo incluye dos
unidades de disco:
1 unidad de datos y una unidad de replica. Cuando se describen
datos en una unidad, tambin se escriben en la otra. El disco
redundante es una rplica exacta del disco de datos, por lo que se
conoce tambin como disco espejo. Los datos pueden leerse de
cualquiera de las 2 unidades de forma que si se avera la unidad
de datos es posible acceder a la unidad de replica, con lo que el
sistema puede seguir funcionando. Con el nivel de Raid se obtiene
la misma velocidad de lectura/ escritura que una configuracin
normalizada de disco, por lo que constituye la mejor opcin para
aplicaciones que conllevan un gran nmero de operaciones de
escritura.
Su principal inconveniente es el costo que supone multiplicar el
numero de discos necesarios para los datos desaprovechando la
mitad de la capacidad total del conjunto del disco. Es el mejor en
ambientes que necesitan un alto rendimiento de lectura.
Ventajas
Mayor rendimiento en las lecturas de datos en las lecturas
convencionales.
Podemos recuperar todos los datos en caso de error en unos de
los discos ya que si un disco suspende la operacin el otro
continua disponible.
inconvenientes
Bastante caro ya que necesitamos el doble de espacio que el
necesario.
Moderada lentitud en la escritura de datos ya que la hemos de
escribir en dos localizaciones
Ambientes en donde implementarlos
Raid1 esta diseado para sistemas en donde la disponibilidad de
informacin es esencial y su reemplazo resultara difcil y costoso
(mas costoso que reponer el disco en si)
Tpico en escrituras aleatorias pequeas con tolerancia a fallas. El
problema de este tipo de arreglos es el costo que implica duplicar
el disco
RAID 5
RAID 5 : Independent Disk Array
Sistemas de discos independientes con integracin de
cdigo de error mediante una paridad
En RAID 5 los datos y una paridad son guardados en los
mismos discos por lo que conseguimos aumentar la
velocidad de demanda , ya que cada disco puede satisfacer
una demanda independiente de los dems. Con diferencia
con el RAID 3 , el RAID 5 guarda la paridad del dato dentro
de los discos y no hace falta un disco para guardar dichas
paridades En el nivel 5 de Raid las unidades de disco actan
independientemente , cada unidad es capaz de atender a
sus propias operaciones de Lectura/Escritura ,lo que
aumenta el numero de operaciones de entrada salida
simultanea .Esta caracterstica mejora considerablemente el
tiempo de acceso , especialmente con mltiples peticiones
de pequeas operaciones de entrada salida .
RAID 5
El nivel 5 de Raid asegura un mejor rendimiento de
operaciones de entrada salida para aplicaciones en la que el
sistema realiza bsqueda aleatorias de muchos ficheros
pequeos como sucede en las aplicaciones transaccionales
, ofrece la posibilidad de soportar mltiples operaciones de
escritura de forma que los datos pueden escribirse en un
disco y su formacin de paridad en otro .En este nivel no
existe una unidad delicada para paridad sino que el
controlador intercala los datos y las paridad en todo los
discos del subsistemas .El inconveniente de este nivel es
que presenta una operacin adicional de escritura al
almacenar los datos ya que tanto los datos como la
informacin de actualidad se actualizan en operaciones
distintas y en unidades de disco diferentes. Las
aplicaciones implican numerosas operaciones de escritura y
sufren descensos en el rendimiento .
RAID 5
Ventajas
Alto rendimiento en aplicaciones de velocidad de demanda
interactiva
Costo efectivo .No desaprovecha un disco exclusivamente
para paridad .
Se pueden recuperar datos
Inconvenientes
El rendimiento en las escrituras de datos es bajo
No aumenta el rendimiento en las aplicaciones , aunque la
velocidad de transferencia de datos es alta .
Ambiente donde implementarlo
Es recomendable para aplicaciones intensas de entrada
salidas y lectura escritura , tal como procesamiento de
transacciones.
Actualmente existen otros sistemas
RAID, como por ejemplo:
RAID 3
RAID 10
RAID 30
RAID 50,
Entre otros.