Clase 17/10 - 24/10


Almacenamiento (RAID)

Hace referencia a un sistema de almacenamiento de datos que utiliza múltiples unidades de almacenamiento de datos (discos duros o SSD) entre los que se distribuyen o replican los datosDe todas maneras, aunque compremos el mejor disco del mercado, nada nos garantiza que no haya a tener algún problema o falla que pueda poner en riesgo nuestra información. Por ese motivo se utiliza un sistema de protección que usa varios disco duros y se denomina “Raid” (redundant array of independent disks) lo que significa arreglos redundantes de disco independientes.Además de proveer tolerancia a fallos, se utiliza para brindar un mejor rendimiento que se logra a partir de la escritura en varios disco al mismo tiempo. El arreglo de disco se puede realizar tanto por hardware con controlador Raid como por software, y existen varios varios tipos de Raid según como se realiza. Dependiendo de su configuración (a la que suele llamarse nivel), los beneficios de un RAID respecto a un único disco son uno o varios de los siguientes: mayor integridadtolerancia frente a fallostasa de transferencia y capacidad. En sus implementaciones originales, su ventaja clave era la habilidad de combinar varios dispositivos de bajo coste y tecnología más antigua en un conjunto que ofrecía mayor capacidad, fiabilidad, velocidad o una combinación de éstas que un solo dispositivo de última generación y coste más alto.

Existen entonces varios tipos de Raid, en cada uno de ellos se adecua a diferentes necesidades y recursos:




  • RAID 0: Este arreglo nos sirve para proteger los datos dado que no tiene tolerancia a fallas (no guarda datos de forma redundante). Su utilidad es permitir una velocidad más alta en operaciones de escritura y lectura, porque utiliza más de un disco a la vez. Es muy útil para sistema que realizan muchas operaciones con archivos grandes, pero no se utiliza en servidores. Requiere como mínimo 2 disco para implementarse.

    • RAID 1: Este Raid utiliza dos disco de igual tamaño y duplica toda la información en ambos, es decir un disco es el espejo del otro. Aunque esto provee un mecanismo muy seguro para resguardar los datos, su desventaja es que utiliza mucho espacio para almacenar todo duplicado. Necesita como mínimo dos disco para implementarse, y pueden utilizarse varios pares de disco espejados. El espacio disponible de este arreglo sera la mitad de la capacidad total de disco que utilicemos para armarlo.
    • RAID 2: Este nivel de Raid separa la información en bits que escribe en cada disco y además utiliza disco adicionales para almacenar un código de corrección de errores. Puede reparar información dañada mediante código E.C.C (Error Correction Code), que es almacenado con un método llamado Hamming.
    • RAID 3:Este Raid usa un disco de comprobación (denominado de paridad) para cada arreglo de disco. Divide en partes los bloques de información, las escribe en paralelo, y graba en ese disco de paridad una información que puede ser recuperada en caso de fallas. Utiliza como mínimo 3 unidades de disco.


    • RAID4: Este Raid es similar al 3, pero en el lugar de dividir los bloques en partes para escribirlos, los envía completo a cada disco, y también guarda información de paridad en disco adicional. Necesita un mínimo de 3 disco para su implementación.

    • RAID 5: Este Raid almacena la información en bloque y guarda información de paridad, pero la diferencia de los anteriores no utiliza un disco especial para hacerlo sino que va guardando ese dato en todos los discos. Esto evita si es que se arruina el disco de paridad, resulte imposible recuperar la información. Para implementarlo se requiere como mínimo 3 discos. En comparación con el nivel 1, en caso de falla es mas difícil recuperar la información, pero no se desaprovecha tanto espacio. La capacidad total que se obtiene con este arreglo es la suma de la capacidad de todos los volúmenes menos el equivalente a -1. Este tipo de Raid es el mas utilizado ya que probé tolerancia a fallas y mejora la performance de operaciones de lectura y escritura.



    • RAID 6: Este nivel de raid es básicamente igual a nivel 5, pero con información de paridad adicional que provee tolerancia a fallas, frente a la falla de los discos en simultáneo. Requiere un mínimo de 4 discos y no es uno de los sistemas Raid originales. Este sistema tiene doble información de paridad, por lo que es ideal para utilizarlo con información crítica
    • RAID 0+1: Un RAID 0+1 o RAID 01, es un RAID usado para replicar y compartir datos entre varios discos.
      Como puede verse en el diagrama, primero se crean dos conjuntos RAID 0 (dividiendo los datos en discos) y luego, sobre los anteriores, se crea un conjunto RAID 1 (realizando un espejo de los anteriores). La ventaja de un RAID 0+1 es que cuando un disco duro falla, los datos perdidos pueden ser copiados del otro conjunto de nivel 0 para reconstruir el conjunto global. Sin embargo, añadir un disco duro adicional en una división, es obligatorio añadir otro al de la otra división para equilibrar el tamaño del conjunto.
      Además, el RAID 0+1 no es tan robusto como un RAID 1+0, no pudiendo tolerar dos fallos simultáneos de discos salvo que sean en la misma división. Es decir, cuando un disco falla, la otra división se convierte en un punto de fallo único. Además, cuando se sustituye el disco que falló, se necesita que todos los discos del conjunto participen en la reconstrucción de los datos.

    • RAID 1+0: Un RAID 1+0, a veces llamado RAID 10, es parecido a un RAID 0+1 con la excepción de que los niveles RAID que lo forman se invierte: el RAID 10 es una división de espejos.
      En cada división RAID 10 o RAID 0+1 pueden fallar todos los discos salvo uno sin que se pierdan datos. Sin embargo, si los discos que han fallado no se reemplazan, el restante pasa a ser un punto único de fallo para todo el conjunto. Si ese disco falla entonces, se perderán todos los datos del conjunto completo. Como en el caso del RAID 0+1, si un disco que ha fallado no se reemplaza, entonces un solo error de medio irrecuperable que ocurra en el disco espejado resultaría en pérdida de datos.
      Debido a estos mayores riesgos del RAID 1+0, muchos entornos empresariales críticos están empezando a evaluar configuraciones RAID más tolerantes a fallos que añaden un mecanismo de paridad subyacente. Entre los más prometedores están los enfoques híbridos como el RAID 0+1+5 (espejo sobre paridad única) o RAID 0+1+6 (espejo sobre paridad dual).
      El RAID 10 es a menudo la mejor elección para bases de datos de altas prestaciones, debido a que la ausencia de cálculos de paridad proporciona mayor velocidad de escritura.
    • RAID 5 0:  Un RAID 50, a veces llamado también RAID 5+0, combina la división a nivel de bloques de un RAID 0 con la paridad distribuida de un RAID 5, siendo pues un conjunto RAID 0 dividido de elementos RAID 5.
      Un disco de cada conjunto RAID 5 puede fallar sin que se pierdan datos. Sin embargo, si el disco que falla no se reemplaza, los discos restantes de dicho conjunto se convierten en un punto único de fallo para todo el conjunto. Si uno falla, todos los datos del conjunto global se pierden. El tiempo necesario para recuperar (detectar y responder al fallo de disco y reconstruir el conjunto sobre el nuevo disco) representa un periodo de vulnerabilidad del conjunto RAID.
      La configuración de los conjuntos RAID repercute sobre la tolerancia a fallos general. Una configuración de tres conjuntos RAID 5 de siete discos cada uno tiene la mayor capacidad y eficiencia de almacenamiento, pero sólo puede tolerar un máximo de tres fallos potenciales de disco. Debido a que la fiabilidad del sistema depende del rápido reemplazo de los discos averiados para que el conjunto pueda reconstruirse, es común construir conjuntos RAID 5 de seis discos con un disco de reserva en línea (hot spare) que permite empezar de inmediato la reconstrucción en caso de fallo del conjunto. Esto no soluciona el problema de que el conjunto sufre un estrés máximo durante la reconstrucción dado que es necesario leer cada bit, justo cuando es más vulnerable. Una configuración de siete conjuntos RAID 5 de tres discos cada uno puede tolerar hasta siete fallos de disco pero tiene menor capacidad y eficiencia de almacenamiento.
      El RAID 50 mejora el rendimiento del RAID 5, especialmente en escritura, y proporciona mejor tolerancia a fallos que un nivel RAID único. Este nivel se recomienda para aplicaciones que necesitan gran tolerancia a fallos, capacidad y rendimiento de búsqueda aleatoria.
      A medida que el número de unidades del conjunto RAID 50 crece y la capacidad de los discos aumenta, el tiempo de recuperación lo hace también.

    Comentarios

    Entradas populares de este blog

    TP-N2

    Clase 19/09/2017