UF3-NF1. Introducció als sistemes d'alta disponibilitat

De Wiki IES Marianao. Departament Informàtica
La revisió el 11:53, 2 març 2012 per Alex (Discussió | contribucions) (Sistemes redundants)

Dreceres ràpides: navegació, cerca

tornar Introducció als sistemes d'alta disponibilitat

Alta disponibilitat, HA

L'alta disponibilitat fa referència a garantir que un sistema està accessible (disponible) sempre, excepte moments puntual. A vegades també s'anomena 24x7.

El temps que no es troba actiu s'anomena temps d'inactivitat (outage), i tendeix a minimitzar-se

Aquests temps d'inactivitat poden ser:

  • Planejats, manteniment, actualització.
  • No planejats, falles del sistema

Normalment s'expressa amb el percentatge de temps acceptable d'activitat. Exemples de mesures (Percentatges de 9), temps màxim

  • 99 % (two nines) --> 15 minuts al dia. Equips d'oficina
  • 99,9% (three nines)
  • 99,999% (five nines) --> un segon al dia. Sistemes crítics

Evidentment el cost augmenta en proporció.

Per aconseguir implementar un sistema HA, cal aplica tècniques concretes per aconseguir aquesta disponibilitat sense intervenció humana.

Tolerància a falles

La tolerància a falles consisteix en que en cas d'errada el sistema no interromp el seu funcionament (p.e. RAID).

Els sistemes d'alta disponibilitat utilitzen tècniques per detectar els errors de maquinari o programari i redirigir el servei per garantir la disponibilitat automàticament (sense intervenció de l'usuari, failover). Per exemple mantenint un sistema de recolzament sincronitzat i inactiu.

El procés de recuperar el sistema i retornar el servei a la seva ubicació original s'anomena failback.

Balanç de càrrega (load balance)

En general el balanç de càrrega és una tècnica que distribueix el treball entre múltiples recursos: ordinadors, un cluster, connexions de xarxa, cpu's, discos, etc...

Els objectius són:

  • Optimitzar l'ús dels recursos
  • Maximitzar el rendiment
  • Minimitzar el temps de resposta
  • Evitar la sobrecàrrega

Es pot implementar

  • Programari, LVS Linux Virtual Server

Sistemes redundants

Un sistema redundant consisteix en múltiples rèpliques dels recursos, ja sigui hardware, software o dades.

Es tracta d'evitar “Single point of failure”

Aquestes rèpliques poden estar incorporats en una mateixa màquina o distribuïts en varis nodes.

Redundància local

  • Discs, RAID
  • Xarxa, ethernet bonding. Dues targetes per garantir una única connexió i ampliar-ne la capacitat
  • Entrada de corrent (Fonts d'alimentació redundants + UPS)

http://es.wikipedia.org/wiki/Archivo:PC-Netzteil_%28redundant%29.jpg

Redundància distribuïda

  • Dades
    • Compartides, múltiples nodes accedeixen a les mateixes dades
    • Sincronitzades, existeix una còpia (sincronitzada) de les dades que s'activa en cas de falla de
    • Distribuïdes, les dades es distribueixen entre vars nodes
  • Components de xarxa
    • Routers, switchs. Aplicant tècniques com bonding o spannning tree
    • Línies de dades WAN
  • Servidors
    • Vàries màquines ofereixen el mateix servei, apliquen tècniques com heartbeat o load balance.