UF3-NF1. Introducció als sistemes d'alta disponibilitat

tornar Introducció als sistemes d'alta disponibilitat

Contingut

1 Alta disponibilitat, HA

Alta disponibilitat, HA

L'alta disponibilitat fa referència a garantir que un sistema està accessible (disponible) sempre, excepte moments puntual. A vegades també s'anomena 24x7.

El temps que no es troba actiu s'anomena temps d'inactivitat (outage), i tendeix a minimitzar-se

Aquests temps d'inactivitat poden ser:

Planejats, manteniment, actualització.

No planejats, falles del sistema

Normalment s'expressa amb el percentatge de temps acceptable d'activitat. Exemples de mesures (Percentatges de 9), temps màxim

99 % (two nines) --> 15 minuts al dia. Equips d'oficina

99,9% (three nines)

99,999% (five nines) --> un segon al dia. Sistemes crítics

Evidentment el cost augmenta en proporció.

Per aconseguir implementar un sistema HA, cal aplica tècniques concretes per aconseguir aquesta disponibilitat sense intervenció humana.

Tolerància a falles

La tolerància a falles consisteix en que en cas d'errada el sistema no interromp el seu funcionament (p.e. RAID).

Els sistemes d'alta disponibilitat utilitzen tècniques per detectar els errors de maquinari o programari i redirigir el servei per garantir la disponibilitat automàticament (sense intervenció de l'usuari, failover). Per exemple mantenint un sistema de recolzament sincronitzat i inactiu.

El procés de recuperar el sistema i retornar el servei a la seva ubicació original s'anomena failback.

Balanç de càrrega (load balance)

En general el balanç de càrrega és una tècnica que distribueix el treball entre múltiples recursos: ordinadors, un cluster, connexions de xarxa, cpu's, discos, etc...

Els objectius són:

Optimitzar l'ús dels recursos

Maximitzar el rendiment

Minimitzar el temps de resposta

Evitar la sobrecàrrega

Es pot implementar

Maquinari (p.e. http://www.cisco.com/en/US/products/ps6906/index.html, http://www.sylcom.com/balanceador.htm)

Programari, LVS Linux Virtual Server

Sistemes redundants

Un sistema redundant consisteix en múltiples rèpliques dels recursos, ja sigui hardware, software o dades.

Es tracta d'evitar “Single point of failure”

Aquestes rèpliques poden estar incorporats en una mateixa màquina o distribuïts en varis nodes.

Redundància local

Discs, RAID

Xarxa, ethernet bonding. Dues targetes per garantir una única connexió i ampliar-ne la capacitat

Entrada de corrent (Fonts d'alimentació redundants + UPS)

http://es.wikipedia.org/wiki/Archivo:PC-Netzteil_%28redundant%29.jpg

Redundància distribuïda

Dades
- Compartides, múltiples nodes accedeixen a les mateixes dades
- Sincronitzades, existeix una còpia (sincronitzada) de les dades que s'activa en cas de falla de
- Distribuïdes, les dades es distribueixen entre vars nodes

Components de xarxa
- Routers, switchs. Aplicant tècniques com bonding o spannning tree
- Línies de dades WAN

Servidors
- Vàries màquines ofereixen el mateix servei, apliquen tècniques com heartbeat o load balance.

UF3-NF1. Introducció als sistemes d'alta disponibilitat

Contingut

Alta disponibilitat, HA

Tolerància a falles

Balanç de càrrega (load balance)

Sistemes redundants

Menú de navegació

Eines de l'usuari

Espais de noms

Variants

Vistes

Més

Cerca

Navegació

Eines