• Tolérance aux pannes

    1. introduction

      1. analyse de l'échec du vol inaugural d'Ariane 5

        1. ariane5.pdf

    2. gestion des pannes

      1. tout peut tomber en panne

        1. matériel/logiciel

        2. réseau

        3. causes

          1. usure

          2. bugs

            1. système mal testé

            2. précipitation dans mise sur le marché

          3. humaines

          4. environnementales

      2. pannes inévitables

        1. nombreux sous-systèmes indépendants

      3. deux aspects

        1. tolérance aux pannes

          1. éviter les comportements incorrects

          2. transactions

        2. haute disponibilité

          1. éviter les interruptions de service

          2. importance de la détection rapide des pannes

      4. modèles de pannes

        1. panne-arrêt

          1. assez facile à gérer

          2. pas réaliste

        2. ralentissement

          1. quelques algorithmes existent

        3. pannes bizantines

          1. très difficiles à gérer

      5. permanence des effets

        1. permanentes

          1. disponibilité

            1. MTBF/(MTBF+MTTR)

        2. transitoires

          1. dans circonstances peu probables

          2. relacer la machine/le service

      6. traitement

        1. actions

          1. détection

          2. confinement

          3. masquage

        2. vue en couches

          1. panne = comportement exceptionnel dans une couche

          2. transformer en événement attendu pour couche supérieure

          3. rendre invisible pour autres couches

        3. technique matérielle

          1. redondance triple modulaire

          2. vote sur 3 systèmes

          3. protéger le système de vote

            1. le + simple possible

            2. sur machine fiabilisée

        4. réplication

    3. reprise après panne

      1. après panne et réparation

        1. récupération état

      2. techniques

        1. points de passage

          1. enregistrement stable de l'état

        2. journalisation

          1. enregistrement stable des messages reçus

        3. retour en arrière

          1. des autres

          2. pour revenir à un état consistant

            1. ligne de reprise

      3. problèmes

        1. existence d'une ligne de reprise

          1. points de passage

        2. retrouver la meilleure

          1. retour en arrière

        3. difficultés

          1. messages

            1. orphelins

            2. dupliqués

          2. retours en arrière en cascade

          3. bégaiement

      4. choix

        1. journaliser ou non les messages reçus

          1. flexibilité pendant récupération

          2. coût de stockage

          3. déterminisme des processus nécessaire

        2. coordination de l'enregistrement de l'état

      5. algorithmes

        1. checkpoint sans coordination

          1. pas de garantie

          2. espoir que les retours en arrières seront

            1. peu fréquents

            2. limités

        2. checkpoint avec coordination

          1. possibilité de panne pendant enregistrement

          2. ramasse-miette

            1. matrices d'estampilles

          3. checkpoint incrémental

        3. journalisation synchrone

          1. avec coordination

          2. enregistrement messages avant délivrance

          3. récupération = rejouer les messages

          4. délais peuvent être inacceptables

        4. journalisation asynchrone

          1. sans coordination

          2. journalisation n'importe quand

          3. questions

            1. trouver ligne de reprise

            2. quand peut-on effacer vieux messages ?

          4. seuls messages permettant récupération doivent être enregistré

            1. journalisation adaptative

    4. réplication

      1. services

        1. état ?

          1. modélisation avec machine à états

            1. indépendance au temps

          2. tolérance à n pannes

            1. n+1 répliques

            2. reçoivent toutes

              1. mêmes entrées

              2. dans même ordre

            3. + vote

              1. doit être fiable

            4. respecter au moins causalité

          3. +

            1. modèle conceptuel

            2. masque vote

              1. indiscernable d'une seule machine

          4. -

            1. trop coûteux

        2. primaire/secours

          1. principe

            1. communication avec primaire

            2. secours prend relai en cas de panne

          2. +

            1. simplicité

            2. performance

          3. -

            1. que faire si primaire donne un mauvais résultat ?

            2. des requêtes peuvent être perdues

          4. protocoles

            1. nécessités

              1. 1 seul primaire à un moment donné

              2. 1 seul primaire pour chaque client

              3. interruptions de service bornées

              4. requêtes traitées seulement sur primaire

            2. battements de coeur

        3. Pacemaker

      2. ressources

        1. lesquelles ?

          1. mémoire

          2. fichiers

          3. bases de données

        2. options de gestion

          1. lecture

            1. d'un serveur primaire

            2. de n'importe que serveur

            3. d'un quorum

          2. écriture

            1. sur le primaire

            2. sur tous

              1. mis à jour atomique

            3. sur tous les disponibles

            4. sur un quorum

            5. propagation lente

          3. stratégies de réplication

            1. lit d'un / écrit sur tous

              1. sérialisation

              2. pas de concurrence

            2. lit d'un / écrit sur tous les disponibles

              1. plus de sérialisation

              2. en cas de panne

            3. lit d'un quorum / écrit sur un quorum

              1. bon compromis

            4. lit d'un / propagation lente

              1. haute disponibilité

              2. en cas de probabilité de pannes élevée

              3. utiliser des vecteurs d'estampilles pour garantir causalité

        3. options avec migration

          1. possibilités lecture/écriture

            1. accès distant

            2. migration

            3. réplication

          2. stratégies

            1. serveur distant

              1. accés distant en lecture et en écriture

            2. serveur dynamique

              1. migration en lecture et en écriture

            3. lecture réplication / écriture migration

              1. choix populaire

              2. sémantique claire

              3. consistence forte

            4. lecture réplication / écriture réplication

              1. consistence forte difficile

              2. possibilité d'utiliser validation à deux phases

  • All Comments ( 0 )

    Tolérance aux pannes

    Added: 2009-11-17 16:56:28

    From: pboulet (Joined 2008-11-14 04:42:03)

    534 views |26 downloads

    Tolérance aux pannes

    More From: pboulet

    Outils du doctorant
    Outils du doctorant
    2011-10-20 13:53:11|174 views
    SoC Design
MoCC
    SoC Design MoCC
    2010-05-28 09:39:59|24 views
    Problématique des
systèmes embarqués
    Problématique des systèmes embarqués
    2010-03-17 15:54:26|68 views
    Join-Calculus
    Join-Calculus
    2010-03-17 15:54:06|68 views
    Sécurité
    Sécurité
    2009-12-01 11:51:06|455 views
    Tolérance aux pannes
    Tolérance aux pannes
    2009-11-17 16:56:28|534 views
    Support noyau
    Support noyau
    2009-11-10 13:19:47|495 views
    Ordonnancement
    Ordonnancement
    2009-11-03 13:21:54|2162 views
    Synchronisation
    Synchronisation
    2009-10-20 12:06:43|1836 views
    SoC Design
MoCC
    SoC Design MoCC
    2009-10-19 09:46:40|199 views
    Communication 2/2
    Communication 2/2
    2009-10-13 08:13:09|779 views
    Communication 1/2
    Communication 1/2
    2009-10-06 13:04:35|2164 views
    Concepts fondamentaux
    Concepts fondamentaux
    2009-10-06 07:41:00|680 views
    MUG 22 Sept 2009
    MUG 22 Sept 2009
    2009-09-22 16:18:26|3766 views
    Problématique des
systèmes embarqués
    Problématique des systèmes embarqués
    2009-02-17 05:53:52|547 views
    Intervention
DaRT
AERES
    Intervention DaRT AERES
    2009-02-11 06:52:29|90 views