RTP 19 : Systèmes
embarqués complexes ou contraints
en collaboration avec le RTP 5 : Systèmes répartis
Observation et
supervision de systèmes complexes, répartis et dynamiques
(OSS-CR)
Claude Jard (IRISA/ENS-Cachan,
Rennes) & Jean-Bernard Stefani (LSR/INRIA-RA, Grenoble)
Prospective
La problématique scientifique que nous souhaitons explorer dans
le cadre du travail de prospective confiée à l’action est
la vision futuriste de l’auto-gestion des systèmes
répartis et réseaux (« self-management » en
anglais). Avec l'avènement d'une informatique ubiquitaire,
commande et administration de systèmes prennent une importance
cruciale.
En effet, compte tenu des niveaux de complexité, des temps et
des échelles de réaction impliqués, ces fonctions
ne pourront être mises en œuvre avec le seul moyen de
« l’humain dans la boucle ». D'où l’enjeu que
constitue la mise en place d'infrastructures auto-administrables,
auto-reconfigurables, et, dans la mesure du possible,
auto-réparables, tout en offrant des garanties de
sûreté et de qualité dans leur comportement et les
services offerts.
Plus précisément, dans cette direction, nous centrerons
notre réflexion sur le questionnement scientifique suivant :
Comment concevoir un observateur
(outil capable d'inférer l'état d'un système
à partir des observations disponibles) pour un système
distribué, asynchrone, ouvert, reconfiguré dynamiquement,
et de taille gigantesque ?
Les verrous scientifiques sont multiples :
La dynamicité : les caractéristiques, la
configuration et la charge des systèmes concernés ne sont
pas fixées à l'avance et peuvent évoluer au cours
du temps (nouveaux éléments ajoutés ou
enlevés dynamiquement, mobilité physique et logique,
occurrences de pannes).
La répartition : les systèmes visés
impliquent plusieurs éléments interconnectés,
géographiquement dispersés, et doivent être
conçus comme des collections de domaines de ressources et
d'administration autonomes.
La multi-échelle : les systèmes visés
comportent des éléments de traitement, de stockage et de
communication de l'information caractérisés par des
capacités très variables et mobilisables à des
échelles différentes (hiérarchies de
réseaux de processeurs et de nœuds de stockage).
L’extrême irrégularité : les systèmes
visés se caractérisent par une très forte
hétérogénéité de leurs
éléments et de leurs modes d'organisation; ils comportent
des éléments aux capacités et aux fonctions
très diverses, accessibles à des conditions et en
fonction de politiques d'accès multiples et en constante
évolution.
L’intérêt du travail de prospective de l’action se
situe clairement dans le traitement conjoint des aspects «
observation » (système) et « supervision/diagnostic
» (algorithme). Les fonctions d'observation et de supervision
sont des fonctions de base de la commande et de l'administration,
intervenant dans toutes les fonctions de gestion standards
(configurations, performances, fautes, sécurité, et
coûts). En présence de systèmes aussi complexes que
les grands systèmes répartis, l'observation ne saurait
être découplée de fonctions de diagnostic et
d'analyse permettant de caractériser l'état d'un
système.
L’action devra émettre des
propositions pour essayer de combler le fossé actuel entre
les recherches sur le “contenant” (architecture système,
composants logiciels) et celles sur le “contenu” (algorithmes de
diagnostic et supervision, généralement
fondés sur des modèles formels).