THEMATIQUES SCIENTIFIQUES

Deux principales thématiques complémentaires sont abordées au LIM&BIO:

  • Extraction & Représentation de Connaissances (ERC)
    Exploration, extraction, représentation et modalités d’utilisation des connaissances médicales et des données du patient pour les systèmes interactifs d’aide à la décision en Santé.
  • Abstraction & Apprentissage Automatique (A3)
    Apprentissage automatique et abstraction pour l'extraction de connaissances bio-médicales

Thématique ERC

Le fonctionnement des systèmes d’aide à la décision en santé repose sur des bases de connaissances et la prise en compte de données du patient et éventuellement d’autres acteurs. La construction de bases de connaissances résulte de plusieurs étapes pour lesquelles nous essayons de faire progresser la méthodologie. Il est primordial de concevoir des méthodes destinées à l’exploration du contenu de corpus de textes médicaux écrits en langage naturel éventuellement très volumineux comme par exemple l’ensemble des résumés des caractéristiques produits des médicaments. Des méthodes de représentation et de codage de ces connaissances doivent être conçues pour en permettre une utilisation conjointe avec les données du patient exprimées en langage naturel ou représentées et codées à l’aide des grandes classification et systèmes terminologiques. Enfin la constitution et la maintenance de ces bases peut être grandement facilitée par la mise au point de méthodes d’extraction automatique de ces connaissances.
Les données du patient telles que celles stockées dans les dossiers informatisés doivent pouvoir être saisies de manière ergonomique et représentées et codées avec un niveau de granularité et d’abstraction de l’information adapté aux fonctionnalités recherchées dans les systèmes d’aide à la décision. La mise au point de méthode permettant l’exploitation des données saisies en langage naturel par le médecin représente aussi un enjeu important.

Thématique A3: Abstraction et Apprentissage Automatique

La capacité à adapter sa représentation en fonction de la tâche à résoudre —reconnue comme étant au cœur de l’intelligence humaine— est l’un des problèmes fondamentaux de l’Intelligence Artificielle. Cette capacité est essentielle tant pour réduire la complexité algorithmique que pour permettre aux systèmes de se focaliser sur les informations pertinentes. L’approche générale sur laquelle nous nous basons consiste à combiner abstractions (changement de la granularité des connaissances dans un même formalisme) et reformulation (changement de formalisme de représentation). En apprentissage automatique, il existe aujourd'hui une large panoplie d'algorithmes permettant d'apprendre des hypothèses dans des langages plus ou moins expressifs avec des complexités qui peuvent atteindre la linéarité avec le nombre d'exemples et plus faible que quadratique avec le nombre d'attributs. Un des enjeux de l'apprentissage sur lequel nous nous penchons est celui de l'apprentissage à partir de peu d'exemples et de nombreux attributs, cas typiquement rencontré dans le traitement des puces à ADN. Nous avons utilisé les changements de représentations avec un relatif succès dans plusieurs tâches d’apprentissage dans les domaines de : la généralisation cartographique, l’apprentissage situé de l’ancrage dans un robot autonome, l’apprentissage non-supervisé de caractères chinois, l’analyse de profils d’expressions de gènes impliqués dans l’obésité, l’aide à la découverte en physique granulaire, etc.

Aujourd'hui les axes de cette thématique s'articulent autour de:

  1. Changement de représentation particuliers: la sélection d'attributs (par des approches "Wrapper" ou "Filter"), discrétisation d'attributs numériques, stratification d'exemples, et représentation explicite des flux de transformation (abtraction et reformulation).
  2. Langage de représentations particuliers: la représentation multi-instances qui offre un bon compromis entre expressivité et complexité des algorithmes associés.
  3. Des algorithmes d'apprentissages tant supervisés sur des données multi-instances que non supervisés en particulier sur des données numérico-symboliques (algorithmes de regroupement conceptuel et de recherche de règles d'associations).
  4. Des mesures d'évaluations des algorithmes d'apprentissage adaptées aux applications médicales (ajustement multiples des p-value, combinaison de mesures de qualité, FDR, FNR, etc.)
Side nav buttonsContactPubPROJETSEQUIPESAbout
Présentation l Acces l Thématiques l Publications l Projets l Sommaire
Nb. de visites depuis le 01/01/2003 Dernière Mise à Jour : jeudi 17 mars 2005