|
 |
 |
|
THEMATIQUES SCIENTIFIQUES
|
Deux principales thématiques complémentaires sont abordées au LIM&BIO:
- Extraction & Représentation de Connaissances (ERC)
Exploration, extraction, représentation et modalités dutilisation des connaissances médicales et des données du patient pour les systèmes interactifs daide à la décision en Santé.
- Abstraction & Apprentissage Automatique (A3)
Apprentissage automatique et abstraction pour l'extraction de connaissances bio-médicales
Thématique ERC
Le fonctionnement des systèmes daide à la décision en santé repose sur des bases de connaissances et la prise en compte de données du patient et éventuellement dautres acteurs. La construction de bases de connaissances résulte de plusieurs étapes pour lesquelles nous essayons de faire progresser la méthodologie. Il est primordial de concevoir des méthodes destinées à lexploration du contenu de corpus de textes médicaux écrits en langage naturel éventuellement très volumineux comme par exemple lensemble des résumés des caractéristiques produits des médicaments. Des méthodes de représentation et de codage de ces connaissances doivent être conçues pour en permettre une utilisation conjointe avec les données du patient exprimées en langage naturel ou représentées et codées à laide des grandes classification et systèmes terminologiques. Enfin la constitution et la maintenance de ces bases peut être grandement facilitée par la mise au point de méthodes dextraction automatique de ces connaissances.
Les données du patient telles que celles stockées dans les dossiers informatisés doivent pouvoir être saisies de manière ergonomique et représentées et codées avec un niveau de granularité et dabstraction de linformation adapté aux fonctionnalités recherchées dans les systèmes daide à la décision. La mise au point de méthode permettant lexploitation des données saisies en langage naturel par le médecin représente aussi un enjeu important.
Thématique A3: Abstraction et Apprentissage Automatique
La capacité à adapter sa représentation en fonction de la tâche à résoudre reconnue comme étant au cur de lintelligence humaine est lun des problèmes fondamentaux de lIntelligence Artificielle. Cette capacité est essentielle tant pour réduire la complexité algorithmique que pour permettre aux systèmes de se focaliser sur les informations pertinentes. Lapproche générale sur laquelle nous nous basons consiste à combiner abstractions (changement de la granularité des connaissances dans un même formalisme) et reformulation (changement de formalisme de représentation). En apprentissage automatique, il existe aujourd'hui une large panoplie d'algorithmes permettant d'apprendre des hypothèses dans des langages plus ou moins expressifs avec des complexités qui peuvent atteindre la linéarité avec le nombre d'exemples et plus faible que quadratique avec le nombre d'attributs. Un des enjeux de l'apprentissage sur lequel nous nous penchons est celui de l'apprentissage à partir de peu d'exemples et de nombreux attributs, cas typiquement rencontré dans le traitement des puces à ADN. Nous avons utilisé les changements de représentations avec un relatif succès dans plusieurs tâches dapprentissage dans les domaines de : la généralisation cartographique, lapprentissage situé de lancrage dans un robot autonome, lapprentissage non-supervisé de caractères chinois, lanalyse de profils dexpressions de gènes impliqués dans lobésité, laide à la découverte en physique granulaire, etc.
Aujourd'hui les axes de cette thématique s'articulent autour de:
- Changement de représentation particuliers: la sélection d'attributs (par des approches "Wrapper" ou "Filter"), discrétisation d'attributs numériques, stratification d'exemples, et représentation explicite des flux de transformation (abtraction et reformulation).
- Langage de représentations particuliers: la représentation multi-instances qui offre un bon compromis entre expressivité et complexité des algorithmes associés.
- Des algorithmes d'apprentissages tant supervisés sur des données multi-instances que non supervisés en particulier sur des données numérico-symboliques (algorithmes de regroupement conceptuel et de recherche de règles d'associations).
- Des mesures d'évaluations des algorithmes d'apprentissage adaptées aux applications médicales (ajustement multiples des p-value, combinaison de mesures de qualité, FDR, FNR, etc.)
|
|
|