Thèses/Post-docs/CDD

De MIAT INRA
Aller à : navigation, rechercher

Thèses en cours

Algorithmes d'alignement de petits ARN

par Walid Ben-Saoud-Benjerri

  • Directeurs de thèse : Christine Gaspin & Matthias Zytnicki
  • Début de thèse : Novembre 2016
  • Ecole doctorale : MITT
  • Etablissement : INRA
  • Financement : INRA et Région

Méthodes approchées d'optimisation combinatoire en programmation mathématique. Application à la conception de vergers maraîchers

par Sara Maqrot

  • Directreur de thèse : Simon De Givry
  • Co-directeurs : Gauthier Quesnel & Marc Tchamitchian
  • Début de thèse : Octobre 2015
  • Ecole doctorale : MITT
  • Etablissement : Université Paul Sabatier (Toulouse III)
  • Financement : MITT

Intégration de données hétérogènes complexes à partir de tableaux de tailles déséquilibrées

par Alyssa Imbert

  • Directrices de thèse : Nathalie Villa-Vialaneix et Nathalie Viguerie (I2MC, INSERM)
  • Début de thèse : Novembre 2015
  • Ecole doctorale : MITT
  • Etablissement : Université Toulouse Capitole (Toulouse I)
  • Financement : 50% Methodomics - 50% région

Analyse de la dynamique évolutive de petits ARNs non-codants bactériens : mise au point d'une stratégie et application aux firmicutes

par Franck Cerutti

  • Directrices de thèse : Hélène Chiapello et Christine Gaspin
  • Début de thèse : Décembre 2014
  • Ecole doctorale : SEVAB
  • Etablissement : Université Paul Sabatier (Toulouse III)
  • Financement : 50% Inra - 50% région

Algorithm optimization for protein design

par Clément Viricel

  • Directeur de thèse : Thomas Schiex
  • Co-directeur : Sophie Barbe
  • Début de thèse : 1 Octobre 2014
  • Ecole doctorale : MITT
  • Etablissement : INRA
  • Financement : 50%INRA 50%Region

Apprentissage statistique pour l’intégration de données de sources et de natures multiples

par Jérôme MARIETTE

  • Directeur de thèse : Christine Gaspin
  • Co-directeurs : Nathalie Villa-Vialaneix
  • Début de thèse : Novembre 2013
  • Ecole doctorale : SEVAB
  • Etablissement : Université Paul Sabatier (Toulouse III)
  • Financement : salarié (Ingénieur d'Études MIA-T)

Post-Doctorants


Lise Pomiès

  • Responsables : Simon de Givry et Brigitte Mangin
  • Période : 10/17 à 10/19
  • Reconstruction d'un réseau de régulation de gènes liés à la sécheresse pour le tournesol (SUNRISE)


Clément CARRE

  • Responsables : Simon de Givry et Brigitte Mangin
  • Période : 05/17 à 07/17
  • Sélection de facteurs de transcription liés à la sécheresse pour le tournesol (SUNRISE)


Ludovic MALLET

  • Responsables : Héléne Chiapello et Thomas Schiex
  • Période : 06/16 à 11/17
  • Understanding the Human-Restricted Host Tropism of Typhoidal Salmonella (Sal Host Trop)

David SIMONCINI

  • Responsables : Sophie Barbe (LISBP), Thomas Schiex
  • Période : 09/16 à 12/17
  • Optimisation et design d'enzymes


Jessica DAVIES

  • Responsable : Thomas Schiex
  • Période : 04/13 à 08/13
  • Optimisation et design d'enzymes


Marti SANCHEZ

  • Responsables : Thomas Schiex & Simon de Givry
  • Période : 01/07/06 au 31/05/08
  • Contrat ANR Blanc STALDECOPT "Stratégies et algorithmes pour la décomposition et la résolution de problèmes d’optimisation sous contraintes"

 

Visiteurs étrangers

  • Barry Hurley, Data Insight Center, Irlande, 2 mois en 2014.
  • Fahiem BACCHUS, Université de Toronto, Canada,2 semaines en 2013.
  • Anastasia Paparrizou, Université of Western Macedonia. Grèce, une semaine en 2013.
  • Patrick MEYER, Université Libre de Bruxelles, Belgique. 3 semaines en 2011.
  • Patricia GUTIERREZ, Institut d'Intelligencia Artificial, CSIC, Barcelona, Espagne. 3 mois en 2011.
  • Nikolay KOLCHANOV, Alexey KOCHETOV, Yuri MATUSHKIN et Ilya AKBERDIN, Institut de Cytologie et Génétique de Novossibirsk, Russie. Rencontres Franco-Russes INRA. Deux jours en 2009.
  • Radu Marinuescu, University of California. USA. Collaboration sur les réseaux de contraintes pondérés. Une semaine en 2008.
  • Helene Fargier, IRIT. France. Collaboration sur les réseaux de contraintes pondérés. Un mois en 2008.
  • Emma Rollon, Université Polytechnique de Catalogne. Espagne. Collaboration sur les réseaux de contraintes pondérés. Une semaine en 2007.
  • François MAJOR, Professeur titulaire, Département d’ informatique et recherche opérationnelle, Faculté des arts et des sciences, Université de Montréal. Thèse de M. Zytnicki. Deux jours en 2007.
  • Tomas WERNER, Center for Machine Perception (CMP), Department of Cybernetics, Faculty of Electrical Engineering, Czech Technical University. Réseaux de contraintes pondérées et champs de Markov. Une semaine en 2007.
  • David GARCIA, Facultad de Veterinaria de Madrid, Espagne. Une semaine en 2006.
  • Philippe BARET, Université Catholique de Louvain, Belgique. Jury de thèse de S. Boitard. Deux jours en 2006.
  • Francesca ROSSI: Université de Padoue, Italie. Rapporteur/jury de la thèse de Cédric Pralet. Deux jours en 2006.
  • Javier LARROSA, Université Polytechnique de Catalogne. Espagne. Collaboration sur les réseaux de contraintes pondérés. Une semaine en 2006.
  • Ahmed REBAI, Centre de Biotechnologie de Sfax, Tunisie. Quatre jours en 2006.


Thèses soutenues

Biologie intégrative des réponses au stress et robustesse chez le porc

par Valérie SAUTRON

  • Directeur de thèse : Pierre Mormède (GenPhySE, INRA)
  • Co-directeurs : Elena Terenina (GenPhySE, INRA) & Nathalie Villa-Vialaneix
  • Soutenue le : 27/10/2016
  • Ecole doctorale : SEVAB
  • Etablissement : Université Paul Sabatier (Toulouse III)
  • Financement : ANR (projet SusOStress) & Région Midi-Pyrénées

Filtrage dans les réseaux de contraintes pondérées

par Thi Hong Hiep NGUYEN 

  • Directeur de thèse : Thomas Schiex
  • Soutenue le : 15/01/2015
  • Ecole doctorale : Mathématiques Informatique et Télécommunications de Toulouse
  • Etablissement : Université Paul Sabatier (Toulouse III)
  • Financement : Contrat ANR

Contribution à la modélisation et l'inférence de réseau de régulation de gènes

par Magali CHAMPION

  • Directeur de thèse : Sébastien Gadat (Institut Mathématique de Toulouse)
  • Co-directeurs : Christine Cierco-Ayrolles et Matthieu Vignes
  • Soutenue le : 05/12/2014
  • Ecole doctorale : Mathématiques Informatique et Télécommunications de Toulouse
  • Etablissement : Université Paul Sabatier (Toulouse III)
  • Financement : MENRT
  • Résumé : Cette thèse propose des développements autour de l’étude théorique et l’utilisation de méthodes statistiques mathématiques et d’optimisation dans le contexte des réseaux géniques. De tels réseaux sont des outils puissants de représentation et d’analyse de systèmes biologiques complexes, et permettent de modéliser des relations fonctionnelles entre les éléments qui composent ces systèmes.
    La première partie de cette thèse est consacrée à l’étude de méthodes d’apprentissage statistique pour inférer ces réseaux par le biais de régressions parcimonieuses dans le contexte de grande dimension, et plus particulièrement les algorithmes de L2-Boosting. D’un point de vue théorique, nous montrons des résultats de consistance et de stabilité du support, sous des hypothèses concernant notamment la dimension du problème.
    La deuxième partie concerne l’utilisation des algorithmes de L2-Boosting pour l’apprentissage d’indices de Sobol dans le cadre d’analyse de sensibilité. Pour estimer ces indices, on s’appuie sur la décomposition du modèle sous forme de fonctionnelles d’ANOVA. Les composantes sont estimées via une procédure d’orthogonalisation hiérarchique de Gram-Schmidt, visant à construire une approximation de la base analytique, et une procédure de L2-Boosting pour reconstruire
    une approximation parcimonieuse du signal. Nous montrons alors que l’estimateur obtenu est consistant dans un contexte de bruit sur le dictionnaire d’approximation.
    La dernière partie concerne enfin le développement de méthodes d’optimisation pour estimer des interactions au sein de réseaux. Nous montrons que le problème de minimisation de la log-vraisemblance peut être réécrit sous la forme d’un problème de double optimisation, consistant à trouver la forme complète du graphe (ordre des variables au sein du graphe) puis à le rendre parcimonieux. Nous proposons de le résoudre par le biais d’un algorithme génétique, spécifiquement
    adapté à la structure de notre problème.
  • Mots-clés : Statistiques, grande dimension, régression, parcimonie, optimisation.
  • Manuscrit : Manuscrit (français), Soutenance

Recherche de facteurs génétiques impliqués dans l'élaboration du rendement sous contrainte hydrique chez le tournesol Helianthus annuus par génétique d'association et analyse de liaison dans une population recombinante

par Elena CADIC

  • Soutenue le : 14/02/14
  • Directrice de thèse : Brigitte Mangin
  • Co-directeur : Patrick Vincourt (Laboratoire des Interactions Plantes Microorganismes, INRA Toulouse)
  • Ecole doctorale : Sciences Ecologiques,Vétérinaires, Agronomiques, Bioingénieries (Toulouse III)


Apprentissage de la structure de réseaux bayésiens. Application aux données de génétique-génomique

par Jimmy VANDEL

  • Soutenue le : 07/12/12
  • Directrice de thèse : Brigitte Mangin
  • Co-directeur : Simon de Givry
  • Ecole doctorale : Mathématiques Informatique et Télécommunications de Toulouse (Toulouse III)
  • Résumé : Apprendre la structure d’un réseau de régulation de gènes est une tâche complexe due à la fois au nombre élevé de variables le composant (plusieurs milliers) et à la faible quantité d’échantillons disponibles (quelques centaines). Parmi les approches proposées permettant d’apprendre ces réseaux, nous nous sommes placés pour cette thèse dans le formalisme des réseaux bayésiens. Apprendre la structure d’un réseau de régulation consiste alors à apprendre la structure d’un réseau bayésien où chaque variable représente un gène et chaque arc de ce réseau un phénomène de régulation. Dans la première partie de cette thèse nous nous intéressons à l’apprentissage de la structure de réseaux bayésiens génériques. Nous nous sommes placés dans le cadre des recherches locales à base de score. Nous proposons une version stochastique d’une recherche gloutonne existante, permettant d’explorer plus efficacement l’espace des réseaux possibles. Pour ce même objectif, nous avons développé un nouvel opérateur local, le SWAP, ainsi qu’une extension itérative des opérateurs classiques, permettant d’assouplir temporairement la contrainte d’acyclicité imposée par le formalisme des réseaux bayésiens. La deuxième partie vise plus spécifiquement l’apprentissage de réseaux de régulation de gènes. Nous proposons une modélisation de ce problème d’apprentissage dans le cadre des réseaux bayésiens qui permet la prise en compte de deux types d’information. Le premier, classiquement utilisé, est le niveau d’expression des différents gènes. Le second, plus original, est la présence de mutations sur la séquence d’ADN pouvant expliquer certaines variations de l’expression. L’utilisation de ce type de données dites de génétique-génomique, vise à améliorer la qualité du réseau reconstruit en intégrant différentes sources d’information lors de  l’apprentissage. Nous avons développé deux variantes de cette modélisation dont la première consiste en une représentation non-fusionnée des deux informations augmentant alors la qualité descriptive du réseau tandis que la seconde permet une représentation compacte. Nous avons également défini une extension des scores classiquement employés pour l’apprentissage, permettant de restaurer un a priori uniforme sur les classes de connectivité des réseaux explorés. Les deux modélisations proposées ainsi que l’utilisation des scores étendus ont été validées sur des données simulées issues de nos propres expérimentations et à l’occasion d’une compétition internationale. Par ailleurs, nous avons utilisé notre modélisation non-fusionnée dans le cas de données de génétique-génomique réelles issues de la plante Arabidopsis thaliana afin d’en apprendre le réseau de régulation. Un premier réseau a ainsi été obtenu dont certaines régulations ont été validées d’après la littérature existante.
  • Mots-clés : modèle graphique probabiliste, réseau bayésien, optimisation sous contraintes, recherche stochastique gloutonne, apprentissage, génétique génomique, réseau de régulation de gènes
  • Manuscrit : Manuscrit (français), soutenance 


Analyse des bases génétiques et moléculaires de la tolérance à la sécheresse chez le maïs par génétique d'association

par Sofiane MEZMOUK

  • Soutenue le : 06/01/12
  • Directrice de thèse : Brigitte Mangin
  • Co-directeur : Pierre Dubreuil (Biogemma, Génétique et Génomique des Céréales)
  • Ecole doctorale : Sciences Ecologiques,Vétérinaires, Agronomiques, Bioingénieries (Toulouse III)


Décompositions fonctionnelles et structurelles dans les modèles graphiques probabilistes appliquées à la reconstruction d’haplotypes

par Aurélie FAVIER

  • Soutenue le : 12/12/11
  • Directeur de thèse : Simon de Givry
  • Co-directeur : Andres Legarra (Station d'Amélioration Génétique des Animaux, INRA Toulouse)
  • Ecole doctorale : Mathématiques Informatique et Télécommunications de Toulouse (Toulouse III)
  • Résumé : Cette thèse s’intéresse à la décomposition dans les modèles graphiques que sont, entre autres, les réseaux bayésiens et les réseaux de fonctions de coûts (WCSP) et son application pour la reconstruction d’haplotypes dans les pedigrees. Nous appliquons les techniques des WCSP pour traiter les réseaux bayésiens, en exploitant les propriétés structurelles, de manière exacte et approchée, des instancesdans un cadre voisin de l’inférence. Pour l’optimisation, nous définissons une décomposition de fonctions qui produit des fonctions portant sur un plus petit nombre de variables. Les cohérences locales souples profitent de ces nouvelles fonctions plus petites. Un exemple d’application en optimisation est la reconstruction d’haplotypes. Elle est essentielle pour mieux analyser l'architecture génétique de caractères particuliers comme la production des animaux de rente ou la susceptibilité à une maladie . Le problème de reconstruction d’haplotypes se modélise sous forme d’un réseau bayésien. Notre décomposition fonctionnelle permet de réduire ce réseau bayésien en un problème d’optimisation Max-2SAT résolu efficacement par des méthodes exactes.
  • Mots-clés : optimisation combinatoire, modèle graphique probabiliste, réseau de fonctions de coûts, reconstruction d'haplotypes, pedigree
  • Manuscrit : Manuscrit (français)


Détection des duplications en tandem au niveau nucléique à l'aide de la théorie des flots

par Eric AUDEMARD

  • Soutenue le : 28/11/11
  • Directeur de thèse : Thomas Schiex
  • Co-directeur : Thomas Faraut (Laboratoire de Génétique Cellulaire, INRA Toulouse)
  • Ecole doctorale : Mathématiques Informatique et Télécommunications de Toulouse (Toulouse III)
  • Résumé : L'arrivée massive de séquences complètes de génomes nécessite des méthodes efficaces d'annotation : comment est structurée l'information le long de la séquence d'ADN. Après s'être concentrée sur la détection de séquences codantes, les gènes, l'annotation a élargi son champ d'investigation à d'autres éléments fonctionnels (ncRNA, transposons, ...). Nous proposons d'annoter la séquence en identifiant les régions dupliquées, plus précisément dupliquées en tandem, en raison de l’importance du phénomène de duplication dans l’évolution des génomes. Nous avons développé un algorithme à base de graphes, s'inspirant de la théorie des flots, qui détecte les régions dupliquées en tandem, ainsi que chacune des unités dupliquées, exploitation la seule information de la séquence d’ADN. Cette méthode a été testée sur un génome de plante possédant de nombreuses duplications en tandem : Arabidopsis thaliana. La méthode a fait l'objet d'une implémentation dans un logiciel, ReD, disponible pour la communauté scientifique.
  • Mots clés : Duplication, Tandem, Annotation, Graphe, Flot, ADN, Evolution
  • Manuscrit : Manuscrit (français)


Identification et caractérisation de nouveaux ARN non codant chez l'archée hyperthermophile Pyrococcus abyssi

par Kounthéa PHOK

  • Soutenue le :18/03/11
  • Directrice de thèse : Béatrice Clouet-d'Orval (Laboratoire de Microbiologie et de Génétique Moléculaire, Université Toulouse III)
  • Co-directrice : Christine Gaspin 
  • Co-encadrante : Annick Moisan
  • Ecole doctorale : Biologie - Santé - Biotechnologies (Toulouse III)
  • Résumé : Les ARN non codant (ARNnc) possèdent des fonctions vitales dans les trois domaines du vivant. En plus des ARNr et les ARNt, de nouveaux ARNnc régulateurs de l'expression génique ont été identifiés et caractérisés dans des génomes d'organismes eucaryotes et bactériens par des approches biologiques que bioinformatiques. Peu d'études du même type sont parues chez les génomes d'archées. L'objectif de cette thèse est d'identifier de nouveaux ARNnc dans le génome d'une archée hyperthermophile de l'ordre des Thermococcales, Pyrococcus abyssi. Une approche bioinformatique combinant deux méthodes complémentaires a été utilisée pour cribler les régions intergéniques de la séquence génomique de cette archée. Cette recherche a abouti à la prédiction de nombreuses régions candidates dont 82 ont été retenues pour une validation expérimentale par Northern Blot. Des transcrits ont été détectés pour 24 prédictions dont 16 sont de nouveaux ARN qui n'ont jamais été décrits. Pour chaque nouvel ARN, les extrémités 5' et 3' ont été identifiées par des analyses d'extension d'amorce et en Circular RACE. Des motifs promoteurs ont été proposés pour neuf d'entre eux. Une analyse comparative des séquences étendue à l'ensemble des Thermococcales, intégrant l'analyse des alignements de séquences orthologues a amené à proposer des structures secondaires conservées pour huit ARN. Les données acquises ont permis d'émettre des hypothèses quant à la fonction de ces ARN dans la cellule. Deux d'entre eux sont capables de former des complexes ribonucléoprotéiques (RNP) avec la protéine ribosomale L7Ae, composante de RNP chez les archées, suggérant que ces ARN feraient partie de complexes RNP fonctionnels.
  • Mots-clés : ARN non codant, Pyrococcus abyssi, Thermococcales, Bio-informatique, Complexes ribonucléoprotéiques
  • Manuscrit : Manuscrit (français)


Prédiction de gènes d'ARN dans les séquences génomiques

par Ana KOZOMARA

  • Soutenue le : 15/06/09
  • Directeur de thèse : Christine Gaspin
  • Co-directeurs : Christine Cierco-Ayrolles et Christian Boucher (Laboratoire des Interactions plantes-microorganismes, INRA, Toulouse)
  • Ecole doctorale : Sciences Ecologiques, Vétérinaires, Agronomiques, Bioingénieries (Toulouse III)
  • Résumé : Les ARN non-codant sont des régulateurs clés des divers processus cellulaires, chez les procaryotes et les eucaryotes. Malgré le grand nombre des ARN non-codant connus à ce jour il n'existe pas de méthode bioinformatique universelle permettant leur détection. Il est connu que, dans les genomes archéans A+T riches hyperthermophiles, la détection est possible à l'aide de leur composition en G+C elevée dans ces génomes. Ici nous étudions l'approche par biais de composition pour la détection des ARN non-codant dans le génome G+C riche de Ralstonia solanacearum pour lequel aucun étude de recherche des ARNnc n'a pas été menée à ce jour. Nous étudions tout d'abord l'existence d'un biais de composition dans les ARNnc du génome A+T riche de Staphylococcus aureus. D'un point de vue méthodologique, ce travail propose une procédure pour tester l'existence d'un biais en G+C dans différents éléments génomiques. La procédure est basée sur la theorie des Modeles Lineaires Generalises. Nous montrons que les ARNnc de S. Aureus ensemble avec certaines séquences repetées, sont caracterisées par le G+C% plus elevée et ceci peut être utilisé pour leur détection. La même approche à été utilisée avec moins de succès sur le génome de R. Somanacearum. De façon complémentaire a l'approche par biais de composition, nous avons utilise l'analyse comparative des différentes souches de R. Solanacearum pour la détection des ARNnc conserves. Nous avons développe la nouvelle version de RNAsim, un outil utilisant la théorie des graphes pour identifier les régions intergeniques conservées entre plusieurs génomes. Les candidats choisis a l'aide de l'approche comparative ont été analyses par rapport a la conservation de leur structure secondaire, éléments de syntenie etc. Afin d'évaluer leur pertinence biologique. Huit candidats ont été sélectionnes et ils seront testes biologiquement.
  • Mots-clés : Noncoding RNA detection, Generalised Liner Models, Staphylococcus aureus, HMM, Ralstonia solanacearum, Viterbi training, Compositional bias
  • Manuscrit : Manuscrit (français)


Recherche d'ARN non-codants par réseaux de contraintes pondérées

par Matthias ZYTNICKI

  • Soutenue le : 12/12/07
  • Directeurs de thèse : Christine Gaspin et Thomas Schiex
  • Ecole doctorale : Mathématiques, Informatique et Télécommunications de Toulouse (Toulouse III)
  • Résumé : De récentes découvertes sur les ARN non-codants ont révélé le rôle multiple de ces molécules. De nombreuses méthodes, notamment in silico, ont été développées afin de localiser ces ARN. Nous avons développé dans nos travaux une approche recherchant ces ARN à partir de la connaissance d'éléments de structures discriminant une famille d'ARN, appelés signature. Ces recherches ont été valorisées par l'élaboration d'un outil appelé DARN!, qui trouve, dans des séquences génomiques, les occurrences d'une signature donnée. DARN! est basé sur les réseaux de contraintes pondérées (formalisme associant recherche combinatoire et optimisation). Nos recherches de thèse nous ont d'ailleurs amené à concevoir deux techniques de filtrages dans ces réseaux : EDAC* (une des techniques de filtrage les plus efficaces pour des problèmes classiques) et BAC* (à ce jour la seule technique pour des problèmes contenant des grands domaines comme celui de la recherche des ARN non-codants). DARN! intégre de plus des techniques basées sur du pattern-matching dans un outil de résolution de contraintes pondérées. Comparé à d'autres approches, celle-ci est rapide et permet de décrire des signatures comportant des structures complexes. DARN! comprend aussi un mécanisme qui élimine les solutions redondantes, et un autre, permettant générer automatiquement une signature à partir d'un alignement donné en entrée.
  • Manuscrit : Manuscrit (français)


Cartographie de gènes à caractères quantitatifs par déséquilibre de liaison

par Simon BOITARD

  • Soutenue le : 12/12/06
  • Directeurs de thèse : Brigitte Mangin, Jean-Marc Azaïs (Institut Mathématique de Toulouse, Toulouse III) et Hubert de Rochambeau (Station d'Amélioration Génétique des Animaux, INRA, Toulouse)
  • Ecole doctorale : Mathématiques, Informatique et Télécommunications de Toulouse (Toulouse III)
  • Résumé : Le but de ma thèse est de développer des méthodes statistiques permettant d'estimer la position des gènes qui influencent l'expression d'un caractère à valeurs continues (QTL). Je propose d'abord un algorithme numérique permettant d'approcher la densité de transition des fréquences d'haplotypes sous un modèle de diffusion à deux loci avec recombinaison. Je montre aussi que cette méthode peut être utilisée pour calculer la vraisemblance de la position d'un gène. Je présente ensuite une méthode de cartographie de QTL par maximum de vraisemblance. Je calcule la vraisemblance à l'ordre 1 en utilisant l'espérance des fréquences d'haplotypes sous un modèle de Wright-Fisher à 3 loci avec recombinaison, dont je dérive une expression approchée. Je m'intéresse enfin au problème de la détection de QTL dans le cas de populations structurées. J'étudie la loi asymptotique du Transmission Desequilibrium Test (TDT) et en déduis des résultats concernant son erreur de première espèce et sa puissance.
  • Manuscrit : Manuscrit (français) 


Un cadre algébrique général pour représenter et résoudre des problèmes de décision séquentielle avec incertitudes, faisabilités et utilités

par Cédric PRALET

  • Soutenue le : 17/11/06 - Prix national de thèse ASTI 2007 (ANR)..
  • Directeurs de thèse : Thomas Schiex, Gérard Verfaillie (ONERA, Toulouse)
  • Ecole doctorale : École Nationale Supérieure de l'Aéronautique et de l'Espace
  • Résumé : De nombreux formalismes existent pour modéliser et résoudre des problèmes de décision séquentielle. Certains, comme les réseaux de contraintes, permettent de formuler des problèmes de décision "simples" alors que d'autres peuvent prendre en compte des données plus complexes telles que des incertitudes, des infaisabilités sur les décisions et des utilités. Diverses extensions d'un même formalisme sont de plus souvent introduites de manière à représenter l'incertain et les préférences sous des formes variées (probabilités, possibilités...; utilités additives ou non...). Chacun de ces formalismes est généralement équipé d'algorithmes dédiés capables de répondre à certaines requêtes. La première partie de cette thèse définit un cadre de représentation général qui englobe de nombreux formalismes de décision séquentielle dans l'incertain. Ce cadre, nommé cadre PFU pour "Plausibilité-Faisabilité-Utilité", repose sur trois éléments clés: (1) une structure algébrique spécifiant comment combiner et synthétiser des informations; (2) des fonctions locales portant sur certaines variables et exprimant des incertitudes, des faisabilités ou des utilités; (3) une classe de requêtes sur ces fonctions locales, qui permet de considérer des scénarios décisionnels variés en termes d'observabilité et de contrôlabilité. Ce travail de représentation de la connaissance est complété, dans la seconde partie de la thèse, par un travail algorithmique. Cette approche duale reflète l'ambition de construire un cadre algébrique général permettant à la fois de représenter des problèmes de décision variés et de les résoudre. Les deux types d'algorithmes développés sont des algorithmes de type élimination de variables ou de type recherche arborescente avec bornes et techniques de mémorisation. Nous montrons également qu'il est possible d'utiliser une architecture de calcul générale qui exploite la structure des requêtes considérées pour les décomposer en calcul locaux. En unifiant des formalismes variés, tels que les formules booléennes quantifiées et les diagrammes d'influence, le cadre PFU apporte une meilleure compréhension des formalismes existants et des liens qui existent entre eux. Il n'est pas qu'un cadre unificateur, étant donné que certaines de ces intanciations correspondent à de nouveaux formalismes. Enfin, il permet de définir des algorithmes génériques qui correspondent soit à des généralisations d'algorithmes existants soit à des nouvelles techniques applicables directement à tous les formalismes couverts.
  • Manuscrit : Manuscrit (Version courte en français)
  • Manuscript : Manuscrit (Version longue en anglais)
Génotoul BioInfo
Équipe RECORD
IMABS
Outils personnels