Séminaires : Différence entre versions

De MIAT INRA
Aller à : navigation, rechercher
(Séminaires de l'année en cours et séminaires futurs)
(Séminaires de l'année en cours et séminaires futurs)
Ligne 31 : Ligne 31 :
  
 
==== Pas de séminaire le 14 et le 21 février (vacances scolaires) ====
 
==== Pas de séminaire le 14 et le 21 février (vacances scolaires) ====
 +
 +
==== 24/01/2020 : ''Titre à venir''. [https://imag.umontpellier.fr/~charlier/ Benjamin Charlier] (Université de Montpellier, ARAMIS) ====
  
 
==== 17/01/2020 : ''Titre à venir''. [https://personnel.isae-supaero.fr/caroline-chanel/?lang=fr Caroline Chanel] (ISAE, DCAS) ====
 
==== 17/01/2020 : ''Titre à venir''. [https://personnel.isae-supaero.fr/caroline-chanel/?lang=fr Caroline Chanel] (ISAE, DCAS) ====

Version du 2 décembre 2019 à 15:23

Sommaire

Séminaires de l'unité MIAT

Pyrenees-morning.jpg

Le séminaire de l'équipe MIAT de l'INRA de Toulouse est un endroit d'échanges scientifiques et techniques entre les membre de l'unité et des experts en mathématiques, informatique, agro-écosystèmes, bioinformatique, etc. Les présentations peuvent être sur des travaux en cours, des projets finalisés hautement spécialisés ou à valeur plus éducative / informationnelle. Les aspects mis en avant peuvent être d'ordre méthodologique ou applicatif.

Les présentations peuvent être en français ou en anglais pour une durée d'une heure (45min + questions). Sauf contre-indication, les séminaires ont lieu dans la salle de réunion MIAT à 10h30 le vendredi. L'accès à l'unité MIAT de l'INRA Auzeville/Castanet est indiqué ici (nous sommes à moins de 30 mètres de la réception !).

 




Séminaires de l'année en cours et séminaires futurs

27/03/2020 : Titre à venir. Guillaume Lamoureux (Rutgers University)

Résumé : à venir

06/03/2020 : Titre à venir. Olivier Mazet (Institut de Mathématiques de Toulouse)

Résumé : à venir

Pas de séminaire le 28 février (Journée IA & Agriculture)

Pas de séminaire le 14 et le 21 février (vacances scolaires)

24/01/2020 : Titre à venir. Benjamin Charlier (Université de Montpellier, ARAMIS)

17/01/2020 : Titre à venir. Caroline Chanel (ISAE, DCAS)

Résumé : à venir

10/01/2020 : Titre à venir. Marie Perrot-Dockes (MIA Paris)

Résumé : à venir

Pas de séminaire le 27 décembre et le 3 janvier (vacances scolaires)

Pas de séminaire le 20 décembre : Soutenance de thèse de Léonard Torossian à l'IMT le mardi 17 décembre à 13h30

13/12/2019  : à venir...

Pas de séminaire le 6 décembre : Chromosome Conformation Symposium (4-5 décembre) et Journée AIGM (5 décembre)

29/11/2019  : Contributions to probabilistic non-negative matrix factorization - Maximum marginal likelihood estimation and Markovian temporal models. Louis Filstroff (UMR IRIT) diaporama

Résumé : Non-negative matrix factorization (NMF) has become a popular dimensionality reduction technique, and has found applications in many different fields, such as audio signal processing, hyperspectral imaging, or recommender systems. In its simplest form, NMF aims at finding an approximation of a non-negative data matrix (i.e., with non-negative entries) as the product of two non-negative matrices, called the factors. One of these two matrices can be interpreted as a dictionary of characteristic patterns of the data, and the other one as activation coefficients of these patterns. This low-rank approximation is traditionally retrieved by optimizing a measure of fit between the data matrix and its approximation. As it turns out, for many choices of measures of fit, the problem can be shown to be equivalent to the joint maximum likelihood estimation of the factors under a certain statistical model describing the data. This leads us to an alternative paradigm for NMF, where the learning task revolves around probabilistic models whose observation density is parametrized by the product of non-negative factors. This general framework, coined probabilistic NMF, encompasses many well-known latent variable models of the literature, such as models for count data.
In this talk, we consider specific probabilistic NMF models in which a prior distribution is assumed on the activation coefficients, but the dictionary remains a deterministic variable. The objective is then to maximize the marginal likelihood in these semi-Bayesian NMF models, i.e., the integrated joint likelihood over the activation coefficients. This amounts to learning the dictionary only; the activation coefficients may be inferred in a second step if necessary. We proceed to study in greater depth the properties of this estimation process. In particular, two scenarios are considered. In the first one, we assume the independence of the activation coefficients sample-wise. Previous experimental work showed that dictionaries learned with this approach exhibited a tendency to automatically regularize the number of components, a favorable property which was left unexplained. In the second one, we lift this standard assumption, and consider instead Markov structures to add statistical correlation to the model, in order to better analyze temporal data.

22/11/2019  : Critical points of Gaussian isotropic random fields. Céline Delmas (GenPhySE, MIAT)

Résumé : Let X = {X(t) : t in RN} be an isotropic Gaussian random field with real values. In a first part we study the mean number of critical points of X with index k, above a level, using random matrices tools. We obtain an exact expression for the probability density of the eigenvalue of rank k of a N-GOE matrix. We deduce exact expressions for the mean number of critical points with a given index and their distribution as a function of their index. In a second part we study attraction or repulsion between these critical points again as a function of their index. A measure is the correlation function. We prove attraction between critical points when N>2, neutrality for N=2 and repulsion for N=1. We prove that the attraction between critical points that occurs when the dimension is greater than 2 is due to attraction between critical points with adjacent indexes. We prove a strong repulsion between maxima and minima and we study the correlation function between maxima (or minima).

15/11/2019 : How to Lie With Graphics. Christophe Bontemps (GREMAQ) (diaporama, site Web)

Résumé : We use and read data visualizations (dataviz) in our everyday lives as researchers, engineers, and citizens. Most of the time, our goal is to visually test some basic hypotheses either while exploring datasets or for presenting some findings. These dataviz also serve to convince people and ourselves that some hypotheses are valid. But what if these convincing graphics were lies? Many graphics convey information that could be misleading, by mistake, misuse or on purpose. I propose a short tutorial to visual fallacies and lies. My goal here is not to encourage cheating and lying, but on the contrary to highlight the techniques used to elaborate misleading data visualizations. This introduction should help researchers, and decision makers to distinguish visual lies from unambiguous and consistent graphics.

8/11/2019 : Modélisation multi-agent et intégration culture-élevage dans les territoires. Myriam Grillot (INRA, AGIR)

Résumé : Les interactions entre cultures et élevage peuvent être modélisées par l'intermédiaire de modèle multi-agents. Dans un contexte agro-sylvo-pastoral au Sénégal, un modèle de ce type a été développé et implémenté (plateforme de modélisation GAMA) pour répondre à des questions relatives aux impacts des changements dans l’organisation du paysage et des systèmes d’élevage sur les flux de biomasse et d’azote. Différents niveaux d’organisation du territoire son pris en compte : la parcelle, le troupeau, le ménage et le terroir villageois. Quelles réflexions pour des utilisations de tels modèles et sur le travail sur l'interaction culture-élevage dans les territoires en France ?

Pas de séminaire le 25 octobre et le 1er novembre (vacances scolaires)

18/10/2019 : Distribution "Dirichlet-Multinomiale" et modèles neutres: une hypothèse nulle pour l'analyse de données de biodiversité. Fabien Laroche (Unité EFNO, IRSTEA)

Résumé : L'écologie des communautés vise à comprendre comment les conditions environnementales et les interactions entre organismes génèrent la diversité des espèces, phénotypes et génotypes que l'on observe dans les écosystèmes. Sur des systèmes naturels ou semi-naturels en conditions non-contrôlées, une approche possible consiste en la mise en œuvre de tests statistiques sur des échantillonnages spatiaux d'individus, afin de détecter une contribution significative de processus écologiques ciblés, facteurs environnementaux ou interactions. Dans cet exposé, je propose d'illustrer comment la théorie neutre de la biodiversité - qui suppose une équivalence écologique des espèces - peut fournir un cadre de test général et une hypothèse nulle, la distribution Dirichlet-Multinomiale, à même de compléter voire corriger les méthodes plus classiques à base de permutation de données ou de rééchantillonnage.

11/10/2019 : Copules et tests non-paramétriques de détection de rupture dans la dépendance entre les composantes d'observations multivariées. Tom Rohmer (GenPhySE)

Résumé : L'étude des copules est un phénomène relativement récent et en plein essor. Ces dernières permettent notamment de caractériser la dépendance entre les différentes composantes de données multivariées. Elles sont ainsi utilisées dans de nombreuses applications, que ce soit en hydrologie, finance ou encore en génétique. Si l'on considère un vecteur aléatoire (v.a.) dont les marges sont continues, le théorème de Sklar affirme qu'il existe une unique fonction "copule", caractérisant la structure de dépendance du v.a., telle que la donnée de la copule et des fonctions de répartitions marginales caractérisent la loi du vecteur aléatoire. Dans la littérature, on retrouvera un certain nombre de tests non-paramétriques de détection de rupture dans la distribution d'observations multivariées. Cependant, ces tests se révèlent souvent très peu sensibles pour détecter un changement dans la dépendance entre les composantes des v.a. Je présenterai dans cet exposé un test non paramétrique basé sur le processus de copule empirique séquentiel (approche CUSUM) et sur un rééchantillonage à base de multiplicateurs. Ce test se révèle particulièrement sensible à un changement dans la copule lorsque les lois marginales sont inchangées, et s'adapte à des données sériellement dépendantes (strong mixing). Ce test ne permet pas de conclure en une rupture dans la copule en présence de changement dans les lois marginales. Il est néanmoins possible d'adapter les procédures pour prendre en compte ces potentiels changements. J'illustrerai ces travaux à l'aide d'exemple sur des données et des simulations de Monte Carlo sur des classes d'alternatives pertinentes. Pour finir je présenterai quelques-unes de mes perspectives de recherche à l'Inra qui pourront s'appuyer sur cette recherche.

Pas de séminaire le 4 octobre (Journée Bioinfo/biostat)

27/09/2019 : Effondrement : et si on en parlait vraiment ? Quelles perspectives pour nos recherche ? Marc Deconchat (Dynafor) diaporama image supplémentaire

Résumé : Que l’on parvienne ou non à prendre les mesures requises pour faire face aux changements globaux, cela aboutira quasi inévitablement à des changements si profonds de nos sociétés et modes de vie qu’on peut parler de leur effondrement. Cela concernera bien évidemment et plus particulièrement les activités agricoles et d’usage des ressources naturelles, et cela nous concerne donc dans nos recherches. Pourtant, avons-nous bien pris la mesure de ce que cela signifie ? Pour P Servigne et ses co-auteurs ce n’est pas le cas car les implications seraient trop désespérantes et nous refuserions de nous y confronter. Si vous êtes prêts à en discuter, ce séminaire sera l’occasion de partager une vue d’ensemble de la Collapsologie, qui s’intéresse à ce phénomène particulier que serait un effondrement général, sans prétention d’en faire le tour. Les débats, car il y en aura sans doute tant le sujet est polémique, seront orientés vers les questions de recherche que nous posent ces perspectives.
Autres références: http://www.labos1point5.org et https://pabloservigne.com/

20/09/2019 : Component-wise approximate Bayesian computation via Gibbs-like steps. Julien Stoehr (CEREMADE)

Résumé : Approximate Bayesian computation methods are useful for generative models with intractable likelihoods. These methods are however sensitive to the dimension of the parameter space, requiring exponentially increasing resources as this dimension grows. To tackle this difficulty, we explore a Gibbs version of the ABC approach that runs component-wise approximate Bayesian computation steps aimed at the corresponding conditional posterior distributions, and based on summary statistics of reduced dimensions. While lacking the standard justifications for the Gibbs sampler, the resulting Markov chain is shown to converge in distribution under some partial independence conditions. The associated stationary distribution can further be shown to be close to the true posterior distribution and some hierarchical versions of the proposed mechanism enjoy a closed form limiting distribution. Experiments also demonstrate the gain in efficiency brought by the Gibbs version over the standard solution.
Référence : arxiv.org/abs/1905.13599

13/09/2019 : Impact of tree choice in metagenomics differential abundance studies. Antoine Bichat (LaMME - Enterome)

Résumé : We consider the problem of incorporating evolutionary information (e.g. taxonomic or phylogenic trees) in the context of metagenomics differential analysis. Recent results published in the literature propose different ways to leverage the tree structure to increase the detection rate of differentially abundant taxa. Here, we propose instead to use a different hierachical structure, in the form of a correlation-based tree, as it may capture the structure of the data better than the phylogeny. We first show that the correlation tree and the phylogeny are significantly different before turning to the impact of tree choice on detection rates. Using synthetic data, we show that the tree does have an impact: smoothing p-values according to the phylogeny leads to equal or inferior rates as smoothing according to the correlation tree. However, both trees are outperformed by the classical, non hierachical, Benjamini-Hochberg (BH) procedure in terms of detection rates. Other procedures may use the hierachical structure with profit but do not control the False Discovery Rate (FDR) a priori and remain inferior to a classical Benjamini-Hochberg procedure with the same nominal FDR. On real datasets, no hierarchical procedure had significantly higher detection rate that BH. Although intuition advocates the use of a hierachical structure, be it the phylogeny or the correlation tree, to increase the detection rate in microbiome studies, current hierachical procedures are still inferior to non hierachical ones and effective procedures remain to be invented.

Séminaires passés / Past seminars

Lien vers la Liste des séminaires passés de l'unité MIAT.

Contacts

Si vous souhaitez présentez vos travaux durant le séminaire MIAT, n'hésitez pas à contacter Patrick Taillandier ou Matthias Zytnicki.

Génotoul BioInfo
Équipe RECORD
IMABS
Outils personnels