Analyses de données de ChIPseq

utilisation de la methode mIDR sur des données de Chip-Seq
ongoing
ChIP-seq
R
Authors

Laurent Modolo

Cécile Bedet

Published

September 21, 2023

Porteur du projet

Cécile Bedet, équipe Palladino

Personnes

Cécile Bedet et Laurent Modolo

Problématique biologique

Notre équipe utilise C.elegans comme système modèle pour étudier le rôle de facteurs chromatiniens au cours du développement. Ces facteurs sont des protéines très conservées, dont certains sont responsables de l’établissement et du maintien des profils épigénétiques dans différents tissus. Le dérèglement de leur fonction est à l’origine de défauts développementaux et de différentes pathologies chez l’homme ce qui révèle leur rôle fondamental dans le bon fonctionnement des organismes. Notre but est d’élucider les mécanismes moléculaires de cette régulation épigénétique; plus précisément, nous voulons comprendre comment ces facteurs interagissent pour maintenir la fonction de la lignée germinale en utilisant C.elegans comme organisme modèle.

Nous étudions plus particulièrement le complexe histone methyl transferase SET1/COMPASS. Nous avons notamment montré que l’homologue de SET1 chez C.elegans, nommé SET-2, catalyse la méthylation de l’histone H3 sur la lysine 4 (H3K4me3) comme ses homologues dans d’autres espèces. Pour examiner le rôle des modifications post-traductionnelles d’histones, j’ai mis au point un protocole de ChIP-Seq, afin de comparer les niveaux de H3K4me3et de H3K9me3 dans des vers jeunes adultes mutants set-2 à ceux de vers sauvage (wt). Afin d’analyser ces résultats j’ai besoin de l’aide du pôle Biocomputing.

Questions

La question principale est de savoir si la marque H3K4me3 est distribuée de la même manière dans les mutants set-2 et dans les vers sauvages au niveau de tout le génome. Nous aimerions aussi déterminer si l’intensité des pics de H3K4me3 est différente ou non entre les vers set-2 et wt.

Données

l’heure actuelle je dispose de données de ChIP-seq pour les 2 marques H3K4me3 et H3K9me3 , en triplica pour chaque souche (set-2 ou wt). J’ai déjà analysé les données brutes à l’aide du pipeline nf-core et je dispose notamment des pics identifiés dans chaque contexte pour chaque réplica. Il me faut à présent un moyen de déterminer quels sont les pics qui peuvent être considérés comme reproductibles . Pour cela Laurrent Modolo a proposé de développer une méthode d’IDR ( Irreproducible Discovery Rate ) avec 3 réplicat. De plus nous aimerions savoir s’il est possible sans avoir de calibration interne, de déterminer si les intensités des signaux pour les marques H3K4me3 et H3K9me3 sont affectées dans les mutants set-2

Maturité et perspectives

Il s’agit ici d’une étude prospective. Nous aimerions voir s’il est possible de valoriser ces données dans le but de faire une micropublication

Dates

  • date du début du projet: démarré en 2020 et laissé “en plan”
  • date d’obtention des données: données brutes obtenues en 2020
  • date d’obtention de l’intégralité des données: 2023
  • date souhaitée de fin du projet: 2024

Attentes

L’idée est que Laurent utilise mes données afin de finaliser l’écriture du package R mIDR

Organisation

Laurent serait an charge de l’acriture du package R mIDR et Cécile de son utilisation et test sur les données de Chip-Seq en triplicat.