Results
Nextflow pipeline to process DamID-seq data
Développement d’un pipeline de traitement de données DamID-seq
Porteur du project
Daniel Jost
Personnes impliquées
Nathan Lecouvreur (étudiant M2), Noémie Quesnel (IE), Gaël Yvert, Daniel Jost
Problématique biologique
Nous avons l’année dernière lancé un project en collaboration avec l’équipe Yvert afin de disséquer les mécanismes régulant l’épigenome d’une cellule, en particulier le lien avec l’organisation 3D de l’ADN. En particulier, l’objectif est de développer un système épigénétique synthétique chez la levure basé sur la méthylation de l’ADN par l’enzyme d’origine bactérienne Dam, permettant d’étudier quantitativement les différents mécanismes impliquées dans la régulation épigénétique (nucléation, reader-writer, réplication, séparation de phase) en lien avec de la modélisation biophysique. Comme preuve de concept, nous avons pour le moment ingéniéré un système « nucleation-writer » couplant un opérateur Tet à la Dam. Et nous avons effectué plusieurs expériences en faisant varier le niveau d’expression de la protéine TetR-Dam et le niveau d’affinité de cette protéine à des séquences TetO. Nous aimerions estimer pour ces différentes expériences le niveau de méthylation de l’ADN lié à l’action de la Dam en function de la distance génomique par rapport au site TetO. On s’attend en particulier à ce que ces niveaux traduisent la proximité spatiale entre le site méthylé et le site TetO, générant des données similaires à du 4C (technique Dam-C, PMID : 31133702).
La fusion de Dam à une protéine d’intérêt étant une technique couramment utilisée (DamID) pour mesurer les régions génomiques d’attache de cette protéine, il existe des protocoles pour mesurer le niveau de méthylation de l’ADN lié à l’action de la Dam que nous avons utilisé.
Questions
Afin de connaitre le niveau de méthylation ‘genome-wide’, nous avons envoyé nos échantillons DamID à séquencer. Pour pouvoir analyser ces données et en tirer des niveaux de méthylation, nous avons besoin d’adapter et d’optimiser les pipelines DamID-seq existants (https://github.com/damidseq/RDamIDSeq).
Données
Données de séquençage haut-débit (short-read, paired-end, 150bp).
Dates
Début du project : dès que possible
Obtention des données : début février 2022
Fin de project : février-mars 2022
Attentes
Nous aimerions que Laurent aide Nathan, l’étudiant de M2 qui est en charge de ce project, à développer un pipeline de traitement des données en reprenant les pipelines existants avec des outils modernes et plus modulables sous Nextflow. Ce pipeline est très important pour nous car il sera utilisé dans toute la suite du project pour mesurer les niveaux de méthylation.