Traitement de données DamID-seq

Développement d’un pipeline de traitement de données DamID-seq
Nextflow
DamID-seq
PBC team
Authors

Daniel Jost

Nathan Lecouvreur

Noémie Quesnel

Gaël Yvert

Laurent Modolo

Published

January 5, 2022

Results

Nextflow pipeline to process DamID-seq data

https://gitbio.ens-lyon.fr/nlecouvr/nextflow-nathan

report

Développement d’un pipeline de traitement de données DamID-seq

Porteur du project

Daniel Jost

Personnes impliquées

Nathan Lecouvreur (étudiant M2), Noémie Quesnel (IE), Gaël Yvert, Daniel Jost

Problématique biologique

Nous avons l’année dernière lancé un project en collaboration avec l’équipe Yvert afin de disséquer les mécanismes régulant l’épigenome d’une cellule, en particulier le lien avec l’organisation 3D de l’ADN. En particulier, l’objectif est de développer un système épigénétique synthétique chez la levure basé sur la méthylation de l’ADN par l’enzyme d’origine bactérienne Dam, permettant d’étudier quantitativement les différents mécanismes impliquées dans la régulation épigénétique (nucléation, reader-writer, réplication, séparation de phase) en lien avec de la modélisation biophysique. Comme preuve de concept, nous avons pour le moment ingéniéré un système « nucleation-writer » couplant un opérateur Tet à la Dam. Et nous avons effectué plusieurs expériences en faisant varier le niveau d’expression de la protéine TetR-Dam et le niveau d’affinité de cette protéine à des séquences TetO. Nous aimerions estimer pour ces différentes expériences le niveau de méthylation de l’ADN lié à l’action de la Dam en function de la distance génomique par rapport au site TetO. On s’attend en particulier à ce que ces niveaux traduisent la proximité spatiale entre le site méthylé et le site TetO, générant des données similaires à du 4C (technique Dam-C, PMID : 31133702).

La fusion de Dam à une protéine d’intérêt étant une technique couramment utilisée (DamID) pour mesurer les régions génomiques d’attache de cette protéine, il existe des protocoles pour mesurer le niveau de méthylation de l’ADN lié à l’action de la Dam que nous avons utilisé.

Questions

Afin de connaitre le niveau de méthylation ‘genome-wide’, nous avons envoyé nos échantillons DamID à séquencer. Pour pouvoir analyser ces données et en tirer des niveaux de méthylation, nous avons besoin d’adapter et d’optimiser les pipelines DamID-seq existants (https://github.com/damidseq/RDamIDSeq).

Données

Données de séquençage haut-débit (short-read, paired-end, 150bp).

Dates

Début du project : dès que possible

Obtention des données : début février 2022

Fin de project : février-mars 2022

Attentes

Nous aimerions que Laurent aide Nathan, l’étudiant de M2 qui est en charge de ce project, à développer un pipeline de traitement des données en reprenant les pipelines existants avec des outils modernes et plus modulables sous Nextflow. Ce pipeline est très important pour nous car il sera utilisé dans toute la suite du project pour mesurer les niveaux de méthylation.