Results
This project was handled by an INSA student who wrote a dedicated pipeline available at the following url and a report
Porteur du project
Gael Yvert
Personnes
Gael Yvert, Lauren Picard (Stagiaire BIM INSA 3e annee)
Problématique biologique
Les levures de laboratoire sont modifiées génétiquement par la technique de transformation d’ADN, qui utilise l’ajout d’ADN de saumon comme “carrier” . Les caracterisations sont ensuite basées sur les sequences de levure etudiees, jamais sur la possibilite d’avoir integré de l’ADN de saumon dans la cellule de levure. Il est donc possible que le genome des souches de laboratoires soit contaminé par de l’ADN de saumon.
Project haut risque complètement exploratoire qui a déjà commencé en remplacement d’un project de stage initial pour lequel nous n’avons pas encore les données ChIPseq de nos collaborateurs. Je sollicite l’aide de Laurent Modolo pour co-encadrer Lauren. Le project est viable sans cette aide, mais ce serait bien plus efficace avec...
Questions
1. Les souches de laboratoire sont-elles contaminées par de l’ADN de saumon ?
Développer un pipeline Nextflow pour mapper des reads RSA Illumina paired-end sur un metagenome constitué du genome du Saumon (Nature 2016) et de cerevisiae (Souche de ref S288c) et pour détecter les contaminations Salmon.
2. Si oui, comment cet AND est-il organisé ? Rechercher les frontieres levure-saumon des insertions contaminantes. Définir ensuite s’il est possible d’etudier comment cet AND est régulé. Appliquer le pipeline à divers jeux de données publiés (WGS, ChIP-Seq, RNA-SEQ) pour determiner lesquels contiennent la contamination. Definir ensuite ce qu’il est possible de faire comme enquête sur la regulation (epissage, response au stress, 3D…).
Données
Genome saumon: https://www.ncbi.nlm.nih.gov/assembly/GCF_000233375.1/
Genome levure: https://downloads.yeastgenome.org/sequence/S288C_reference/genome_releases/S288C_reference_genome_R64-2-1_20150113.tgz
Data NGS to map: numerous! Je propose de commencer par SRX4099981.
Date
Le project a déjà commencé.
La date du début du project: Mai 2019
La date de fin de project: 31 juillet 2019.
Attentes
Former un etudiant et obtenir un premier pipeline fonctionnel dans l’équipe de Gael Yvert. Alerter la communauté levuriste sur la presence de telles contaminations.
Envisager des etudes fonctionnelles originales ulterieures in sillico.