Contamination au saumon des souches de levures de laboratoire

Développer un pipeline pour mapper des reads sur un metagenome constitué du genome du Saumon et de S. cerevisiae.
ChIP-seq
RNA-seq
Nextflow
co-encadrement
GCLS Team
Authors

Gael Yvert

Lauren Picard

Laurent Modolo

Published

May 9, 2019

Results

This project was handled by an INSA student who wrote a dedicated pipeline available at the following url and a report

https://gitbio.ens-lyon.fr/LBMC/gylab/salmoninyeast

Porteur du project

Gael Yvert

Personnes

Gael Yvert, Lauren Picard (Stagiaire BIM INSA 3e annee)

Problématique biologique

Les levures de laboratoire sont modifiées génétiquement par la technique de transformation d’ADN, qui utilise l’ajout d’ADN de saumon comme “carrier” . Les caracterisations sont ensuite basées sur les sequences de levure etudiees, jamais sur la possibilite d’avoir integré de l’ADN de saumon dans la cellule de levure. Il est donc possible que le genome des souches de laboratoires soit contaminé par de l’ADN de saumon.

Project haut risque complètement exploratoire qui a déjà commencé en remplacement d’un project de stage initial pour lequel nous n’avons pas encore les données ChIPseq de nos collaborateurs. Je sollicite l’aide de Laurent Modolo pour co-encadrer Lauren. Le project est viable sans cette aide, mais ce serait bien plus efficace avec...

Questions

1. Les souches de laboratoire sont-elles contaminées par de l’ADN de saumon ?

Développer un pipeline Nextflow pour mapper des reads RSA Illumina paired-end sur un metagenome constitué du genome du Saumon (Nature 2016) et de cerevisiae (Souche de ref S288c) et pour détecter les contaminations Salmon.

2. Si oui, comment cet AND est-il organisé ? Rechercher les frontieres levure-saumon des insertions contaminantes. Définir ensuite s’il est possible d’etudier comment cet AND est régulé. Appliquer le pipeline à divers jeux de données publiés (WGS, ChIP-Seq, RNA-SEQ) pour determiner lesquels contiennent la contamination. Definir ensuite ce qu’il est possible de faire comme enquête sur la regulation (epissage, response au stress, 3D…).

Données

Genome saumon: https://www.ncbi.nlm.nih.gov/assembly/GCF_000233375.1/

Genome levure: https://downloads.yeastgenome.org/sequence/S288C_reference/genome_releases/S288C_reference_genome_R64-2-1_20150113.tgz

Data NGS to map: numerous! Je propose de commencer par SRX4099981.

Date

Le project a déjà commencé.

La date du début du project: Mai 2019
La date de fin de project: 31 juillet 2019.

Attentes

Former un etudiant et obtenir un premier pipeline fonctionnel dans l’équipe de Gael Yvert. Alerter la communauté levuriste sur la presence de telles contaminations.

Envisager des etudes fonctionnelles originales ulterieures in sillico.