Analyse différentielle d’expression en cellules uniques par les méthodes à noyau

Vers un package d’analyse différentielle d’expression en cellules uniques par les méthodes à noyau
software development
R
Python
SBDM Team
Authors

Franck Picard

Anthony Ozier-Lafontaine

Ghislain Durif

Published

July 1, 2022

Résultat

  • Publication (preprint) soumise à Genome Biology intégrant la librairie logicielle développée.

Avancement

  • Été et semestre automne 2022: conseil en programmation et développement pour l’amélioration du prototype du package Python auprès de Anthony Ozier-Lafontaine

  • Début année 2023: intégration du package Python existant dans un package R via l’utilisation de reticulate


Porteur du projet

Franck Picard

Personnes

Franck Picard, Olivier Gandrillon, Philippe Bertolino (CRCL), Anthony Ozier-Lafontaine (EC Nantes), Bertrand Michel (EC Nantes)

Problématique biologique

La question méthodologique qui se pose est celle de l’analyse différentielle de l’expression des gènes dans une expérience de transcriptomique en cellules uniques. L’objectif est de développer un nouveau package dédié à ce type d’analyses qui sont très courantes. Notre approche s’appuie sur des développements récents de machine-learning, qui permettent d’effectuer des tests de comparaison d’expression de gènes de manière non-linéaire, grâce à des méthodes à noyau. Notre objectif à terme est également d’étendre notre logiciel à l’analyse de données de transcriptomique spatiale.

Questions

La question principale c’est celle de l’identification des cellules dont le transcriptome est significativement différent entre deux conditions biologiques, puis d’identifier les gènes responsables de cette différence. Nous souhaitons proposer un package qui s’intégrerait aux packages usuels (comme Seurat), mais qui serait fondé sur de nouvelles méthodes de machine learning pour faire ces tests d’expression différentielle.

Données

Nous disposons déjà des données générées par l’équipe SBDM dans le cadre de la thèse de Camille Fourneaux sur la différenciation de cellules érythropoiétiques chez le poulet. Une collaboration avec l’équipe de Philippe Bertolino nous permet également d’avoir accès aux transcriptomes de cellules tumorales de l’hypophyse (8 tumeurs) dans le cadre d’un projet PLASCAN que nous avons obtenu l’année dernières. Les données en transcriptomiques spatiales sont également disponibles

Date

Démarrage : Juillet 2022 Obtention des données : Déjà obtenues et disponibles

Attentes

Le prototype de la méthode a été développé par Anthony Ozier-Lafontaine, doctorant co-encadré par F. Picard et B. Michel à Nantes. Notre attente serait que le Hub nous aide à passer d’un prototype à la production d’un package efficace et disponible pour la communauté. Nous sollicitons l’expertise de Ghislain Durif pour la réalisation de ce logiciel.