Inférence Réseaux de Régulation Géniques

Inférer des Réseaux de Régulation Géniques (GRNs) à partir de données d’expression sen cellules uniques
scRNA-seq
SBDM Team
Authors

Olivier Gandrillon

Laurent Modolo

Published

September 8, 2022

Results

R scripts to merge the data available on the following repository:

https://gitbio.ens-lyon.fr/LBMC/sbdm/half_life

  • Porteur du project

Olivier Gandrillon

  • Personnes

Olivier Gandrillon

  • Problématique biologique

Inférer des Réseaux de Régulation Géniques (GRNs) à partir de données d'expression sen cellules uniques

  • Questions

Générer un fichier des demi-vie des ARNm et des protéines chez l'homme.

  • Données

Nous disposons de multiples jeux de données de scRNAseq au sein de l'équipe.

  • Date

La date du début du project: Début Novembre

La date d’obtention des données: existantes

La date souhaitée de fin du project: sous 1 mois

  • Attentes

L'équipe travaille depuis longtemps à générer des GRNs à partir de données en cellules uniques. L'inférence est vue comme un problème de calibration d'un modèle dont certains paramètres sont inférés et d'autres récupérés de la littérature. Ce dernier cas concerne notamment les demi-vie des ARNm et des protéines des gènes composant le réseau.

Il existe plusieurs resources dans la littérature et notamment  :

  • une étude qui répertorie les demi-vies pour 5000 gènes (ARNs et protéines) chez la souris (Schwanhausser et al. 2011).

  • une étude genome-wide de la stabilité des mRNAs chez l'homme (Blumberg et al. 2021)

  • une étude genome-wide de la stabilité des protéines chez l'homme (Li et al. 2021).

L'objet du project sera de construire à partir des ces données une matrice la plus complète possible de la forme  :

Gene Names Protein half-life Protein source mRNA half-life mRNA source
ACTB 59 Li 2187 Blumberg
UBA80 13 Li 11 Blumberg
RPS27A NA 12 Schwanhäusser
EEF1A1 71 Li 3229 Blumberg
S100A4 5 Li NA
MTS1 65 Schwanhäusser 3300 Schwanhäusser
LGALS1 1840 Li 5 Blumberg

Dans un deuxième temps, les gènes pour lesquels il n'y a pas d'information disponible pourront être complétés en assumant qu'une proximité fonctionnelle se double d'une demi-vie équivalente. Les gènes proches au terme d'un ontologie de type GO serviront alors à imputer la valeur manquante.

Blumberg, A., Zhao, Y., Huang, Y.F., Dukler, N., Rice, E.J., Chivu, A.G., Krumholz, K., Danko, C.G., and Siepel, A. (2021). Characterizing RNA stability genome-wide through combined analysis of PRO-seq and RNA-seq data. BMC Biol* 19*, 30.

Li, J., Cai, Z., Vaites, L.P., Shen, N., Mitchell, D.C., Huttlin, E.L., Paulo, J.A., Harry, B.L., and Gygi, S.P. (2021). Proteome-wide mapping of short-lived proteins in human cells. Mol Cell* 81*, 4722-4735 e4725.

Schwanhausser, B., Busse, D., Li, N., Dittmar, G., Schuchhardt, J., Wolf, J., Chen, W., and Selbach, M. (2011). Global quantification of mammalian gene expression control. Nature* 473*, 337-342.