Results
R scripts to merge the data available on the following repository:
https://gitbio.ens-lyon.fr/LBMC/sbdm/half_life
Porteur du project
Olivier Gandrillon
Personnes
Olivier Gandrillon
Problématique biologique
Inférer des Réseaux de Régulation Géniques (GRNs) à partir de données d'expression sen cellules uniques
Questions
Générer un fichier des demi-vie des ARNm et des protéines chez l'homme.
Données
Nous disposons de multiples jeux de données de scRNAseq au sein de l'équipe.
Date
La date du début du project: Début Novembre
La date d’obtention des données: existantes
La date souhaitée de fin du project: sous 1 mois
Attentes
L'équipe travaille depuis longtemps à générer des GRNs à partir de données en cellules uniques. L'inférence est vue comme un problème de calibration d'un modèle dont certains paramètres sont inférés et d'autres récupérés de la littérature. Ce dernier cas concerne notamment les demi-vie des ARNm et des protéines des gènes composant le réseau.
Il existe plusieurs resources dans la littérature et notamment :
une étude qui répertorie les demi-vies pour 5000 gènes (ARNs et protéines) chez la souris (Schwanhausser et al. 2011).
une étude genome-wide de la stabilité des mRNAs chez l'homme (Blumberg et al. 2021)
une étude genome-wide de la stabilité des protéines chez l'homme (Li et al. 2021).
L'objet du project sera de construire à partir des ces données une matrice la plus complète possible de la forme :
Gene Names | Protein half-life | Protein source | mRNA half-life | mRNA source |
ACTB | 59 | Li | 2187 | Blumberg |
UBA80 | 13 | Li | 11 | Blumberg |
RPS27A | NA | 12 | Schwanhäusser | |
EEF1A1 | 71 | Li | 3229 | Blumberg |
S100A4 | 5 | Li | NA | |
MTS1 | 65 | Schwanhäusser | 3300 | Schwanhäusser |
LGALS1 | 1840 | Li | 5 | Blumberg |
Dans un deuxième temps, les gènes pour lesquels il n'y a pas d'information disponible pourront être complétés en assumant qu'une proximité fonctionnelle se double d'une demi-vie équivalente. Les gènes proches au terme d'un ontologie de type GO serviront alors à imputer la valeur manquante.
Blumberg, A., Zhao, Y., Huang, Y.F., Dukler, N., Rice, E.J., Chivu, A.G., Krumholz, K., Danko, C.G., and Siepel, A. (2021). Characterizing RNA stability genome-wide through combined analysis of PRO-seq and RNA-seq data. BMC Biol* 19*, 30.
Li, J., Cai, Z., Vaites, L.P., Shen, N., Mitchell, D.C., Huttlin, E.L., Paulo, J.A., Harry, B.L., and Gygi, S.P. (2021). Proteome-wide mapping of short-lived proteins in human cells. Mol Cell* 81*, 4722-4735 e4725.
Schwanhausser, B., Busse, D., Li, N., Dittmar, G., Schuchhardt, J., Wolf, J., Chen, W., and Selbach, M. (2011). Global quantification of mammalian gene expression control. Nature* 473*, 337-342.