Reunion Comité Biocomputing 2022/01/19

CLUET David

19/01/2022

Recrutement CDD Bac+5

CDD 1 an renouvelable. Déploiement sur Hub bioinfo. Besoin de volontaires pour la fiche de poste -> (Laurent, Audrey, Nicolas, Franck, Daniel).

Analyse génome 3D

Premier recensement des besoin a été peu suivi. Peu de visibilité sur les besoin. 5 équipes utilisent déjà le Hi-C. Gaël devrait suivre. Un pipeline avec Hi-Cpro est déjà disponible sur Nextflow. Comme pas de consenus d’outil, avoir 2, 3 options serait idéal: Différentes spécificité suivant: - Normalisation. - Gestion de grand nombre de reads. - Type de sortie avec niveau de détail. Mission bien adaptée pour le CDD

Aurèle voulait recruter (thésard) un bioinfo sur cette thèmatique (pourrait être déployé autrement que pur génome 3D). Voudrait développer un système de JupiterNB pour comparer 2 matrices et visualiser les données (HiGlass.io).

Si la moitié des équipes ont besoin d’analyser des données HiC -> Tombe dans les missions du Hub.

Procédure de test de bins dépend de la résolution. Détection de pattern et/ou attribution de score par Chromosight. D’autres packages seraient disponibles. Chromosight trés rapide (échelle de la seconde). Peu de quantitatif pour l’instant (plus du visuel). L’analyse dépend beaucoup du projet.

Besoin de faire une veille des outils avec une annotation des fonctions. Des benchmarkings disponibles pour le TAD.

Frank Mortreux meilleur résolution avec 4Cin mais pipeline totalement différents. Les données du séquençage sont différentes.

Diffusion outils de modélisation et machine learning

Initialement diffusion du savoir de la bioinfo avec formations (Nextflow, lignes de commandes). Rendre les biologistes autonomes.

Il faudrait trouver une stratégie similaire pour la modélisation. Visualisation des données et comment formuler des hypothèses.

Mise en commun de procédure d’appréhension des données. Franck -> faire un essais sur un besoin commun, traiter cette question et voire où cela mène.

Daniel -> Séminaires internes/externes de modélisateurs -> Donner les clefs de la compréhension et de communication (vocabulaire, ce qui est possible ou non).

Le CAN va proposer des séminaires orienté BioInfo.

Franck -> Pour l’appropriation des outils, il faut former.

Laurent -> Difficile de former tout le labo.

Franck Mortreux -> Sensibiliser puis orienter.

Laurent -> Visualisation permettrait d’initier les membres du labo à ces problématiques.

Franck -> Tourner une problématique récurrent labo en cours pour former les étudiants.

Marie -> Il faut penser aux différents profils.

Laurent -> Même philosophie que le pool Unix qui a diffusé au LBMC.

Franck -> Se donner un thème (exemple: réduction de dimensions) avec des données du labo.

Si fusion avec séminaire du CAN on peut obtenir masse critique et attirer Biologistes. Mais bien flécher les séminaires pour que les biologistes aillent aux séminaires pertinents.

Fabien D -> Besoin de formation pour l’amont (combien de réplicat pour répondre à la question…).

Laurent -> voire si des BioInfos du HUB aurait de la substance (projets avancés) à présenter (étapes, méthodes)

Aurèle -> Modélisation pas vraiment compatible avec activité expérimentale. Besoin de partage du travail avec des expertises précises avec cross-talk efficace.

Franck -> Analyse bas niveau dans les équipes. Dès que c’est pointu voire avec un spécialiste.

Laurent et Daniel -> Faire tomber barrières et donner les clefs aux biologistes.

Comparaison d’outils de DVC

Laurent -> maintenir différentes versions des résultats d’un projet (modification de code, paramètre), prend du temps Franck -> confronté à ce problème David -> le fait à la main Laurent -> Git n’est pas adapté pour la gestion de gros fichier (NGS, etc.). Mais il existe des outils de Data Version Control (DVC). Qui aurait du temps pour en trouver un bien ?

volontaires: Laurent, David, Nicolas

compilation des outils d’analyse HiC et autres 3D methods :

https://github.com/mdozmorov/HiC_tools