MASTER 1 BI-IPFB
SEMESTRE 1
S1
M1
Remise à niveau : R et Unix
Objectifs : Acquérir les bases de l’utilisation du système d’exploitation Unix et du logiciel R
Biochimie :
Objectifs en termes de connaissances :
- Principes et méthodes spectroscopiques pour l’étude de la structure 3D et dynamique des macromolécules biologiques
- Principes de la thermodynamique
- Notion d’enzymologie et Cinétique chimique
Contenu :
- La génomique et protéomique structurale : le repliement 3D des macromolécules : ADN, ARN et protéines, membranes biologiques.
- Techniques biophysiques : Dichroisme circulaire, Fluorescence, Electrophorese, Spectrométrie de masse, Microscopie électronique
- Techniques thermodynamiques pour l’étude des interactions: microcalorimetrie, dialyse à l’équilibre
- Notions avancées d’enzymologie
- Notions de cinétique des interactions
FONDAMENTAUX
S1
M1
Biostatistiques et Programmation R :
Objectifs en termes de connaissances :
L'enseignement dispensé a pour but de donner une formation en biostatistique de base aux étudiants.
Contenu :
- Rappels de probabilités, introduction aux biostatistiques
- Estimation et inférence statistique
- Tests classiques, test de Student, test du Chi2, test du coefficient de corrélation de Pearson
- Analyse de la variance et introduction aux plans factoriels
- Tests non paramétriques
- Initiation aux techniques d’apprentissage supervisée par les méthodes de CART / ou Plan factoriel
Projet tuteuré en biostatistique et R :
Objectifs en termes de connaissances :
Connaître les méthodes informatiques et outils adaptés à la résolution d’un problème.
Contenu :
- Différents projets seront proposés par des partenaires du master, chercheurs au sein d’entreprise R&D ou de laboratoire de recherche.
- L’étudiant devra développer si nécessaire les programmes pour résoudre cette question et conduire de manière critique les analyses demandées
- Le niveau des projets sera évalué par les responsables de l’ECUE afin de vérifier qu’ils sont compatibles avec les connaissances et compétences de l’étudiant
- Dans cette ECUE, un soin particulier devra être apporté au développement du logiciel tant sur sa facilité d’utilisation, son efficacité et les modes d’emploi associés.
Optimisation et apprentissage en biologie :
Objectifs en termes de connaissances :
- Principes de l'optimisation et de ses applications à la modélisation en biologie ;
- Applications et mise en œuvre des mathématiques aux problèmes de la biologie computationnelle (accessible aux biologistes)
Contenu :
- Analyse des fonctions à plusieurs variables : gradient, hessien et développements limités , conditions d'optimalités ;
- Algorithmes de gradients, gradients conjuguées, quasi-Newton
- Applications classiques de l'optimisation à l'analyse de données ;
- Application aux méthodes d'apprentissage : Réseaux de neurones ,Support Vector Machines , Deep learning
PROGRAMMATION
ET OUTILS
MATHÉMATIQUES
S1
M1
Programmation Python 1 :
Objectifs en termes de connaissances :
Former les biologistes à la programmation Python. Python est le langage de programmation le plus utilisé aujourd’hui en bioinformatique, notamment pour l’analyse de données.
Contenu :
- Notion de programmation
- Introduction au langage Python
- Principaux type de données (entiers, réels, listes, chaînes de caractères, dictionnaires, tuples)
- Boucles, comparaisons, tests
- Modules
- Gestion des entrées /sorties avec les fichiers
- Fonctions
Programmation Python 2 :
Objectifs en termes de connaissances :
Former des bioinformaticiens à la programmation Python. Acquérir une autonomie dans le développement d’un programme Python. Python est le langage de programmation le plus utilisé aujourd’hui en bioinformatique, notamment pour l’analyse de données. Il est très demandé dans les laboratoires, mais aussi dans les entreprises privées.
Contenu :
- Principaux type de données (entiers, floats, listes, chaînes de caractères, dictionnaires, tuples)
- Boucles, comparaisons, tests
- Modules
- Gestion des entrées /sorties avec les fichiers
- Fonctions
- Expressions régulières
- Notion de classes en Python
Algorithmique 1 :
Objectifs en termes de connaissances :
Former aux méthodes générales de conception d'algorithmes (récursivité, programmation dynamique, algorithmes gloutons, etc.) à propos d'algorithmes de base: les différents tris élémentaires, le tri fusion, le tri rapide, la structure de tas, les arbres binaires de recherche, les fonctions de hachage, le parcours d'un graphe
Contenu :
- Présentation informelle des notions de complexité d’algorithmes, de NP-complétude et d’approximation polynomiale.
- Distance et similitude entre séquences.
- Alignement deux à deux et alignement multiple.
- Alignements approchés (en étoile, en arbre).
- Assemblage de fragments (graphe des chevauchements) et cartographie physique (son interprétation matricielle).
- Réarrangements de gènes par inversions (solution approchée polynomiale)
Phylogénie basée sur les caractères (algorithme de Fitch), phylogénie basée sur les distances additive et ultramétrique.
Algorithmique 2 :
Objectifs en termes de connaissances :
Acquérir des notions solides en algorithmique discrète. Ainsi nous étudierons les principaux paradigmes algorithmiques. Les exemples étant choisis tant que possible en bioinformatique. Les objets manipulés dans ce cours seront des caractères, des chaînes de caractères( ou séquences), des graphes, des matrices (de distance).
Contenu :
Rappels de complexité algorithmique: algorithmes de tri d'entiers, tri par inversion (applications aux séquences génomiques). Récursivité et équations de récurrence de complexité, exemples: tri par fusion, recherche d'un élément médian d'un tableau.
Algorithmes de graphes: Arbres, arbres recouvrant de poids minimum (algorithmes gloutons, notions d'échanges) d'un graphe non orienté valué. Principaux algorithmes de calcul de plus courts chemins dans un graphe orienté valué. Algorithmes pour les calculs de fermeture et réduction transitive d'un graphe orienté sans circuit.
Programmation dynamique: Etude sur des exemples de ce paradigme algorithmique.
Algorithmes d'énumération: Enumération de toutes les permutations sur n éléments. Algorithme pour l'énumération de toutes les cliques maximales d'un graphe. Notion de backtrack.
Introduction à la cryptographie : Notions de codes à clef publique (RSA).
Applications en bioinformatique: Recherche de motifs communs à deux séquences Isomorphismes d'arbres. Arbres et matrices de distance. Approximation. Phylogénie. Calculs de distances d'édition.
S1
M1
PRATIQUE ET APPROFONDISSEMENT
Optimisation et apprentissage en biologie :
Objectifs en termes de connaissances :
- Principes de l'optimisation et de ses applications à la modélisation en biologie ;
- Applications et mise en œuvre des mathématiques aux problèmes de la biologie computationnelle (accessible aux biologistes)
Contenu :
- Analyse des fonctions à plusieurs variables : gradient, hessien et développements limités , conditions d'optimalités ;
- Algorithmes de gradients, gradients conjuguées, quasi-Newton
- Applications classiques de l'optimisation à l'analyse de données ;
- Application aux méthodes d'apprentissage : Réseaux de neurones ,Support Vector Machines , Deep learning
ORIENTATION THÉMATIQUE
S1
M1
Biologie innovante :
Objectifs en termes de connaissances :
Apprendre les techniques récentes développées en biologie moléculaire et cellulaire.
Contenu :
- Principes, techniques et limites du CRISPR-Cas9
- Principes, techniques et applications des nanotechnologies
- Principe et applications de la biologie de synthèse
- Principe, technique et application du peignage moléculaire
Bioinformatique de base :
Objectifs en termes de connaissances :
Comprendre les principaux concepts et outils de la bioinformatique
Contenu :
- Les principales bases de données : Génomique, Protéomique, Structurale, …: GenBank, Uniprot, Bases plus spécialisées
Notion de curation, Redondance.
- Algorithmes de Recherche dans les bases de données: Principe de Blast et ses dérivés.
- Comparaison de séquences : Pourquoi, comment :
Score de la similitude : Matrices de substitution
- Les algorithmes de comparaison et d’alignement de séquences (NW, SW), local & global.
- Distinction entre alignement et recherche dans les BD.
- Les alignements multiples : Principes des algorithmes et la notion d’heuristique dans les algorithmes.
- Représentation
- Analyse des résultats : E-value et score, notion de recouvrement
- Notion de phylogénie
MASTER 1 BI-IPFB
SEMESTRE 2
S2
M1
S2
M1
FONDAMENTAUX AVANCÉS
Approches biophysiques pour l'étude des interactions :
Objectifs en termes de connaissances :
Apprendre les méthodes biophysiques, moléculaires et cellulaires pour l’étude des interactions entre macromolécules. Comprendre les concepts de biologie des systèmes et des interactomes.
Contenu :
- Notion d’interactome
- Principes et techniques biophysiques des interactions protéines-protéines (double hybride, co-immunoprécipitation, TAP-Tag, FRET, BRET, test de complémentation de fragments protéiques, spectrométrie de masse)
- Principes et techniques biophysiques des Interactions entre macromolécules
- Etudes dynamiques et structurales des interactions par RMN
- Concept de la biologie des systèmes et applications
Analyse de données massives :
Objectifs en termes de connaissances :
L'enseignement a ensuite pour but d’initier les étudiants aux méthodes d’apprentissage non supervisées (classification, analyse en composantes principales) et supervisées (Cart, Random Forest régression linéaire et PLS, analyse linéaire discriminante et régression logistique) pour leur permettre d'analyser et de traiter de grands ensembles de données multidimensionnelles en bioinformatique. L'application des différentes notions sera faite à l'aide du logiciel statistique R. L’évaluation de la performance des méthodes et sélection de descripteurs seront traités.
Contenu :
- Exemple sur espace des protéines
- Méthodes descriptives ou exploratoires :
Méthodes factorielles (Analyse en Composantes Principales, qui produisent essentiellement des visualisations graphiques planes ou tridimensionnelles pour décrire un ensemble des données. Méthodes de classification (hiérarchique ou de partitionnement) qui proposent des groupements en classes d'objets à la suite de calculs algorithmiques
- Méthodes explicatives et/ou prédictives :
Méthodes destinées à expliquer ou à prédire, suivant des règles de décision, une variable d'intérêt quantitative ou qualitatives à l'aide d'un ensemble de variables explicatives. Modèle linéaire, PLS, Régression logistique, CART. Analyse discriminante. Validation croisée.
Bioinformatique Structurale 1 :
Objectifs en termes de connaissances :
- Méthodes bioinformatiques de prédiction de la structure secondaire des macromolécules
- L’homologie et ses conséquences sur la conservation du repliement.
Contenu :
- La comparaison des séquences, et la conservation des repliements :
- Les méthodes et outils de comparaison de structure
- Les principes des méthodes de modélisation comparative et les outils
- L’évaluation des modèles : les mesures et les méthodes.
Traitement d’images :
Objectifs en termes de connaissances :
- Apprendre les concepts et méthodologies du traitement d’images.
- Mise en situation sur des cas concrets
Contenu :
- Image J
- Segmentation 2D
- Comptage
- Mesures
- Filtrages
- Analyses fréquentielles,
- Co-localisation
- Déconvolution
- Reconstructions et représentations 3D
Traitement du signal :
Objectifs en termes de connaissances :
Apprendre les outils d’analyse et de traitement des signaux
Contenu :
- Définition, traitement et interprétations des signaux
- Transformation de Fourier
- Systèmes linéaires continus
- Notions de filtrage
Programmation Web :
Objectifs en termes de connaissances :
L’objectif de ce cours est maîtriser les bases de la programmation web côté client.
Contenu :
- Langage HTML, CSS et JavaScript.
Projets Rosalind :
Objectifs en termes de connaissances :
Méthodes bioinformatiques, Programmation et algorithmes de la bioinformatique
Contenu :
Résoudre différents problèmes proposés par la plateforme ROSALIND. L’étudiant sélectionnera au moins 2 items parmi les 4 proposés par la plateforme :
Bioinformatics Stronghold
Python
Bioinformatics armory
Algorithmics Height.
ORIENTATION THÉMATIQUE II
S2
M1
Omiques 1 :
Objectifs en termes de connaissances :
Approche de la génomique du gène à l’analyse des données en combinant la biologie et l’informatique
Mise en situation au travers d’exemples concrets
Contenu :
- Les enjeux de la génomique et ses applications
- Le processus expérimental, ses principes, ses limites et la qualité des données produites
- Les techniques standards et de haut débit de séquençage des génomes ( RT-PCR, Q-PCR & Sanger, NGS : Les différentes approches : Illumina, Minion, Nanopore, etc…)
- L’analyse des données (notions de longueurs de reads, recouvrement/profondeur, génome de référence et séquençage de novo)
- Les logiciels d’exploitation des données
Génétique des Populations :
Objectifs en termes de connaissances :
Cet enseignement concerne les processus évolutifs agissant sur la diversité moléculaire des génomes à l'échelle des individus et des populations. Il décrira les méthodes de modélisation, de simulations et d'inférence de ces processus à partir de données de polymorphisme génétique.
Contenu :
- Rappels des concepts de base de génétique des populations : notion de population, de structure génétique, de polymorphisme, de régime de reproduction, de force évolutive, équilibre de Hardy-Weiberg, déséquilibre de liaison
- Structuration de populations
- Modélisation et simulation en génétique des populations - En particulier: dérive génétique et coalescence
- Inférences démographiques et détection de sélection
Génomique et évolution bactérienne et virale :
Objectifs en termes de connaissances :
Appréhender les apports récents de la génomique à l’étude des bactéries et des virus, les outils d’analyse de la diversité et de l’évolution des microorganismes et des virus, les approches de génomique fonctionnelle, les stratégies multi-échelle, de biologie des systèmes et de synthèse.
Contenu :
- Introduction à la Microbiologie.
Les stratégies de séquençage et les spécificités des génomes bactériens.
- Approches pour la manipulation facile et efficace des gènes et des génomes et leurs développements en génomique fonctionnelle et biologie de synthèse.
- Dynamique d’évolution des génomes bactériens et viraux (notions de quasi-espèces).
- Réseaux de régulation, physiologie intégrative et biologie des systèmes en bactériologie et en virologie.
Interactions moléculaires dans les milieux biologiques :
Objectifs en termes de connaissances :
Apprendre les concepts de forces mises en jeu dans les interactions moléculaires en biologie.
Appliquer à la notion de dynamique des molécules dans les milieux biologiques.
Démonstration en laboratoire
Contenu :
- Conformation des macromolécules
- Interactions intermoléculaires et conséquences sur les structures biologiques
- Les protéines fluorescentes et photo-convertibles et leur fonctionnement
- Biologie des systèmes et mécanique cellulaire
- Contrôle de l’activité cellulaire par des molécules cagées
- Démonstration en laboratoire
Stabilité des génomes et des épigénomes :
Connaître les mécanismes moléculaires fondamentaux assurant une transmission stable de l’information génomique et épigénomique au niveau cellulaire, au niveau de la vie d’un individu et au niveau évolutif. Les processus responsables de l’altération de cette stabilité seront aussi étudiés accompagnés par les enjeux sociétales que posent ces altérations.
Objectifs en termes de connaissances :
Contenu :
Cet enseignement sera sous la forme d’un cycle de conférences (cours) dont les séquences suivraient une ligne pédagogique définie permettant l'appréhension des enseignements par les étudiants de la manière la plus intégrée possible. Cette ligne pédagogique s'efforcera de faire le lien entre les processus moléculaires mise en jeu et l'organisation au niveau génomique, cellulaire et de l’individu.
L'enseignement portera donc sur plusieurs thématiques et avec plusieurs organismes modèles (bactéries, archées, champignons, plantes et métazoaires dont mammifères) :
- les dommages à l’ADN induits par des facteurs intrinsèques ou extrinsèques
- La réplication de l'ADN, sa régulation et ses dysfonctionnements
- quelles conditions créent de l'instabilité dans un génome
- les différents mécanismes moléculaires permettant la stabilité du génome.
- l'impact de ces différents mécanismes sur :
> la cellule
> l'individu
> l'évolution
> le vieillissement