Bioinformatique

Médecine de Précision - Biomarqueurs et Diagnostics

Bioinformatique et biostatistique pour l’analyse des données omiques et de Big Data biologiques

Forte de ses 20 ans d’expériences, Acobiom a acquis une expertise unique dans l’analyse bioinformatique de l’expression des gènes et dans l’identification de biomarqueurs ARN spécifiques de la pathologie ou de la question biologique étudiée. La société a ainsi développé des méthodes et des outils pour l’analyse des données de séquençage utilisant des programmes et des bases de données bioinformatiques propriétaires.

Aperçu des analyses bioinformatiques et biostatistiques fournies et de la base de données MaRS

Bioinformatique pour l’analyse des données de séquençage

Face aux demandes croissantes de méthodes statistiques et d’outils bioinformatiques pour l’analyse et la gestion des énormes quantités de données omiques (séquençage), Acobiom adapte ses outils et paramètres aux spécifications de ses partenaires et à leurs demandes spécifiques.


L’équipe d’Acobiom propose des pipelines et des algorithmes personnalisés pour l’étude de l’expression des gènes et l’analyse des données de séquençage.

Les principales étapes d’un pipeline d’analyse d’expression de gènes sont :

a) Contrôle de la qualité des données, b) Cartographie sur le génome de référence, c) Comptage des séquences cartographiées, d) Normalisation et comparaison, e) Annotation des séquences, f) Vue d’ensemble des gènes exprimés : analyse, visualisation et validation statistique.

Pour chacune des étapes, Acobiom choisit et adapte les outils pour répondre le plus précisémént à la question biologique étudiée.

Biostatistiques

Acobiom possède une expertise de pointe associée à des outils biostatistiques propriétaires : conseil et formation dans le domaine des sciences de la donnée, de la modélisation et de la statistique.

La feuille de route générique comprend plusieurs étapes : 1) prétraitement, 2) contrôle qualité, 3) normalisation, 4) quantification de l’expression, 5) analyse de l’expression différentielle, etc.,
et peut être personnalisée selon les besoins et spécifications du client/partenaire : “machine learning”, analyse statistique multivariée, analyse de survie…

Acobiom peut aussi proposer en amont l’établissement du plan d’expériences le plus adapté à la thématique de recherche afin d’obtenir le plein potentiel des données issues de l’analyse omique associée (séquençage, qPCR).

MaRS (Matrice RNA-Seq) : une base de données de 21.000 profils d’expression RNA-Seq humains

Acobiom a rassemblé dans une même base de données, dénommée MaRS, 21.000 profils d’expression de gènes humains, de type RNA-Seq, produits par des laboratoires du monde entier.

MaRS se concentre sur la méthode RNA-Seq, qui reflète l’expression des gènes dans une condition déterminée. Générés par le séquençage de nouvelle génération (NGS), tous ces profils ont été analysés de manière standardisée sur des Calculateurs Haute-Performance (HPC). La matrice MaRS permet la comparaison directe de tous ces 21.000 profils RNA-Seq et des données transcriptomiques associées.

MaRS contient des profils portant sur des maladies humaines (cancers, infections, maladies génétiques…) et sur de nombreux organes (sang, sein, poumon, foie, pancréas…). Ainsi, ACOBIOM utilise MaRS pour explorer et identifier de nouveaux biomarqueurs, mais également pour combiner ces données récoltées avec des données nouvellement générées.
De plus, MaRS permet de qualifier et/ou d’identifier de nouveaux gènes de référence (“housekeeping genes”) tout aussi importants que les gènes/biomarqueurs ciblés, et qui sont trop souvent négligés dans ces études.

La base de données MaRS est un formidable outil de développement interne pour ACOBIOM. La société propose aussi l’accès à cette base de données à ses partenaires par le biais de services et/ou de collaborations scientifiques.

Vue technique des analyses bioinformatiques et biostatistiques

Workflow suivi dans les traitements bioinformatiques

Analyse des transcriptomes

a/ Profilage de l’expression de gènes dans différentes conditions biologiques (cartographie sur un génome de référence annoté, comptage, normalisation, annotation des séquences), b/ Etude des gènes exprimés et comparaison (analyses différentielles, visualisation and validation statistique).

Méthode d’étude du transcriptome utilisée : RNA-Seq (séquençage (NGS) de tous les ARN messagers dans une condition déterminée).

Services fournis : i) Contrôle Qualité et nettoyage de séquences, ii) Cartographie des séquences sur le génome de référence, iii) Analyse différentielle de l’expression des gènes (gènes différentiellement exprimés ou co-exprimés).

Livrables : i) Séquences brutes (FASTQ), ii) Cartographie des résultats (BAM), iii) Tables des résultats du comptage des séquences identifiés par la cartographie , iv) Tables de comparaison des comptages avec annotations et analyses statistiques.

Analyse de l’exome

Etude des variations génétiques de la partie codante du génome pour une condition définie.

Exome : part du génome constituée par les exons (partie exprimée).

Méthode utilisée : a) Analyse des exons par sequençage NGS haute qualité pour la détection de variants, b) Détection précise des InDel et SNP, annotations.

Services fournis : i) Contrôle qualité et nettoyage des séquences, ii) Cartographie des séquences sur le génome de référence, iii) Analyse des variants par rapport à une référence ou une autre condition.

Livrables : i) Séquences brutes (FASTQ), ii) Résultats de la cartographie (BAM), iii) Tableaux de variants (VCF), annotations, iv) Analyse statistique pour identifier les variants d’intérêt.

Analyse du métagénome et étude de la composition microbienne (Microbiome)

a) Etude de la composition microbienne d’un échantillon dans une condition donnée, b) Nettoyage et regroupement de séquences représentatives en OTU (Operational Taxonomic Units), comptage des populations, c) Analyse taxonomique des échantillons (détection des espèces), d) Analyse de la population et de la diversité (diversité Alpha, Beta).

Services fournis : i) Contrôle de la qualité et nettoyage des séquences, ii) Tables de regroupement et dénombrement des OTU, iii) Fichiers de visualisation (répartition des espèces, histogrammes…).

Assemblage De Novo des génomes et transcriptomes

a) Assemblage De Novo : Assemblage de génome ou de transcriptome sans utilisation d’une référence, b) Nettoyage et assemblage des séquences issues du séquençage haut débit, c) Construction des contigs, d) Création d’une séquence consensus, e) Annotations des séquences, f) Stratégie optimale, spécifiquement adaptée au type de séquençage et à l’organisme étudié.

Services fournis : i) Contrôle qualité et nettoyage des séquences, ii) Fichiers de séquences (FASTA/FASTQ), iii) Fichiers d’annotations, iv) Aperçu statistique et Outils pour la visualisation.

Workflow  dans les analyses biostatistiques

Design d’étude

Acobiom accompagne ses partenaires dans le design/l’établissement du plan d’expériences de leurs études en proposant des protocoles optimisés à leurs besoins : i) Design classique et adaptatif, ii) Calcul de puissance et d’effectif, iii) Rédaction du Plan d’analyse statistique (SAP), iv) Ecriture des parties statistiques du protocole, v) Examen du CRF, vi) Randomisation..

Analyse statistique & Reporting

Analyse statistique et rapport d’étude : i) Analyse inférentielle, analyse descriptive, analyse multivariée, machine learning, clustering supervisé/non supervisé, série temporelle, géostatistique… ii) Production de tables, listes et graphes dédiés à la communication et aux informations règlementées, iii) Rédaction des parties statistiques de l’étude clinique, la production de statistiques, iv) Reporting statistique en adéquation avec les autorités règlementaires v) Rédaction ISE et ISS (Integrated Summaries of Efficacy and Safety) pour les autorités de santé.

Services fournis : i) Analyses d’expression différentielle croisées, ii) Réduction de dimension, iii) Création de classifier, iv) Modélisation, v) Extraction et optimisation de paramètres…

Livrables : i) Synthèse graphique complète et facile à interpréter pour tout type de valorisation, ii) Synthèse analytique en adéquation avec les autorités de santé, iii) Outil prédictif/diagnostic d’aide à la décision, iv) Rédaction pour la valorisation scientifique/industrielle, v) Listing de biomarqueurs validés…