Ensembl

Cet article est une ébauche concernant les bases de données, la biologie et l’informatique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Ensembl
base de données en ligne, base de données biologiques
Partie deGENCODE, ELIXIR EMBL-EBI Node Modifier
PaysRoyaume-Uni Modifier
Site officielhttp://www.ensembl.org/ Modifier
URLhttps://www.ebi.ac.uk/rdf/services/sparql Modifier
Point d'accès SPARQLhttps://www.ebi.ac.uk/rdf/services/sparql Modifier
Maintenance assurée parInstitut européen de bio-informatique, centre Sanger Modifier

Ensembl est un système bio-informatique d'annotation automatique de génomes. C'est un projet conjoint de l'European Bioinformatics Institute (EBI) et du Wellcome Trust Sanger Institute dont l'idée centrale est d'organiser de vastes champs d'information biologique autour de séquences génomiques.

Annotation automatique

Cette section ne cite pas suffisamment ses sources (février 2015)
Pour l'améliorer, ajoutez des références de qualité et vérifiables (comment faire ?) ou le modèle {{Référence nécessaire}} sur les passages nécessitant une source.

Pour chaque génome analysé, Ensembl tente d'identifier par un processus automatique l'ensemble des gènes qu'il contient. Il s'appuie pour cela sur des données de séquences existantes (ARN, protéines), qu'il « raccroche » sur le génome, pour en déduire la structure des gènes.

Sur cette première strate d'annotation, celle de la structure des gènes, Ensembl va ajouter d'autres éléments, parmi lesquels :

  • variations communes (polymorphismes) ;
  • éléments régulateurs des gènes ;
  • informations sur les protéines codées par les gènes ;
  • annotations externes, à travers le Distributed Annotation System (DAS) ;
  • gènes similaires d'autres organismes ;
  • maladies génétiques et syndromes cliniques.

Les différentes facettes d'Ensembl

Ensembl se présente d'abord comme un « navigateur de génomes » (« Genome Browser ») permettant d'explorer et de visualiser à différents niveaux les génomes de nombreux organismes.

Ensembl est aussi une base de données ouverte dans laquelle on peut librement venir puiser, soit directement, soit à travers une interface de programmation, soit par le système d'interrogation BioMart[1].

Enfin, Ensembl est une infrastructure logicielle ouverte qui permet de construire différents systèmes organisant des données liées aux séquences génomiques.

Culture

Cette section ne cite pas suffisamment ses sources (février 2015)
Pour l'améliorer, ajoutez des références de qualité et vérifiables (comment faire ?) ou le modèle {{Référence nécessaire}} sur les passages nécessitant une source.

Le projet Ensembl est animé par une culture d'ouverture extensive, ce qui se traduit par :

  • une pluralité de modes d'accès aux données : par le site Web, par téléchargement, par l'interface de programmation ;
  • par l'intégration de sources de données externes, en particulier par le système DAS ;
  • par l'accès à l'intégralité des programmes sources ;
  • par l'existence d'un HelpDesk et de listes de discussion.

Notes et références

  1. BioMart

Voir aussi

Liens externes

Sites

  • Ensembl
  • Vega, base de données d'annotations manuelles, de haute qualité, de génomes de vertébrés
  • Autres navigateurs de génomes: UCSC Genome Browser, NCBI Map Viewer

Liens externes

  • (en) Site officielVoir et modifier les données sur Wikidata
  • Notices d'autoritéVoir et modifier les données sur Wikidata :
    • ISNI
v · m
Bio-informatique
Bases de données
Banques de séquences
  • GenBank
  • EMBL Nucleotide Sequence Database
  • DNA Data Bank of Japan (DDBJ)
Secondaires
Autres
Génomiques spécialisées
Institutions
Algorithme
Divers
  • icône décorative Portail de la biologie
  • icône décorative Portail de l’informatique
  • icône décorative Portail des bases de données