Wikidata:Bases de Datos Biociencias

From Wikidata
Jump to navigation Jump to search







Avances del proyecto




¿Cómo contribuir?




El wikiproyecto Bases de Datos de Biociencias tiene como objetivo curar las bases de datos de Biociencias disponibles en la Web y activas para tener información completa, estructurada, actualizada, fiable y de calidad para ser utilizada en investigación, enseñanza, difusión, comunicación y gestión científica, especialmente en el área de las ciencias de la vida, biomedicina, biodiversidad y bioinformática.

El proyecto[edit]


Queremos reunir todas las bases de datos abiertas y activas para biociencias en Wikidata, para que sean encontrables, accesibles y usadas por investigadores, profesores, estudiantes e interesados en las biociencias. Existen miles de bases de datos con información generada por las investigaciones científicas, pero es difícil encontrarlas y saber qué contienen para poder reutilizarlas en la generación de nuevas preguntas. Nuestra meta es que todos los interesados tengan acceso a la información y puedan procesarla, en especial en los países que no son angloparlantes y que tienen menos materiales que expliquen la información especializada al público en general.

Nos proponemos difundir el uso de las bases de datos en la enseñanza universitaria y promover las biociencias in silico entre los ciudadanos interesados en la ciencia.


En enero de 2022 empecé a consultar las bases de datos biológicas en Wikipedia y había muy pocas y desactualizadas, esto me llevó a verlas en Wikidata y sucedió lo mismo, faltan metadatos y solo había más de 700 bases de datos. Poco después empecé a registrar las bases de datos indexadas en The NAR online Molecular Biology Database Collection (Nucleic Acids Research (NAR) database (Q110211927)) y en The Bioregistry (Q109302681). Entonces para febrero de este mismo año reuní a varios colaboradores de mi equipo para completar con detalle las bases de datos de biociencias en Wikidata.

Hemos reunido algunas fuentes anteriores que hemos usado como referencia y que listo a continuación.

Entendemos por Biociencias al dominio de conocimiento que integra todos aquellos saberes de interés para las ciencias de la vida, médicas y biomédicas.

Los principales proveedores de bases de datos son:

El European Bioinformatics Institute (Q1341845) (EBI)

El National Center for Biotechnology Information (Q82494) (NCBI) de EE. UU.

El Centro Nacional de Datos Genómicos (NGDC) en China


Queremos indagar las respuestas a las siguientes preguntas y generar mapas de conocimiento para responderlas:

  • Cuántas bases de datos existen y sobre qué temas tratan
  • Cuál es el ritmo de creación y vencimiento de las bases de datos
  • Qué tipos de entidades biológicas indexan
  • En qué investigaciones e innovaciones se aplican
  • Cuáles son las más utilizadas
  • Cómo son utilizadas
  • Cuál es su impacto
  • De qué regiones son
  • Qué licencias tienen
  • Qué tipos de tecnología implementan: XML, JSON, RDF, etc...

El plan de trabajo[edit]

  1. Agregar las fuentes de información sobre bases de datos en Wikidata
  2. Indexar las bases de datos y catálogos de bases de datos, ontologías y herramientas asociadas a wikidata
  3. Curar las bases de datos de Biociencias de Wikidata para obtener gráficas de conocimiento actualizadas y de calidad
  4. Agregar en Wikidata las bases de datos registradas en The NAR online Molecular Biology Database Collection (Nucleic Acids Research (NAR) database (Q110211927))
  5. Agregar las bases de datos registradas en The Bioregistry (Q109302681) que no tienen una entrada en Wikidata Bioregistry NO Wikidata
  6. Bases de datos, ontologías y herramientas para biology of colour (Q105582462) y Color en los seres vivos (color in nature (Q105096490))
  7. Bases de datos, ontologías y herramientas para herpetología
  8. Bases de datos, ontologías y herramientas para investigar sobre enfermedades
  9. Adicionar las bases de datos de biociencias generadas en México en Wikidata

En este servicio podemos realizar notas


Estos son algunos ejemplos de registros de bases de datos de biociencias en wikidata que se pueden consultar como ejemplo para facilitar la comprensión de los elementos y las propiedades utilizadas para describir estas entidades.

Elementos principales[edit]

biological database (Q4117139) biological database
medical database (Q1916557) medical database
global species database (Q5570651) global species database
bibliographic database (Q1789476) bibliographic database
taxonomic database (Q7689673) taxonomic database
chemical database (Q2881060) chemical database
model organism database (Q28208970) model organism database
citizen science project (Q24577212) citizen science project

Descrito en catálogos, plataformas o bases de datos de calidad[edit]

Existen varias fuentes para localizar bases de datos de biociencias de calidad que serán usadas como referencias.

The Bioregistry (Q109302681) The Bioregistry
Nucleic Acids Research (NAR) database (Q110211927) The NAR online Molecular Biology Database Collection
SciCrunch (Q23876293) SciCrunch
Registry of Research Data Repositories (Q18393912) Registry of Research Data Repositories

Identificadores[edit] (Q16335166) Registry

Otros elementos[edit]

website (Q35127) website - Wikidata


Propiedades principales[edit]

Estas son algunas de las propiedades que se usan para describir a las bases de datos, el número superíndice se refiere a propiedades que están muy relacionas, con un asterisco (*) se marca la opción más adecuada y con NA superíndice (NA) se indica que esa propiedad no aplica para bases de datos.

instance of (P31) instance of
short name (P1813) short name
official website (P856) official website
stated in (P248) stated in1
publication date (P577) publication date1*
inception (P571) inception1
URL (P2699) URL
country (P17) country3
country of origin (P495) country of origin3*
based on (P144) based on
copyright license (P275) copyright license5
copyright status (P6216) copyright status5
copyright holder (P3931) copyright holder5
maintained by (P126) maintained by
described by source (P1343) described by source
part of (P361) part of
main subject (P921) main subject6*
field of work (P101) field of work6
editor (P98) editor
access restriction status (P7228) access restriction status
web feed URL (P1019) web feed URL
different from (P1889) different from
API endpoint URL (P6269) API endpoint
Google Knowledge Graph ID (P2671) Google Knowledge Graph ID
language of work or name (P407) language of work or name4
official language (P37) official language4NA
Wikidata property (P1687) Wikidata property
founded by (P112) founded by
genre (P136) genre
Twitter (X) username (P2002) Twitter username
collection or exhibition size (P1436) collection or exhibition size2
number of records (P4876) Number of records2*
amount cataloged (P7328) amount cataloged
last update (P5017) last update

Algunos identificadores para estos elementos son los siguientes: prefix (P4793) prefix
Freebase ID (P646) Freebase ID
Linked Open Data Cloud ID (P8605) Linked Open Data Cloud identifier
Google Knowledge Graph ID (P2671) Google Knowledge Graph ID

Otras propiedades[edit]

collection (P195) collection
platform (P400) platform
foundational text (P457) foundational text
main subject (P921) main subject
web feed URL (P1019) web feed URL
curator (P1640) curator
source of material (P2647) source of material
file format (P2701) file format
code of nomenclature (P944) Code of nomenclature
media type (P1163) media type

Propiedades para este proyecto[edit]

on focus list of Wikimedia project (P5008)
Biosciences databases (Q111805275) este proyecto


Consultas principales[edit]

Estas consultas son las que más utilizamos para recuperar información de Wikidata en el proceso de biocuración, algunas las hemos realizado nosotros, otras nos las han compartido colaboradores y las últimas las hemos reunido a través de Google y Twitter. ¡Gracias a todos los que comparten sus consultas en SPARQL!

Consulta para obtener las bases de datos de biociencias[edit]

# another property should be used
SELECT DISTINCT ?item ?itemLabel ?p_gina_web_oficial WHERE {
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE]". }
        ?item p:P31 ?statement0.
        ?statement0 (ps:P31/(wdt:P279*)) wd:Q4117139.
        ?item p:P31 ?statement1.
        ?statement1 (ps:P31/(wdt:P279*)) wd:Q1916557.
    LIMIT 3000
  OPTIONAL { ?item wdt:P856 ?p_gina_web_oficial. }

Try it!

# another property should be used
SELECT DISTINCT ?item  ?itemLabel ?reference
  ?item p:P1343 ?statement. #BASE DE DATOS NAR
  ?statement ps:P1343 wd:Q110211927.
  ?statement prov:wasDerivedFrom [ pr:P854 ?reference ] .
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
order by ?itemLabel

Try it!

  • Consulta que muestra los nombres de las bases de datos con etiqueta en Inglés
# another property should be used
SELECT DISTINCT ?item ?itemLabel ?p_gina_web_oficial WHERE {
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
        ?item p:P31 ?statement0.
        ?statement0 (ps:P31/(wdt:P279*)) wd:Q4117139.
        ?item p:P31 ?statement1.
        ?statement1 (ps:P31/(wdt:P279*)) wd:Q1916557.
    LIMIT 3000
  OPTIONAL { ?item wdt:P856 ?p_gina_web_oficial. }

Try it!

# another property should be used
SELECT   ?temaLabel (COUNT(?tema) AS ?total )
  ?item wdt:P31 wd:Q4117139.
  ?item wdt:P921 ?tema.
 SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en,fr,es,de,ru,it,nl,ja,zh,pl,cs". }}
GROUP BY ?temaLabel

Try it!

# another property should be used
SELECT DISTINCT ?item ?itemLabel ?itemDescription (SAMPLE(?image) AS ?image) ?sitelink WHERE {
  ?item wdt:P31 wd:Q4117139.
  OPTIONAL { ?item wdt:P18 ?image. }
    ?sitelink schema:about ?item;
      schema:isPartOf <>.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en,fr,es,de,ru,it,nl,ja,zh,pl,cs". }
GROUP BY ?item ?itemLabel ?itemDescription ?sitelink
LIMIT 1000

Try it!

  • Esta consulta obtiene todas las bases de datos en Wikidata que tienen una propiedad de Wikidata asociada y alguna otra información interesante que la acompaña
# another property should be used
        ?database ?databaseLabel ?databaseMiriam ?databaseHomepage
        ?prop ?propLabel ?propMiriam ?propHomepage ?propFormat ?propFormatRDF ?propPattern
        # ?propDatabase ?propDatabaseLabel
    WHERE {
        ?database wdt:P31 wd:Q4117139 .
        ?database wdt:P1687 ?prop .
        OPTIONAL { ?database wdt:P856 ?databaseHomepage } .
        OPTIONAL { ?database wdt:P4793 ?databaseMiriam } .
        OPTIONAL { ?prop wdt:P4793 ?propMiriam } .
        OPTIONAL { ?prop wdt:P1630 ?propFormat } .
        OPTIONAL { ?prop wdt:P1921 ?propFormatRDF } .
        OPTIONAL { ?prop wdt:P1793 ?propPattern } .
        OPTIONAL { ?prop wdt:P1896 ?propHomepage } .
        OPTIONAL { ?prop wdt:P1629 ?propDatabase } .
        SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
    ORDER BY DESC(?databaseLabel)

Try it!

# another property should be used
SELECT DISTINCT ?item ?itemLabel WHERE {
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE]". }
        ?item p:P31 ?statement0.
        ?statement0 (ps:P31/(wdt:P279*)) wd:Q4117139.
        ?item p:P31 ?statement1.
        ?statement1 (ps:P31/(wdt:P279*)) wd:Q1916557.
      ?item p:P31 ?statement2.
      ?statement2 (ps:P31/(wdt:P279*)) wd:Q1789476.
    LIMIT 3000

Try it!

# another property should be used
SELECT   ?itemLabel ?sponsorLabel
  ?item wdt:P31 wd:Q4117139.
  ?item wdt:P859 ?sponsor.
 SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }

Try it!

# another property should be used
SELECT DISTINCT ?license (count(?license) as ?licenseType)
	?item wdt:P31 wd:Q4117139 ;
          rdfs:label ?name .
    OPTIONAL {?item  wdt:P275 ?licenseItem .
    ?licenseItem rdfs:label ?license . 
    FILTER (LANG(?license) = "en")}
    FILTER (LANG(?name) = "en")	
GROUP BY ?license

Try it!

# another property should be used
SELECT DISTINCT ?desc (count(?desc) as ?descType)
	?item wdt:P31 wd:Q4117139 ;
          rdfs:label ?name .
    OPTIONAL {?item  wdt:P1343 ?descItem .
    ?descItem rdfs:label ?desc . 
    FILTER (LANG(?desc) = "en")}
    FILTER (LANG(?name) = "en")	
GROUP BY ?desc
Order By DESC(count(?desc))

Try it!

# another property should be used
SELECT ?item ?itemLabel WHERE {
  ?item wdt:P1343 wd:Q110211927.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }

Try it!

# another property should be used
SELECT DISTINCT ?item ?itemLabel WHERE {
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE]". }
        ?item p:P361 ?statement0.
        ?statement0 (ps:P361/(wdt:P279*)) wd:Q110211927.
        ?item p:P279 ?statement1.
        ?statement1 (ps:P279/(wdt:P279*)) wd:Q110577062.
      MINUS {
        ?item p:P31 ?statement2.
        ?statement2 (ps:P31/(wdt:P279*)) wd:Q13442814.
      MINUS {
        ?item p:P31 ?statement3.
        ?statement3 (ps:P31/(wdt:P279*)) wd:Q4117139.
    LIMIT 100

Try it!

  • Consulta que enumera todas las bases de datos que tienen el predicado "descrito por la fuente" que apunta al Bioregistry
# another property should be used
SELECT ?item ?itemLabel 
  ?item wdt:P1343 wd:Q109302681.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }

Try it!

# another property should be used
SELECT DISTINCT ?item ?itemLabel ?p_gina_web_oficial (CONCAT("",?twitterName) AS ?twitterlink) ?twitterName
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
        ?item p:P31 ?statement0.
        ?statement0 (ps:P31/(wdt:P279*)) wd:Q4117139.
        ?item p:P31 ?statement1.
        ?statement1 (ps:P31/(wdt:P279*)) wd:Q1916557.
    LIMIT 3000
  { ?item wdt:P2002 ?twitterName. }
  OPTIONAL { ?item wdt:P856 ?p_gina_web_oficial. }

Try it!

  • Esta consulta muestra todas las bases de datos con Twitter y pagina principal
# another property should be used
SELECT DISTINCT ?item ?itemLabel ?p_gina_web_oficial (CONCAT("",?twitterName) AS ?twitterlink) ?twitterName
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
        ?item p:P31 ?statement0.
        ?statement0 (ps:P31/(wdt:P279*)) wd:Q4117139.
        ?item p:P31 ?statement1.
        ?statement1 (ps:P31/(wdt:P279*)) wd:Q1916557.
    LIMIT 3000
  OPTIONAL { ?item wdt:P856 ?p_gina_web_oficial. }
  OPTIONAL { ?item wdt:P2002 ?twitterName. }

Try it!

Otras consultas[edit]

  • ...


Estas son las herramientas que utilizamos para la realización del proyecto

Propiedades de Wikidata[edit]

Edición de Wikidata[edit]



Ver wikidata[edit]


Category:WikiProject resources

 Info You can use the AutoEdit tool to quickly add label and description on Bases de Datos Biociencias in many languages.

Proyectos relacionados[edit]

Estos son algunos proyectos relacionados



[+] Add yourself to the list

The participants listed below can be notified using the following template in discussions:
{{Ping project|Bases de Datos Biociencias}}