Wikidata: flujo de trabajo con datos abiertos enlazados

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Wikidata:Linked open data workflow and the translation is 100% complete.
Other languages:
English • ‎español • ‎français

Hay muchas consideraciones a la hora de aportar datos, archivos u otros recursos a los proyectos Wikimedia. Este cuadro intenta enumerar algunas de ellas así como herramientas de seguimiento y scripts que forman parte del flujo de trabajo con datos enlazados. Se basa en este cuadro de Outreach Wiki.

PREPARA y ordena los datos y los archivos RECONCILIA con el modelado de Wikimedia INCLUYE datos y archivos ANALIZA, corrige, y enriquece REUTILIZA contenido dentro de wiki y externamente INFORMA y mide
Notas

Intenta encontrar un proyecto o colección similar en Wikidata o Commons para ver cómo se ha hecho en el pasado.


Haz preguntas en el chat del proyecto en Wikidata o en el Village Pump de Commons.


Quienes donan contenido deben asegurarse de que los recursos se liberan bajo una licencia libre o de que los derechos de autor han expirado. Una manera fácil de preparar imágenes para Commons es subir las colecciones a Flickr y establecer la licencia adecuada para las imágenes (CC0, CC-BY, CC-BY-SA). No utilices licencias no comerciales (NC) o que no permitan una obra derivada (ND).

Wikidata utiliza una licencia CC0: cualquier dato aportado debe ser considerado como CC0 o de dominio público.

Notas

Para Wikidata, normalmente se necesita un "cruce de bases de datos" para mapear términos del conjunto de datos (un archivo CSV o registros de una API) a los términos de Wikidata. Esto se puede lograr con OpenRefine, un mapeo personalizado utilizando las hojas de cálculo de Google, o ambos.


Comprueba qué entidades y propiedades existen ya en Wikidata y qué categorías y plantillas se utilizan para Commons.

Averigua cómo se modelan los elementos en Wikidata, para establecer las propiedades adecuadas de "instancia de" (P31) y "subclase de" (P279) para los nuevos elementos.

Casos de ejemplo aquí.

Notas

Intenta subir pequeños lotes de prueba antes de trabajar con grandes conjuntos de datos.

Al añadir metadatos de colecciones y archivos multimedia en Wikidata y Commons, necesitas una forma de asegurarse de que estén correlacionados. El número de inventario o de acceso (P217) se utiliza a menudo para objetos, con un calificador para la colección (P195) y la institución. Una buena práctica de Commons para los nombres de archivo es incorporar la institución/fuente, el número de inventario y un título descriptivo.


Poner P217 en la descripción de un elemento de Wikidata puede ayudar a distinguir nombres de elementos que son muy similares (ej. Sin título, o Still Life with Flowers)

Casos de ejemplo aquí.

Notas

Dependiendo del éxito del proceso de importación y carga, es posible que tengas que lidiar con duplicados o conflictos con otros editores.


Para Commons, es posible que necesites trasladar archivos o agregar categorías adicionales.


Es posible que desees crear consultas de mantenimiento personalizadas para realizar un seguimiento del contenido aportado a lo largo del tiempo, o para seguir añadiendo propiedades y metadatos más allá de la contribución inicial.

Notas

Scripts y plantillas pueden generar contenido wiki, como tablas e infoboxes, desde Wikidata.


Si se han importado identificadores/registros de control de autoridades, Wikidata puede actuar como cruce de bases de datos.

Notas

Muestra el impacto de las contribuciones mediante el seguimiento de las métricas de los archivos utilizados o de las visualizaciones a lo largo del tiempo. En el caso de las instituciones, esto puede ayudar a validar el trabajo que se está realizando o a fomentar una mayor colaboración.


Algunas herramientas funcionan bajo demanda (GLAMorgan) y otras son reportadas regularmente en base a las categorías de instituciones GLAM de Commons.


También puedes utilizar Wikidata Query para realizar algunos informes personalizados sobre la cobertura o el uso.

Herramientas y scripts

Convierte archivos PDF en datos estructurados. Si tus datos de origen no están bien formateados, prueba una herramienta de extracción de información como Tabula

Herramientas y scripts

Tutorial de OpenRefine ofrecido por Sandra Fauconnier durante la conferencia GLAM WIKI 2018

Herramientas y scripts

Pattypan es la forma más popular de realizar cargas de archivos por lotes utilizando una hoja de cálculo para recopilar los metadatos necesarios para cada archivo. Encuentra la plantilla correcta para obras de arte, fotos u otros recursos e identifica las categorías adecuadas para organizar los archivos.


Quickstatements toma las variables CSV generadas en una hoja de cálculo para crear declaraciones de Wikidata.


La API de Mediawiki proporciona un entorno de programación con Python (PyWikibot o PAWS) para realizar tareas avanzadas.

Herramientas y scripts

Seguimiento de la integridad de una propiedad:

Wikidata:WikiProject sum of all paintings/Property statistics - Usuario:Multichill script en Github

InteGraality - Usuario:Jean-Frédéric. Script para generar paneles personalizados sobre la cobertura de una propiedad para una parte determinada de Wikidata.

Panel de propiedades del Museo Metropolitano de Arte

Wikimedia Commons Data Roundtripping proyecto e informe

Herramientas y scripts

Tutoriales de infobox:

Wikidata:Infobox_Tutorial - cómo crear infoboxes con Wikidata u otras plantillas para Wikipedia y otros proyectos conectadas a Wikidata

Infoboxes basadas en Wikidata en las categorías de Commons:

Template:Wikidata Infobox - creada por Usuario:Mike Peel

Herramientas y scripts

Wikidata Queries para mostrar estadísticas sobre las contribuciones del Museo Metropolitano de Arte a Wikidata:

PAWS por Usuario:Fuzheado

Casos de estudio

  • Añade el tuyo aquí

Enlaces

  • Data and media partnerships workflow - Consideraciones generales sobre el trabajo con datos y archivos de instituciones, incluyendo una serie de herramientas para Wikidata y Wikimedia Commons.