-
Notifications
You must be signed in to change notification settings - Fork 1
Open
Labels
conventionIncidencias sobre convenciones técnicas, semánticas y organizativasIncidencias sobre convenciones técnicas, semánticas y organizativassemanticIncidencia sobre convenciones semánticasIncidencia sobre convenciones semánticas
Milestone
Description
Contexto
En el modelo DCAT-AP-ES, surge la necesidad de establecer una convención clara sobre la representación de datasets con series temporales, especialmente aquellos que contienen varias distribuciones en un mismo dataset. Actualmente, la falta de una guía específica puede generar inconsistencias en la manera en que los editores de datos estructuran estos conjuntos de datos.
Además, es relevante mencionar la futura adaptación al estándar DCAT-AP 3, que ya aborda la gestión de series temporales. Alinear la convención con estas futuras mejoras garantizará una mayor interoperabilidad y compatibilidad con los estándares europeos.
Note
Referencia DCAT-AP: 14.2 Usage guide on Dataset Series
Objetivos de la Convención
- Definir una estructura recomendada: Establecer una forma estandarizada de modelar datasets con múltiples distribuciones que representan series temporales.
- Garantizar la interoperabilidad: Asegurar que los datos sean consistentes con las prácticas recomendadas en DCAT-AP-ES y la futura versión de DCAT-AP 3.
- Evitar ambigüedades: Clarificar cómo deben asociarse las distribuciones a los datasets cuando representan diferentes puntos en el tiempo.
Propuesta
Aplicabilidad
- Obligatoria (MUST): Debe cumplirse sin excepciones.
- Recomendable (SHOULD): Debería cumplirse.
Convención propuesta
## Representación de datasets con series temporales {#datasets-series-temporales}
Un *dataset* (`dcat:Dataset`) puede contener múltiples distribuciones (`dcat:Distribution`) cuando representan diferentes versiones temporales de un mismo conjunto de datos (por ejemplo, datos anuales, mensuales, etc.).
!!! must semantic "Convención XX"
Un `dcat:Dataset` **DEBE** incluir `dct:temporal` para indicar el rango temporal global que cubren sus distribuciones y `dcat:accrualPeriodicity` para describir la frecuencia de actualización.
!!! must semantic "Convención XY"
Un `dcat:Distribution` **DEBERÍA** incluir un campo `dcat:temporalResolution` para indicar el intervalo de tiempo mínimo entre dos registros de datos consecutivos
!!! should semantic "Convención XZ"
Si en el futuro se adopta `dcat:DatasetSeries` en DCAT-AP-ES, se **DEBERÍAN** describir los *datasets* con múltiples versiones independientes como una serie, en lugar de incluir todas las distribuciones dentro de un solo `dcat:Dataset`.
!!! info "Ejemplo de modelado de dataset con series temporales"
```turtle linenums="1"
@prefix dcat: <http://www.w3.org/ns/dcat#> .
@prefix dct: <http://purl.org/dc/terms/> .
<http://dcat-ap-es.ejemplo.org/dataset/dataset-ejemplo-1>
a dcat:Dataset ;
dct:title "Estadísticas de empleo 2010-2024"@es ;
dct:temporal [
a dct:PeriodOfTime ;
dct:startDate "2010-01-01"^^xsd:date ;
dct:endDate "2024-12-31"^^xsd:date ;
] ;
dct:accrualPeriodicity <http://publications.europa.eu/resource/authority/frequency/ANNUAL> ;
dcat:distribution <http://dcat-ap-es.ejemplo.org/distribucion/dataset-ejemplo-1-2023>,
<http://dcat-ap-es.ejemplo.org/distribucion/dataset-ejemplo-1-2022> .
<http://dcat-ap-es.ejemplo.org/distribucion/dataset-ejemplo-1-2023>
a dcat:Distribution ;
dct:title "Datos de empleo - 2023"@es ;
dcat:temporalResolution "P1Y"^^xsd:duration ;
dcat:mediaType "text/csv" .
<http://dcat-ap-es.ejemplo.org/distribucion/dataset-ejemplo-1-2022>
a dcat:Distribution ;
dct:title "Datos de empleo - 2022"@es ;
dcat:temporalResolution "P1Y"^^xsd:duration ;
dcat:mediaType "application/json" .
```
!!! warning "Importante"
- **Coherencia temporal**: El rango de fechas del `dcat:Dataset` debe abarcar todas las fechas de sus `dcat:Distribution`.
- **Uso de URIs estables**: Se recomienda que las distribuciones usen identificadores únicos con referencia temporal (ej. `dataset-id-año`).
!!! info "Nota sobre `dcat:DatasetSeries` ([DCAT-AP 3](https://semiceu.github.io/DCAT-AP/releases/3.0.0/#notes-on-alignment-with-dcat-3))"
Aunque `dcat:DatasetSeries` no está actualmente en DCAT-AP-ES (basado en [DCAT-AP 2.1.1](https://administracionelectronica.gob.es/pae_Home/pae_Actualidad/pae_Noticias/Anio2022/Septiembre/Noticia-2022-09-05-Nueva-version-DCAT-AP-portales-datos-europeos.html)), en futuras versiones del perfil, podría utilizarse para representar colecciones de datasets con series temporales.
Hasta que se adopte oficialmente, los publicadores deberían seguir las recomendaciones de esta convención para asegurar una transición fluida.
Comentarios Adicionales
- ¿Deberíamos considerar casos en los que una distribución represente varias fechas en lugar de un solo período continuo?
- ¿Es necesario incluir recomendaciones sobre cómo describir las futuras series? Ver convención propuesta
Convención XZ - ¿Existen otras formas de modelar series temporales en DCAT-AP-ES que deban evaluarse?
Metadata
Metadata
Labels
conventionIncidencias sobre convenciones técnicas, semánticas y organizativasIncidencias sobre convenciones técnicas, semánticas y organizativassemanticIncidencia sobre convenciones semánticasIncidencia sobre convenciones semánticas