Skip to content

Convención - Descipción de datasets históricos y series temporales pre DCAT-AP 3 #31

@Admindatosgobes

Description

@Admindatosgobes

Contexto

En el modelo DCAT-AP-ES, surge la necesidad de establecer una convención clara sobre la representación de datasets con series temporales, especialmente aquellos que contienen varias distribuciones en un mismo dataset. Actualmente, la falta de una guía específica puede generar inconsistencias en la manera en que los editores de datos estructuran estos conjuntos de datos.

Además, es relevante mencionar la futura adaptación al estándar DCAT-AP 3, que ya aborda la gestión de series temporales. Alinear la convención con estas futuras mejoras garantizará una mayor interoperabilidad y compatibilidad con los estándares europeos.

Note

Referencia DCAT-AP: 14.2 Usage guide on Dataset Series

Objetivos de la Convención

  • Definir una estructura recomendada: Establecer una forma estandarizada de modelar datasets con múltiples distribuciones que representan series temporales.
  • Garantizar la interoperabilidad: Asegurar que los datos sean consistentes con las prácticas recomendadas en DCAT-AP-ES y la futura versión de DCAT-AP 3.
  • Evitar ambigüedades: Clarificar cómo deben asociarse las distribuciones a los datasets cuando representan diferentes puntos en el tiempo.

Propuesta

Aplicabilidad

  • Obligatoria (MUST): Debe cumplirse sin excepciones.
  • Recomendable (SHOULD): Debería cumplirse.

Convención propuesta

## Representación de datasets con series temporales {#datasets-series-temporales}
Un *dataset* (`dcat:Dataset`) puede contener múltiples distribuciones (`dcat:Distribution`) cuando representan diferentes versiones temporales de un mismo conjunto de datos (por ejemplo, datos anuales, mensuales, etc.).

!!! must semantic "Convención XX"
   Un `dcat:Dataset` **DEBE** incluir `dct:temporal` para indicar el rango temporal global que cubren sus distribuciones y `dcat:accrualPeriodicity` para describir la frecuencia de actualización.

!!! must semantic "Convención XY"
   Un `dcat:Distribution` **DEBERÍA** incluir un campo `dcat:temporalResolution` para indicar el  intervalo de tiempo mínimo entre dos registros de datos consecutivos

!!! should semantic "Convención XZ"
   Si en el futuro se adopta `dcat:DatasetSeries` en DCAT-AP-ES, se **DEBERÍAN** describir los *datasets* con múltiples versiones independientes como una serie, en lugar de incluir todas las distribuciones dentro de un solo `dcat:Dataset`.

!!! info "Ejemplo de modelado de dataset con series temporales"
    ```turtle linenums="1"
    @prefix dcat: <http://www.w3.org/ns/dcat#> .
    @prefix dct: <http://purl.org/dc/terms/> .

    <http://dcat-ap-es.ejemplo.org/dataset/dataset-ejemplo-1>
        a dcat:Dataset ;
        dct:title "Estadísticas de empleo 2010-2024"@es ;
        dct:temporal [
            a dct:PeriodOfTime ;
            dct:startDate "2010-01-01"^^xsd:date ;
            dct:endDate "2024-12-31"^^xsd:date ;
        ] ;
        dct:accrualPeriodicity <http://publications.europa.eu/resource/authority/frequency/ANNUAL> ;
        dcat:distribution <http://dcat-ap-es.ejemplo.org/distribucion/dataset-ejemplo-1-2023>,
                          <http://dcat-ap-es.ejemplo.org/distribucion/dataset-ejemplo-1-2022> .

    <http://dcat-ap-es.ejemplo.org/distribucion/dataset-ejemplo-1-2023>
        a dcat:Distribution ;
        dct:title "Datos de empleo - 2023"@es ;
        dcat:temporalResolution "P1Y"^^xsd:duration ;
        dcat:mediaType "text/csv" .

    <http://dcat-ap-es.ejemplo.org/distribucion/dataset-ejemplo-1-2022>
        a dcat:Distribution ;
        dct:title "Datos de empleo - 2022"@es ;
        dcat:temporalResolution "P1Y"^^xsd:duration ;
        dcat:mediaType "application/json" .
    ```

!!! warning "Importante"
   - **Coherencia temporal**: El rango de fechas del `dcat:Dataset` debe abarcar todas las fechas de sus `dcat:Distribution`.
   - **Uso de URIs estables**: Se recomienda que las distribuciones usen identificadores únicos con referencia temporal (ej. `dataset-id-año`).

!!! info "Nota sobre `dcat:DatasetSeries` ([DCAT-AP 3](https://semiceu.github.io/DCAT-AP/releases/3.0.0/#notes-on-alignment-with-dcat-3))"
   Aunque `dcat:DatasetSeries` no está actualmente en DCAT-AP-ES (basado en [DCAT-AP 2.1.1](https://administracionelectronica.gob.es/pae_Home/pae_Actualidad/pae_Noticias/Anio2022/Septiembre/Noticia-2022-09-05-Nueva-version-DCAT-AP-portales-datos-europeos.html)), en futuras versiones del perfil, podría utilizarse para representar colecciones de datasets con series temporales.  
   Hasta que se adopte oficialmente, los publicadores deberían seguir las recomendaciones de esta convención para asegurar una transición fluida.

Comentarios Adicionales

  • ¿Deberíamos considerar casos en los que una distribución represente varias fechas en lugar de un solo período continuo?
  • ¿Es necesario incluir recomendaciones sobre cómo describir las futuras series? Ver convención propuesta Convención XZ
  • ¿Existen otras formas de modelar series temporales en DCAT-AP-ES que deban evaluarse?

Metadata

Metadata

Labels

conventionIncidencias sobre convenciones técnicas, semánticas y organizativassemanticIncidencia sobre convenciones semánticas

Type

No type

Projects

No projects

Relationships

None yet

Development

No branches or pull requests

Issue actions