Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Erweiterungswunsch: LastOperationDate Angaben für Quays #25

Open
hbruch opened this issue Sep 19, 2023 · 2 comments
Open

Erweiterungswunsch: LastOperationDate Angaben für Quays #25

hbruch opened this issue Sep 19, 2023 · 2 comments
Labels
DELFI e.V. enhancement New feature or request

Comments

@hbruch
Copy link
Member

hbruch commented Sep 19, 2023

Der zHV Datensatz vom 18.9.2023 weist für keinen einzigen Quay eine LastOperationDate Angabe aus:

https://www.opendata-oepnv.de/fileadmin/datasets/delfi/20230918_zHV_gesamt.zip

$ csvq -k --delimiter ';' "select count(*) from zhv where LastOperationDate != '' and Type='Q'"
+----------+
| COUNT(*) |
+----------+
|        0 |
+----------+

Die Dateigröße der ausgepackten CSV-Datei beträgt 133,3 MB.

Im Datensatz der vorhergehenden Woche sind 473572 Quays mit LastOperationDate ausgewiesen, die Dateigröße beträgt 142,2 MB.

 $ csvq -k --delimiter ';' "select count(*) from zhv_former where LastOperationDate != '' and Type='Q'"
+----------+
| COUNT(*) |
+----------+
|   473572 |
+----------+

Laut begleitender Beschreibung_ZHV-Datensatz_csv_20230918.pdf gilt weiterhin:

Die Felder Condition (Betriebszustand) und State (Status) entfallen und werden durch das Feld „LastOperationDate“ ersetzt. Dieses wird auf der Ebene Mast (Quay) und auf der Ebene Haltestelle (stop) ermittelt und ausgewiesen.

Zur Erkennung einer mutmaßlich unvollständige Datenbereitstellung (siehe zB erst vor 14 Tagen aufgetretener Issue #24), bietet sich ein Größen- und Zeilenvergleich mit dem Datensatz der Vorwoche an.

@hbruch
Copy link
Member Author

hbruch commented Sep 20, 2023

Rückantwort der WVI:

vielen Dank für Ihren Hinweis. Es handelt sich dabei allerdings nicht um einen Fehler, sondern die Detailtiefe des Merkmals "Datum letzte Bedienung" wurde angepasst.

Nach der Einführung des "Datum letzte Bedienung" im ZHV zeigten die Praxiserfahrungen, dass sich das Datum aus dem DELFI-Datensatz verlässlich für das gesamte Haltestellenobjekt ermitteln lässt. Auf Ebene der Bedienung einzelner Masten treten jedoch unterschiedliche Probleme auf. Diese sind zum Teil in der Art der Datenverarbeitung im Rahmen der Aggregation der Daten aus den Landessystemen zu einem deutschlandweiten Gesamtdatensatz begründet. Zum Teil liegen die entsprechenden Informationen aber schlicht nicht auf der Mastebene vor. Sie haben uns ja ebenfalls auf die Mängel bzgl. der Datenqualität auf Mastebene hingewiesen und diese unter #23 dokumentiert.

In Abstimmung mit DELFI und den beteiligten Systemhäusern wurde daher beschlossen, dass Merkmal "Datum letzte Bedienung" im ZHV künftig nur noch auf der Ebene Haltestelle auszuweisen. Diesen Beschluss haben wir inzwischen umgesetzt, so dass es in derWeboberfläche und beim CSV-Export nur noch ein "Datum letzte Bedienung" für die gesamte Haltestelle gibt.

Wir bitten an dieser Stelle um Verständnis. Die Grundidee hinter der Anpassung ist es - gemäß der allgemeinen Philosophie des ZHV - lieber weniger Merkmale, diese aber in hoher Qualität bereitzustellen.

Abschließend noch zwei Hinweise:

  • Das Datum 31.12.1999 steht weiterhin als Platzhalter für "Datum letzte Bedienung unbekannt".
  • Um die SOAP-Schnittstelle nicht erneut ändern zu müssen, wird bei den XML-Exporten formal weiterhin ein "Datum letze Bedienung" auf Mastebene ausgeben. Dieses ist jedoch für alle Masten fix auf "unbekannt" (31.12.1999) gesetzt.

@hbruch
Copy link
Member Author

hbruch commented Sep 20, 2023

Vielen Dank für Ihre Erläuterung.

Verstehe ich richtig, dass, weil einige Systeme nicht in der Lage sind, Bedient-Information auf Mastebene zu führen bzw. diese in manchen Systemen nicht geführt wird, nun eine flächendeckende Reduzierung der Detailtiefe vorgenommen wurde?

Auf diese Weise nimmt man eine Anpassung nach unten vor und das zHV verliert die Ausdrucksmächtigkeit, für einzelne Steige die Information bereitzustellen, ob diese zur Zeit bedient, rückgebaut oder womöglich erst zukünftig geplant sind.

Dass sich das Datum verlässlich aus dem DELFI-Datensatz ermitteln lässt, bezweifle ich, da ich davon ausgehe, dass heute noch nicht alle Verkehre vollständig im DELFI-Datensatz enthalten sind, sowie eine Reihe von Systemen noch nicht die DHID zur Referenzierung der Haltestelle nutzt, sei es auch nur auf Haltestellenebene.

Ein Vorgehen, dass vorhandene Informationen bereitstellt, und unbekannte als unbekannt ausweist, wäre aus meiner Sicht bedeutend hilfreicher gewesen.

Die Konsequenz des jetzigen Vorgehens ist, dass in keiner Anwendung auch nur halbwegs verlässlich mastscharfe Informationen bereitgestellt werden können, da diese womöglich irreführend sind.

Ich halte die Entscheidung für dieses Vorgehen, dass zudem leider nicht in der beigefügten Beschreibung_ZHV-Datensatz_csv_20230918.pdf dokumentiert wurde, für unglücklich. Ich hoffe sehr, dass es nochmals diskutiert wird und eine andere Verfahrensweise gewählt wird.

@hbruch hbruch changed the title Keine LastOperationDate Angaben für Quays Erweiterungswunsch: LastOperationDate Angaben für Quays Mar 10, 2024
@hbruch hbruch added the enhancement New feature or request label Mar 10, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
DELFI e.V. enhancement New feature or request
Projects
None yet
Development

No branches or pull requests

1 participant