Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Gleichnamige Stationen in gleicher Gemeinden mit abweichender DHID #10

Open
hbruch opened this issue Jul 21, 2021 · 11 comments
Open

Gleichnamige Stationen in gleicher Gemeinden mit abweichender DHID #10

hbruch opened this issue Jul 21, 2021 · 11 comments
Labels
BEG HannIT NVBW VBB VBN VMT VMV Verkehrsgesellschaft Mecklenburg-Vorpommern mbH VRR ZPS Zweckverband Personennahverkehr Saarland

Comments

@hbruch
Copy link
Member

hbruch commented Jul 21, 2021

Derzeit listet das zHV 558 gleichnamige, in Betrieb befindliche (condition=Served) Stationen (type=S) in der gleichen Gemeinde, jedoch mit abweichenden DHID auf. Teilweise haben diese die gleichen, teilweise auch unterschiedliche Koordinaten.

Diese Stationen sollten eine einheitliche DHID aufweisen, auch wenn sie womöglich von unterschiedlichen Verkehrsunternehmen bedient werden, was eventuell die Ursache für die abweichend vergebenen DHIDs ist(?).

SELECT a.authority,
       COUNT(*)
FROM zhv a,
     zhv b
WHERE a.municipality=b.municipality
  AND a.type='S'
  AND b.type='S'
  AND a.name=b.name
  AND a.dhid < b.dhid
  AND a.condition='Served'
  AND b.condition='Served' 
GROUP BY a.authority ORDER BY COUNT(*) DESC;
Authority Anzahl
NVBW 157
VMT 128
BEG 88
VBN 59
VRR 57
rms 23
HannIT 12
ZPS 7
VVO 7
VBB 7
VRN 5
VMV 3
Hamburger Hochbahn 3
NVV 2
@hbruch hbruch added VRR NVBW VRN HannIT BEG VVO Verkehrsverbund Oberelbe NVV VMT VBN rms ZPS Zweckverband Personennahverkehr Saarland VBB VMV Verkehrsgesellschaft Mecklenburg-Vorpommern mbH Hamburger Hochbahn labels Jul 21, 2021
@NVBWSeifert
Copy link

Hallo Holger,
kannst Du das Auswerteergebnis als csv-Datei oder ähnlich bereitstellen?

@hbruch
Copy link
Member Author

hbruch commented Jul 21, 2021

Diese angehägte Datei listet die betroffenen Stationen. Stationen, zu denen mehrere Doppelungen existieren, werden ggf. in allen Kombinationen, also mit mehreren Zeilen, aufgeführt.

@NVBWSeifert
Copy link

In der Datei wird wg. der GROUP BY a.authority Einschränkung nur ein Datensatz je Organisation ausgegeben, kannst du eine Datei mit allen Dubletten erstellen?

@hbruch
Copy link
Member Author

hbruch commented Jul 21, 2021

Oops. Nun mit diesem Statement erstellte Datei listet dafür alle betroffenen 904 Stationen (inklusive Doppelungen) untereinander und einmalig. Lässt sich m.E. auch leichter lesen:

.output out/issue_10.csv
SELECT a.authority, a.municipalitycode, a.municipality, a.name, a.dhid, a.latitude, a.longitude
FROM zhv a,
     zhv b
WHERE a.municipality=b.municipality
  AND a.type='S'
  AND b.type='S'
  AND a.name=b.name
  AND a.dhid != b.dhid
  AND a.condition='Served'
  AND b.condition='Served'
GROUP BY a.authority, a.municipalitycode, a.municipality, a.name, a.dhid, a.latitude, a.longitude
ORDER BY a.authority, a.municipalitycode, a.name, a.dhid;

@NVBWSeifert
Copy link

für die NVBW eine kurze Zwischeninfo: es gibt sowohl echte Dubletten, aber vielfach auch die Verwendung einer falschen Namensversion, die ohne Zusatz scheinbare Dubletten sind, aber in anderen Namensversionen den Orteil beinhalten. Hier scheint ein Fehler beim bereitstellen von NVBW nach DELFI die Ursache zu sein. Wir klären das hausintern

@hbruch
Copy link
Member Author

hbruch commented Dec 7, 2022

Im Datensatz Stand 05.12.2022 existieren weiterhin Haltestellen gleichen Namens in der gleichen Gemeinde, welche laut zHV bedient werden, jedoch unterschiedliche DHIDs aufweisen:

Authority Anzahl
VMT 144
NVBW 142
BEG 87
VBN 56
VRR 54
rms 24
VBB 11
ZPS 7
VVO 6
VRN 5
Hamburger Hochbahn 5
HannIT 4
NVV 2
NASA 2
VMV 1

@hbruch hbruch added the NASA label Dec 7, 2022
@hbruch
Copy link
Member Author

hbruch commented Dec 15, 2022

Im Datensatz vom 12.12.2022 sind noch die folgenden Duplikate enthalten:

Authority Anzahl
VMT 288
BEG 156
NVBW 121
VBN 110
VRR 100
rms 46
VBB 20
ZPS 14
VVO 10
Hamburger Hochbahn 10
VRN 8
HannIT 8
NVV 6
NASA 4
VMV 2

Doppelte Haltestellen sind mit all ihren Doppelungen gezählt.

Diese wurden mit dem folgenden Statement ermittelt, dass tatsächlich andernorts existierende Namensduplikate ausschließt. Kriterium hierfür ist, dass sowohl Kreis als auch Lage sich für solche Duplikate deutlich unterscheiden müssen:

SELECT authority, COUNT(*) count FROM ( 
SELECT a.authority, a.municipalitycode, a.municipality, a.name, a.dhid, a.latitude, a.longitude
FROM zhv a,
     zhv b
WHERE a.municipality=b.municipality
  AND a.type='S'
  AND b.type='S'
  AND a.name=b.name
  AND a.dhid != b.dhid
  AND a.condition='Served'
  AND b.condition='Served'
  AND ((a.latitude BETWEEN b.latitude - 0.1 AND b.latitude + 0.1  
    AND a.longitude BETWEEN b.longitude - 0.1 AND b.longitude + 0.1)
     OR SUBSTR(a.dhid,0, 8) = SUBSTR(b.dhid,0, 8))
GROUP BY a.authority, a.municipalitycode, a.municipality, a.name, a.dhid, a.latitude, a.longitude) as duplicates
GROUP BY authority
ORDER BY count DESC;

@2martens
Copy link

2martens commented Apr 7, 2023

Zu den Beispielen der Hochbahn: Dalldorf, Sportplatz ist im HVV-System mit der DHID de:01053:85369 bekannt. Es gibt aber ein Dalldorf, Hauptstraße mit DHID de:01053:85370. dodenhof hat die DHID de:01060:8007148 und bei Langenfelder Damm sind es tatsächlich zwei unterschiedliche Haltestellen:

  • Langenfelder Damm mit DHID de:02000:84026
  • Langenfelder Damm (Kieler Straße) mit DHID de:02000:84060

@hbruch
Copy link
Member Author

hbruch commented Jul 22, 2023

@2martens Das o.g. Statement prüft auf Namens-Identität. Aktuell existiert für die Hamburger Hochbahn noch folgende Namensdoppelung:

383765|S|de:01060:75598|de:01060:75598|Kaltenkirchen, Friedhof|53.836693|9.953624|01060044|Kaltenkirchen||||Hamburger Hochbahn|-|D9042401274E|-|2023-12-03|
383905|S|de:01060:75691|de:01060:75691|Kaltenkirchen, Friedhof|53.838483|9.953482|01060044|Kaltenkirchen||||Hamburger Hochbahn|-|D904240127AB|-|2023-12-03|

Beide sind laut LastOperationDate bedient, auch wenn OSM für de:01060:75681 keine Haltestelle (mehr) kennt. Existiert sie tatsächlich, wäre es ws auch für Nutzende hilfreich zu wissen, ob der Halt am Südeingang oder an der Kielerstraße gemeint ist.

@CM-RMS
Copy link

CM-RMS commented Jul 24, 2023

Ist an den die Kollegen der Hamburger Hochbahn weitergeleitet.

@hbruch
Copy link
Member Author

hbruch commented Jan 3, 2025

Mit zhv-Stand vom 30.12.2024 gilt für Haltestellen mit `LastOperationDate' >= '2025-01-01':

SELECT authority, COUNT(*) count FROM (
SELECT a.authority, a.municipalitycode, a.municipality, a.name, a.dhid, a.latitude, a.longitude
FROM zhv a,
     zhv b
WHERE a.municipality=b.municipality
  AND a.type='S'
  AND b.type='S'
  AND a.name=b.name
  AND a.dhid != b.dhid
  AND a.lastOperationDate >= '2025-01-01'
  AND b.lastOperationDate >= '2025-01-01'
  AND ((a.latitude BETWEEN b.latitude - 0.1 AND b.latitude + 0.1
    AND a.longitude BETWEEN b.longitude - 0.1 AND b.longitude + 0.1)
     OR SUBSTR(a.dhid,0, 8) = SUBSTR(b.dhid,0, 8))
GROUP BY a.authority, a.municipalitycode, a.municipality, a.name, a.dhid, a.latitude, a.longitude) as duplicates
GROUP BY authority
ORDER BY count DESC;
authority count
BEG 54
NVBW 36
VRR 18
VBN 18
ZPS 12
VMT 12
VMV 8
VBB 4
HannIT 2

Konkrete Beispiele sind:

WITH examples AS (
SELECT a.authority, a.municipalitycode, a.municipality, a.name, a.dhid, a.latitude, a.longitude, ROW_NUMBER() OVER ( PARTITION BY a.authority) AS nr
FROM zhv a,
     zhv b
WHERE a.municipality=b.municipality
  AND a.type='S'
  AND b.type='S'
  AND a.name=b.name
  AND a.dhid != b.dhid
  AND a.lastOperationDate >= '2025-01-01'
  AND b.lastOperationDate >= '2025-01-01'
  AND ((a.latitude BETWEEN b.latitude - 0.1 AND b.latitude + 0.1
    AND a.longitude BETWEEN b.longitude - 0.1 AND b.longitude + 0.1)
     OR SUBSTR(a.dhid,0, 8) = SUBSTR(b.dhid,0, 8))
GROUP BY a.authority, a.municipalitycode, a.municipality, a.name, a.dhid, a.latitude, a.longitude)
SELECT * FROM examples WHERE nr <= 4;
authority municipalitycode municipality name dhid latitude a.longitude nr
BEG 09161000 Ingolstadt Kurt-Huber-Straße/Goethestraße de:09161:1870 48.772227 11.454212 1
BEG 09161000 Ingolstadt Kurt-Huber-Straße/Goethestraße de:09161:7624 48.772019 11.453035 2
BEG 09178155 Wang Volkmannsdorferau, Fichtenstraße de:09178:9425 48.492179 11.96538 3
BEG 09178155 Wang Volkmannsdorferau, Fichtenstraße de:09178:9452 48.493727 11.963583 4
HannIT 03254028 Sarstedt Sarstedt de:03241:1731 52.235861 9.858372 1
HannIT 03254028 Sarstedt Sarstedt de:03254:9834 52.232186 9.842266 2
NVBW 08115048 Waldenbuch Waldenbuch Hasenhof de:08115:3121 48.648451 9.150841 1
NVBW 08115048 Waldenbuch Waldenbuch Hasenhof de:08115:3131 48.652202 9.14299 2
NVBW 08117061 Lauterstein Weißenstein Altes Rathaus de:08117:7666 48.705068 9.887235 3
NVBW 08117061 Lauterstein Weißenstein Altes Rathaus de:08117:7683 48.705234 9.88737 4
VBB 11000000 Berlin Berlin, Reimerweg de:11000:900037204 52.52158 13.155775 1
VBB 11000000 Berlin Berlin, Reimerweg de:11000:900037274 52.521997 13.15443 2
VBB 12052000 Cottbus Cottbus, Stadtverwaltung de:12052:900470114 51.762225 14.327735 3
VBB 12052000 Cottbus Cottbus, Stadtverwaltung de:12052:900470195 51.763124 14.327293 4
VBN 01054036 Garding Garding Mitte de:01054:29516 54.327932 8.780095 1
VBN 01054036 Garding Garding Mitte de:01054:29517 54.327918 8.780161 2
VBN 01059044 Jübek Jübek Bahnhof de:01059:47298 54.558237 9.405873 3
VBN 01059044 Jübek Jübek Bahnhof de:01059:47301 54.557974 9.406404 4
VMT 16052000 Gera Abzweig Naulitz de:16052:152210 50.877102 12.153077 1
VMT 16052000 Gera Abzweig Naulitz de:16052:3010181 50.877102 12.153077 2
VMT 16066092 Zella-Mehlis, Stadt Zella-Mehlis, H.-Ehrhardt-Str. de:16066:2200281 50.666568 10.684663 3
VMT 16066092 Zella-Mehlis, Stadt Zella-Mehlis, H.-Ehrhardt-Str. de:16066:2400254 50.661738 10.681023 4
VMV 13072088 Rövershagen Rövershagen Karls Erlebnisdorf de:13072:1686 54.160327 12.23421 1
VMV 13072088 Rövershagen Rövershagen Karls Erlebnisdorf de:13072:674 54.15978 12.237965 2
VMV 13076085 Lewitzrand Klinken de:13076:6089 53.500522 11.670373 3
VMV 13076085 Lewitzrand Klinken de:13076:6450 53.495857 11.671604 4
VRR 05112000 Duisburg Duisburg An den Steinen de:05112:16770 51.378354 6.675992 1
VRR 05112000 Duisburg Duisburg An den Steinen de:05112:21108 51.378354 6.675992 2
VRR 05170052 Xanten Xanten Strohweg de:05170:36247 51.688344 6.437983 3
VRR 05170052 Xanten Xanten Strohweg de:05170:36249 51.687792 6.44313 4
ZPS 10041100 Saarbrücken Brebach Bf, Saarbrücken de:10041:13500 49.216023 7.029649 1
ZPS 10041100 Saarbrücken Brebach Bf, Saarbrücken de:10041:8001135 49.216558 7.028818 2
ZPS 10041100 Saarbrücken Bübingen Bf, Saarbrücken de:10041:14100 49.179059 7.037073 3
ZPS 10041100 Saarbrücken Bübingen Bf, Saarbrücken de:10041:8001238 49.179633 7.034869 4

Wir vertreten hierbei die Auffassung, dass eventuelle Tippfehler oder Neuzuweisungen vormals eigenständiger Haltestellen eine Anpassung/Korrektur der DHID rechtfertigen.

@hbruch hbruch removed VRN VVO Verkehrsverbund Oberelbe NVV labels Jan 3, 2025
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
BEG HannIT NVBW VBB VBN VMT VMV Verkehrsgesellschaft Mecklenburg-Vorpommern mbH VRR ZPS Zweckverband Personennahverkehr Saarland
Projects
None yet
Development

No branches or pull requests

4 participants