Sqlserver
 sql >> Datenbank >  >> RDS >> Sqlserver

Wie erhalte ich die Grenzkoordinaten für eine US-Postleitzahl?

Eine Ausarbeitung meines Kommentars, dass Postleitzahlen keine Polygone sind....

Wir stellen uns Postleitzahlen oft als Gebiete (Polygone) vor, weil wir sagen:„Oh, ich lebe in diese Postleitzahl...", was den Eindruck einer umgebenden Region erweckt, und vielleicht die Tatsache, dass ZIP für "Zone" steht Improvement Plan" hilft bei der falschen Assoziation mit Polygonen.

Tatsächlich sind Postleitzahlen Linien, die gewissermaßen Postbotenwege darstellen. Geometrisch haben Linien keinen Flächeninhalt. So wie Linien Folgen von Punkten entlang einer Koordinatenebene sind, sind Postleitzahllinien Folgen von Lieferpunkten im abstrakten Raum der von USPS bezeichneten Adressen.

Das sind sie nicht korreliert mit geografischen Koordinaten. Was Sie jedoch feststellen werden, ist, dass sie erscheinen geografisch orientiert sein, weil es für Spediteure ineffizient wäre, eine Route zu haben, die von Entfernung und Ort völlig unabhängig ist.

Was ist dieser "abstrakte Bereich von USPS-bestimmten Adressen"? So beschreibe ich die große und mysteriöse Datenbank mit Lieferorten, die vom US Postal Service gepflegt wird. Adressen werden nicht nach geografischen Gesichtspunkten zugeteilt, sondern nach den Strecken, die die Spediteure befahren, was sich normalerweise auf die Straßen und die Befahrbarkeit bezieht.

Einige 5-stellige Postleitzahlen beziehen sich nur auf ein einzelnes Gebäude oder einen Gebäudekomplex oder sogar auf eine einzelne Etage eines Gebäudes (ja, mehrere Postleitzahlen können sich an einer einzigen Koordinate befinden, da ihre Lieferpunkte vertikal geschichtet sind). Einige davon – unter anderem – sind „einzigartige“ ZIPs. Firmen und Universitäten erhalten häufig eigene Postleitzahlen für Marketing- oder Organisationszwecke. Zum Beispiel gehört die Postleitzahl „12345“ zu General Electric oben in Schenectady, NY. (Bearbeiten:Wenn Sie in einer früheren Version von Google Maps diesem Link folgten, bemerkten Sie, dass die Platzierungsmarkierung schwebte, da sie auf eine Postleitzahl zeigt, die keine Koordinate ist. Während die meisten US-Postleitzahlen früher angezeigt wurden eine Region auf Google Maps, können diese Typen nicht, weil der USPS sie sozusagen nicht "besitzt" und sie kein Gebiet haben.)

Lassen Sie uns nur zum Spaß versuchen, eine Adresse in einer eindeutigen Postleitzahl zu bestätigen. Gehen Sie zu SmartyStreets und geben Sie eine falsche Adresse in 12345 ein, wie:

Straße: 999 Sdf sdf

Postleitzahl: 12345

Wenn Sie versuchen, dies zu überprüfen, beachten Sie, dass ... es GÜLTIG ist! Wieso den? Der USPS wird ein Stück für diese eindeutige Postleitzahl an den Behälter liefern, aber an diesem Punkt ist es Sache von GE, es zu verteilen. So ziemlich alles, was in der Postleitzahl intern ist, ist für den USPS irrelevant, einschließlich der Straßenadresse (technisch "Lieferlinie 1"). Viele Universitäten funktionieren ähnlich. Hier finden Sie weitere Informationen dazu.

Versuchen Sie es jetzt mit derselben falschen Adresse, aber ohne Postleitzahl, und geben Sie stattdessen die Stadt/das Bundesland ein:

Straße: 999 Sdf sdf

Stadt: Schenectady

Zustand: NY

Es validiert nicht. Denn obwohl Schenectady 12345 enthält, wo die Adresse "gültig" ist, schneidet sie sich geometrisch mit den "echten" Postleitzahlen für Schenectady.

Nehmen wir ein anderes Beispiel:Militär. Bestimmte Marineschiffe haben ihre eigenen Postleitzahlen. Militärische Adressen sind eine völlig andere Klasse von Adressen die denselben Namespace verwenden . Schiffe bewegen sich. Geografische Koordinaten nicht.

ZIP-Präzision ist ein weiterer Spaß. 5-stellige Postleitzahlen sind am ungenauesten (obwohl der Begriff „spezifisch“ hier möglicherweise aussagekräftiger ist, da Postleitzahlen nichts genau bestimmen). 7- und 9-stellige Postleitzahlen sind die spezifischsten, oft bis auf Block- oder Nachbarschaftsebene in städtischen Gebieten. Aber da jede Postleitzahl eine andere Größe hat, ist es wirklich schwierig um zu sagen, über welche tatsächlichen Entfernungen Sie sprechen.

Eine 9-stellige Postleitzahl kann auf eine Etage eines Gebäudes aufgeteilt werden, sodass Sie sich überschneidende Postleitzahlen für möglicherweise Hunderte von Adressen haben.

Fazit:Postleitzahlen liefern entgegen der landläufigen Meinung keine geografischen oder Grenzdaten. Sie variieren stark und sind eigentlich ziemlich wenig hilfreich, es sei denn, Sie liefern Post oder Pakete ... aber die Aufgabe des USPS bestand darin, effiziente Transportrouten zu entwerfen, und nicht die Bevölkerung so sehr in koordinierte Regionen aufzuteilen.

Das ist eher die Aufgabe des Statistikamtes. Sie haben eine Liste kartografischer Grenzen zusammengestellt, da Postleitzahlen „bequem“ zu handhaben sind. Dazu unterteilten sie Adressenbündel in Zählblöcke. Dann aggregierten sie USPS-Postleitzahlendaten, um die Beziehung zwischen ihren Volkszählungsblöcken (die einige grobe Koordinatendaten enthalten) und den Postleitzahlen zu ermitteln. Somit haben wir Näherungen wie es aussehen würde, eine Linie als Polygon zu zeichnen. (Anscheinend wandelten sie eine 1D-Linie in ein 2D-Polygon um, indem sie ein 2D-Polygon basierend auf seinem Inhalt transformierten, um es an lineare Daten anzupassen – für jede nicht eindeutige, reguläre Postleitzahl.)

Von ihrer Website (Link oben):

Ein Postleitzahl-Tabellengebiet (ZCTA) ist eine statistische geografische Entität, die das Zustellgebiet für eine fünfstellige oder dreistellige Postleitzahl des US-Postdienstes annähert. ZCTAs sind Aggregationen von Zensusblöcken, die dieselbe vorherrschende Postleitzahl haben, die mit den Adressen in der Master Address File (MAF) des U.S. Census Bureau verknüpft ist. Dreistellige ZCTA-Codes werden auf große zusammenhängende Gebiete angewendet, für die das U.S. Census Bureau keine fünfstellige Postleitzahl hat Codeinformationen in seinem MAF. ZCTAs stellen Postleitzahlen-Zustellgebiete nicht genau dar und enthalten nicht alle Postleitzahlen, die für die Postzustellung verwendet werden. Das U.S. CensusBureau hat ZCTAs als neue geografische Einheit eingerichtet, die Datentabellen für Postleitzahlen ähneln, die in Verbindung mit den Volkszählungen von 1990 und früheren Erhebungen erstellt wurden, diese jedoch ersetzen.

Der Datensatz des USCB ist unvollständig und manchmal ungenau. Google hat auch immer noch Lücken in seinen Daten (die 12345 ist ein ziemlich gutes Beispiel) – aber Google wird es irgendwann flicken, indem es jede Adresse und Postleitzahl von Hand durchgeht. Sie tun dies bereits, haben aber noch nicht alle ihre Kartendaten perfekt gemacht. Natürlich ist der Zugriff auf diese Daten auf API-Bedingungen beschränkt, und es ist sehr teuer, diese zu erheben.

Puh. Ich bin geschlagen. Ich hoffe, das trägt zur Klärung der Dinge bei. Haftungsausschluss:Ich war früher Entwickler bei SmartyStreets. Weitere Informationen zur Geokodierung mit Adressdaten.

Noch mehr Informationen zu Postleitzahlen.