続Overlap分析

前述のOverlap分析で非常に助けになるのがGoogle Location Serviceである。住所などのインプットパラメータを受け取ると、Google Place Idという世界中のいかなる場所であっても特定可能なIdを返してくれる優れものである。いわば世界中の住所の、標準化された規格に則った背番号である。

https://developers.google.com/maps/documentation/geocoding/overview?_gl=1*azzd11*_ga*OTk4MTMxMDc5LjE2ODYwMjE3MDc.*_ga_NRWSTWS78N*MTY4NjAyMTcwNi4xLjEuMTY4NjAyMTgwMS4wLjAuMA..

これは地理データを扱うデータ分析者にとっては夢のようなデータで、あらゆる地点の重複・非重複の判別が、国や地域の言語の差や、郵便番号のような企画の違いに翻弄されることなく、全く同じアプローチを一気に世界中のあらゆる国に当てはめてしまうことができる。

データ分析の歳代のボトルネックがデータ準備であることは言うまでもないが、データ準備で気をつけるべき点の一つが「統一化されたデータ定義」であるのだが、その実現の妨げになる最大の難関の一つがケースバイケースの異なるロジックの当てはめである。郵便番号は国ごとに桁数も違うし、数字だけですべてが表される国もあればそれプラス「−」が入る日本のようなケース、あるいはオランダのようにアルファベットが入って「1111AB」のようになるケースなど様々である。

Google Place Idはこれらの課題をすべて払拭してくれるという点で非常に画期的である。

ただし気をつけなければいけないのがコスト。1000コールで$5がスタートで自身のコールしたい頻度と都度のボリュームで当然コストは変わる。

日次でコールするのか月次でコールするのかで30倍の差である。

https://mapsplatform.google.com/pricing/

そのため事前に綿密なデータ収集プランが必要になってくる。