栃木県内某ゴルフ場の人流と気象の相関や影響そして予測精度の調査

エフエムマーク合同会社(気象ビジネス推進コンソーシアム人材育成WGメンバー)

栃木県内某ゴルフ場の人流と気象の相関や影響そして予測精度の調査

【概要】

 本稿では、栃木県内某ゴルフ場を調査地としたG空間情報センターや気象庁が提供する人流データやアメダスデータを掛け合わせたデータ解析や機械学習に関して報告する。
 機械学習には、近年、学習や予測精度が高いモデル設計を可能とする深層学習を用いた。
 又、上記のデータやモデルを利活用する事で、調査地の屋外経済活動に於ける日々の運営や利用形態そしてキャンセル防止等への解決策を模索した。
 本調査は、気象ビジネス推進コンソーシアムの勉強会活動の一環で実施され、気象データと他の公益・民益に資するオープンデータを掛け合わせての社会課題の解決や産業利用を目論んだ。
 説明変数は、最低気温、最高気温、降水量、瞬間最高降水量、平均風速、最高風速、瞬間最高風速として、目的変数である人流の予測検証が実施されたが、データ自体の時間や空間粒度に関する使用データ間の整合の必要性の他、過去データの量や調査目的に担うデータ取得等、オープンデータの取得可能性に関しての困難性やデータデザインの意匠惨憺も体感された。

【背景目的】

 近年益々顕著で激甚化する気候変動や豪雨、雨不足、猛暑等の異常気象等は、屋外空間へ多大な影響を与えている。
 ゴルフ場は、そのような屋外空間であり、その経済活動に於いて、気象が1つの大きな要素を占めるであろうと思われた。
 従って、気象×人流(顧客や招待客)の関係を分析する事で、ゴルフ場の日々の運営や利用形態そしてキャンセル防止等への解決策を提供出来ると考えた。
 既往研究との相違は、ゴルフ場所在地の局地的な天気予報だけでなく、GIS付帯の人流数値情報と云う実測に近いデータを掛け合わせる事で、意図・偶発的な関係・因果関係を可視化して上記の解決策への洞察を行っている点である。

【内容】

 予てから時間的粒度が高く気象に纏わる指標を、大方全て揃えた気象庁アメダスデータと空間粒度が現状比較的高い(1kmメッシュ)G空間情報センターの市区町村単位発地別の滞在人口データを用いて、調査地での双方の相関や因果関係並びに予測検証が行われた。
 期間に関しては、G空間データでの年間月別が、積算に基づくものであるので、アメダスデータをその期間に合わせる事とし、ゆくゆく実施する機械学習の為に、2019年、2020年そして2021年までの過去3年間分の積算データを取得する事とした。
 ゴルフ場は、全国で有数の雷の多い県と言われ、気象による影響がある県と思われる栃木県内を貫通する一級河川の東側に位置し、主要出入り口が、ゴルフ場管理事務所や駐車エリア付近にあり、G空間データの1kmメッシュ区画に収まる。
 従って、その区画の人流が、ゴルフ場の入退場にかなり密接に関係していると推察された。検討作業は、7つのフロー(データ準備、データ結合、データ可視化・特徴量理解、仮説設定、データ分析・相関分析・回帰分析、機械学習(精度分析)、結論)により遂行され、CSVデータをPythonで機械学習(深層学習)させ、データと実際の事像を重ねてのデータ分析から最終的に予測精度検証までアジャイルに実施された。
 検証結果に於いて、アメダスデータ各種と人流には強い正相関の存在が認められた。従って、人流と気象の掛け合わせは、屋外のゴルフ場の人の出入りや対応に大いに利用出来ると考えられる。又、人流が、各気象指標の限度値を境として相関しており、既にゴルフ場が採用しているのであろう一時休止や休場の目安となる値による人流変動も可視化された。
 一方、人流データは、2020年のコロナ禍による影響等が、比較的少なかったと言われるゴルフ場に於いてもやはり移動制限や休場等のゴルフ場自体の運営側の行動を示していた。
 他方、気象データでは、台風、強風、猛暑等の気象状況の発生有無や時期が、各年で異なり、単純に学習した年のモデルを次の年に当て嵌める事が出来ない不確定性を検証データの精度の低さから推測出来た。尚、説明変数は、最低気温、最高気温、降水量、瞬間最高降水量、平均風速、最高風速、瞬間最高風速として、目的変数である人流の予測検証が実施された。

【今後の活用と展望】

 気象庁アメダスデータとG空間データはいずれもオープンデータで、一般的に入手可能である。
 又、特定エリアでの気象×人流による事案検討・検証を行う際、前述のように時間的粒度が極めて高い気象庁アメダスデータと空間的粒度が現状比較的高いG空間データは、地理情報空間解析そして隠れた事案や既知事案の可視化に大いに活用出来き、その他媒体からの情報を参照させる事での定性解析も可能と言える。
 更に、いずれのデータも過去情報を備えており、近年益々標準解析となっている機械学習による予測検証も可能としている。
 今後の展望としては、過去データの蓄積とアクセスそして時間粒度(分別、時間別、日別、週別、月別、年別)や空間粒度(メッシュの細分区画)度合いが、活用先のニーズに応じて模索されるであろう。
 更に、幅広い産業分野や公共分野に於いて、データを利活用してのエビデンスに基づく意思決定が訴求される中で、データ駆動型の情報基盤の構築や公益と民益に資する活動が大いに期待される。

【使用データ】

G空間情報センター以外
  • 過去のアメダスデータ(最低気温、最高気温、降水量、瞬間(10分間)最大降水量、平均風速、最高風速、瞬間最高風速)、期間:2019年1月~2021年12月(3年間日別)、栃木県那須烏山アメダス観測地点