【タイトル】
Nationwide Synthetic Human Mobility Dataset Construction from Limited Travel Surveys and Open Data
【論文要旨】
近年、人間の移動に関連する広範な地理情報データセットの急増により、個人および集団レベルでの日常の移動パターンを解明する機会が増えています。このような分析は、交通予測、病気の拡散、都市計画、および汚染などの社会問題を解決するために不可欠です。しかし、データ収集対象者のプライバシーに対する懸念や、データフォーマットの統一が欠如していることから、データの利活用や流通が十分に進んでいないのが現状です。
この課題に対処するため、本研究は社会の基礎データの整備を目指し、オープンな統計データや共通の学習パラメータによるエージェントモデルに基づき、典型的な日常行動に関する時々刻々の活動内容、場所、交通手段、移動経路を推定し、擬似的な合成データ「Pseudo PFLOW」を作成・提供します。その結果、位置情報に加え、全人口に対する一人一人の人口属性(世帯・年齢・性別・就業状態)、1日の生活活動、活動に伴う移動トリップ(目的・時刻・起点・終点・交通手段)、移動軌跡をすべて提供することが可能となります。さらに、全国1724市区町村を網羅し、世界初の1.2億人分の擬似人流を再現し、携帯電話データとの0.81の高相関を実現しています。
一方、公衆衛生、都市計画、位置情報サービスなどのさまざまな分野におけるデジタルツインでのシナリオ分析の需要は、使いやすい人間の移動シミュレーションツールを必要としています。Pseudo-PFLOWデータセットは、基本的な合成人口統計情報、動的な人口分布、および個々の進行中の活動を提供することで、この需要に応えます。
In recent years, the rapid increase in extensive geospatial data sets related to human movement has provided opportunities to elucidate the mechanisms of daily movement patterns at both individual and collective levels. Such analysis is essential for solving social issues like traffic prediction, disease spread, urban planning, and pollution. However, concerns about the privacy of the users from whom data is collected, along with the lack of standardized data formats, have hindered the effective utilization and distribution of this data.
To address these challenges, we aim to establish fundamental societal data. This study creates and provides synthetic data, named “Pseudo-PFLOW,” that can simulate typical daily activities, locations, transportation modes, and travel routes of individuals based on open statistical data and agent models using common learning parameters. As a result, we can provide not only location information but also demographic attributes (household, age, gender, employment status) for each individual in the entire population, daily activities, travel trips (purpose, time, origin, destination, transportation mode) associated with these activities, and movement trajectories. Furthermore, this study covers all 1,724 municipalities in Japan, reproducing the movements of 120 million people with a high correlation (0.81) to mobile phone data.
Meanwhile, the demand for scenario analysis in digital twins across various fields such as public health, urban planning, and location-based services necessitates an easy-to-use human mobility simulation tool. The Pseudo-PFLOW dataset meets this need by providing fundamental synthetic population demographic information, dynamic population distribution, and individual ongoing activities.
【論文情報】
Takehiro Kashiyama, Yanbo Pang, Yuya Shibuya, Takahiro Yabe, Yoshihide Sekimoto. Nationwide synthetic human mobility dataset construction from limited travel surveys and open data. Computer-Aided Civil and Infrastructure Engineering. Available 10 June 2024 online.
https://doi.org/10.1111/mice.13285
Figure: Generation framework of Pseudo-PFLOW.