インフラデータチャレンジで勉強する① データをざっくりと眺める編
1. 参加のモチベーション
土木学会のインフラデータチャレンジに参加しようと考えています。というかずっと春からそう思ってたけど、とうとう〆切が今月になり焦っております。
一応私、昼職としては土木インフラ技術を官公庁等に提供する仕事をしており、関連知識が(純粋に情報系の人に比べれば)多少あることから、2018年今年から新たにこういうコンペが始まったと聞き、ずっと興味を持っていました。
そして私自身は、この古臭くてカビの生えた業界、日本型ピラミッド組織の代表のような旧態依然とした業界に風穴をぶち開けたい、新技術の活用でより効率的で、若者にとって魅力的な業界にしたい、そう行った取り組みを支援、参加していきたいという思いがずっと何年もあり、そういうモチベーションもあります。
副次的なモチベーションとしては、インフラに関する知識そのものも増やしたい(普段業務で触れない業界の勉強)、そしてあわよくば転職活動のためのポートフォリオにしたいというのもあります。
2. ざっくりとデータを眺める
インフラデータチャレンジをざっくりと眺めてみます。が、かなり広範で、いろんな種別や粒度のデータが混在しています。
上記公式サイトよりも、そのデータのドメイン的な知識や、今回の提供に至った背景等を知るためには、以下のキックオフシンポジウムでの資料PDFがわかりやすいかと思います。
土木学会インフラデータチャレンジ・キックオフシンポジウム(2018.8.6) | 土木学会 土木情報学委員会 インフラオープンデータ・ビッグデータ研究小委員会
土木学会インフラデータチャレンジ・シンポジウム@大阪(2018.11.21) | 土木学会 土木情報学委員会 インフラオープンデータ・ビッグデータ研究小委員会
2-1. ジャンル(業界)による分類
公式サイトの分類としてジャンル(業界)で一応分けられており、以下の11ジャンルとなっています。
道路 12件
公共交通 6件
河川 1件
港湾 2件
空港 3件
水道 2件
工事 4件
地形地質 8件
気象 5件
防災 1件
人流・物流 1件
2-2. 提供主体による分類
提供主体も様々なモチベーションを持ってデータ提供を行っていることが読み取れます。
ざっとみた感じ、地方自治体は「こんなことやってますぜ」的なPRの意図があるように感じ、国の機関は、提供要請に応じてとりあえず出してきた、用途については不明瞭なデータが多いような気がします。
また、民間各社のデータに関しては、偏った言い方をすると、ずっと前からその分野で取り組まれてるやつだし、「コンペに出さずにあんたんとこで開発するべきやつじゃないの」って思ったりしました。
<国>
国土交通省港湾局 : 各種調査統計データ
国土交通省航空局 : 空港利用に関する各種調査統計データ
気象庁 : 平成30年7月豪雨時の警報等の発令記録、解析雨量、GPV
内閣府 : 中央防災会議で検討・承認された広域地震の地震動データ
<地方自治体>
兵庫県加古川市 : 公用車走行データ(はたらく車プロジェクト関連データ)
http://committees.jsce.or.jp/cceips17/system/files/1-02_公用車走行データ(はたらく車プロジェクト)の紹介.pdf
山口県周南市 : 橋梁点検データ
http://committees.jsce.or.jp/cceips17/system/files/1-01_自治体の橋梁点検データの紹介.pdf
福島県会津若松市 : 公用車・公共交通車両走行情報、歩行空間ネットワークデータ、会津市内バス時刻表情報
東京都水道局 : 水質年報、お客様満足度調査
山口県、島根県 : コンクリート施工データベース、工事実績のメタデータ
<民間企業>
(ゼネコン)鹿島建設 : データ提供なし(協賛と指定課題の提示)
(道路会社)首都高速、ネクスコ中日本・西日本 : 高速道路各種データ
(測量会社)国際航業、パスコ : 航空写真、DSM、3次元空間データ(LAS, PGR, )
<その他>
(公財)河川財団 等々 : 各種の独自データ、デジタル道路地図データベース
2-3. 提供されるデータ以外のデータソース
また、提供されるデータ以外にも種々のすでに公開されているデータセットや地図なんかも探していけば、色々あることがわかりました。
・インフラデータチャレンジにてリンクが紹介されたDB等
<国土地理院>
地理院地図http://maps.gsi.go.jp/help/
測量成果ワンストップサービスサイトhttps://onestop.gsi.go.jp/onestopservice/
地図・空中写真閲覧サービスhttp://mapps.gsi.go.jp/maplibSearch.do#1
主題図(地理調査)http://www.gsi.go.jp/kikaku/index.html
基盤地図情報http://www.gsi.go.jp/kiban/index.html
<一般財団法人 日本建設情報総合センター>
工事実績情報http://www.jacic.or.jp/counter/counterkoujijisseki.html
<気象庁>
気象データ高度利用ポータルサイトhttp://www.data.jma.go.jp/developer/index.html
<国土交通省>
河川環境DBhttp://mizukoku.nilim.go.jp/ksnkankyo/03/index.htm
川の防災情報http://www.river.go.jp/kawabou/ipTopGaikyo.do?init=init&gamenId=01-0101&fldCtlParty=no
水文水質データベースhttp://www1.river.go.jp/
水害統計https://www.e-stat.go.jp/stat-search/files?page=1&toukei=00600590&result_page=1
これらと提供データを組み合わせていく、逆に、これらを主としてアプリや分析を組み立てていくアプローチも多分にありかと思います。
3. どんなゴールが考えられるか
募集作品の要件としては、「データ・ICTを活用して、インフラ管理者や利用者が抱える課題を解決するアプリやアイデア」と掲げられています。
応募部門は以下の3つであり、その他、いくつかの指定課題があるようです。
- アプリ部門 データを活用したアプリケーションの作成
- アイデア部門 データの分析による課題解決策、ソリューションの提案
- データ部門 データの可視化、新しいデータセットの構築
アプリだけではなく、データの可視化や分析レポートの状態でも応募できるとのことです。
また、Mediumにこう言う作品もありですよ、と例示した記事がいくつか載せられています。
4. 所感など
以上を踏まえてのこのコンペに関するワイの所感(私感)を述べます。
・データを解析するとしてもドメイン的知識が必要なものがいくつかある(道路関係はそう言う知識のある社しかできないし、個人としては開発工数が割に合わない気がする)。
・上記のドメイン的知識があるなら、指定課題が狙い目だと思われる。
・幾ら何でも範囲が広く、求めるものがふわっとしすぎている気がする。今後はこういったコンペはさらに増えていくだろうが、どんどん細分化していくのではないか?
これから、各データをじっくりみていくことでコンペで勝てるアイディアを出していくのはもちろん、いろいろ勉強していきたいと思います。
*1:リンクは、提供されたデータをざっとエクセルでまとめようとして力尽きたもののPDFです