インフラデータチャレンジで勉強する② 橋梁点検データを見てみる
前回の続きで、今回は山口県周南市より提供される限定公開データ「橋梁点検データ」をざっくり見ていきたいと思います。
本当は、概要登録締め切り前に、今回コンペの目玉になりそうなデータは一通り、文章でまとめて自分の頭の中を整理していきたかったのですが、何とも時間が取れない状況です。
おそらくインフラデータチャレンジ自体は毎年開催されると思うので、審査期間以降も、ぼちぼちまとめだけは続けて勉強していければなと思います。
橋梁点検データの概要
下記リンクのパワポ資料がデータ概要をつかむのにわかりやすいかと思います。
http://committees.jsce.or.jp/cceips17/system/files/1-01_自治体の橋梁点検データの紹介.pdf
(土木学会インフラデータチャレンジ・キックオフシンポジウム(2018.8.6) | 土木学会 土木情報学委員会 インフラオープンデータ・ビッグデータ研究小委員会より)
提供されるデータは、以下の種類、構成になっています。
市道にかかる約800橋梁の以下4種類のデータ
①橋梁台帳(エクセル、PDF)
②橋梁点検調書 詳細様式(エクセル、PDF)
③橋梁点検調書 国報告様式(エクセル)
④橋梁データベース(.csv形式)
(平成26年度から平成29年度に点検業務を実施)
橋梁の状態、劣化や損傷の様子、それらの写真、原因に対する記載があります。
私は詳しくありませんが、おそらく橋梁定期点検要領 - 国土交通省に沿って記載されていると思われるので、決まったフォーマットや考え方に則った、ある程度粒度の揃ったデータだと思われます。
また、Excelではあるものの、生データが配布されているため、データベースに落とすことも可能です。
このデータをどうできるか
これに関して周南市さんからの指定課題は以下です。
・橋梁等の写真や各種データを効率よく見える点検アプリなどがあるとよい。(効率化のため)
・点検や判断などをマニュアル化したアプリがあるとよい。例えば、現場に行って、次に何をするのか、ある症状が確認されたら、どんな対策・材料を選べばよいかなど指針として適切なフローで導いてくれるような対話型アプリ(地方自治体の人員・技術力の補填)
・経年変化を予測するようなアプリ。例えば、現在の写真を撮ったときに、〇年後にはどうなるかなど。(経験・知識の補填)
・診断補助アプリ。写真を撮ったときに無数の写真データから類似の損傷を導き出し、その時の評価をどうしているか等が分かれば診断の補助となる。(経験・知識の補填)
・橋守アプリ。田舎の目の行き届かない橋の日常簡易点検を地域の人が簡単に報告できる。(人員の補填・協働)
・通過交通を安価に計測するアプリ。例えば、通ったらリアルタイムで通行したものを交通量調査のように計測するものがあれば、山奥の橋の利用実態把握に利用できる。
確かに、「撮影写真から、類似の損傷を見つけ出す」のは、画像認識とレコメンドエンジンみたいなものをうまく応用すればできそうな気がします。
また、損傷とその評価のセットがあるので、種々の機械学習にかけることも可能ではないでしょうか。
ただ、800点という点数は気になります。機械学習をやるには、おそらく少なすぎる。
さらには、損傷状態を数値化できればヒートマップとして可視化、市道のデータをどこかで拾ってこれれば、路線ごとにカテゴライズして図示、といったこともできそうです。
鉄道鋼構造物のヘルスモニタリング手法の確立に関する研究では、JRが持つ過去 12 年間分の橋りょう保守履歴(約 100 万レコード)を用いて、アソシエーション分析を試みています。
その結果、
例えば,き裂ひび割れは下フランジ支承部の変状と相関が強く,アンカーボルトに抜けが発生しやすいなど, 維持管理標準において明らかになっている事例を実データによる解析にて確認することができ,本解析手法の有効性が確認できた.
としています。
確かに橋梁とかだと構造由来の応力等による損傷が多く、パターン当てはめをやりやすそうな気がします。
それにしても100万レコードはすごい。
ただ正直、単純な機械学習モデルに落とし込むのは、土木構造物の点検等に実務で触れてきた身としては、直感的には難しそうだな、という印象です。
「膨大な点検データと性能評価の齟齬をどうする!」というタイトルのH30土木学会小委員会の資料では、その難しさの一端が読めます。
しかしながら,一方で,点検データは膨大に得られるが,その全てが性能評価において有効に活用されてい るとは言い難い現状がある.点検データは構造物の「症状」を示すものから性能評価のモデルの「入力」とな るものまで広く,また,用途・機能を満足するために定められる既設構造物の要求性能に対する満足度を,間 接的に表すとされるデータが大多数であり,性能の評価の信頼性は,それらを用いて判断する技術力に左右さ れるのが実態である.今はこれらをまとめて「診断」を行っているのが現状であると考えられる.
一方、難しいといういうのは簡単ですが、同資料の最後に「インフラ維持管理におけるデータサイエンスの活用」(北海道大学湧田特任准教授)と題した資料に考え方を整理したペーパーがありましたので紹介します。
脇田氏は、インフラ維持管理分野におけるデータサイエンス(構造物性能評価等のモデリング等)を行う場合の3つの課題を述べた上で、図のようにアプローチを整理できるとしています。
最後には、データサイエンス側と、土木技術側とで、十分に協業というか、科学的コミニュケーションの余地があるだろう、と結んでいます。案外、Googleなんかがパッと覇権を握りづらい分野なのかもしれません。
橋梁データあれこれ
とはいえ、市町村で現在まさに管理している橋梁のデータが公開されているのはすごいな、と。
また、他にもいくつか橋梁に関するデータベースはあるようです。
全国24,000件あまりの橋梁の形式、諸元、位置情報が公開されています。橋によっては、写真と図面が閲覧できます。
また、国土交通省も道路橋データベースという自前のデータベースにより点検結果の共有などを行なっており、自治体も必要であれば閲覧できるようです。
(http://www.mlit.go.jp/road/ir/ir-council/road_maintenance/pdf/20.pdf)
先ほどの橋梁の点検結果等を機械学習なりデータサイエンスのツールで処理する場合を考えても、大量のデータが必要であり、各主体で知見のみならず、データベースや学習済みモデルを共有することが必要となっていくような気がします。
しかしながら、そういった共有は、特に、橋梁なんかは事故が起きた際のインパクトが大きく社会不安を煽りかねず、言葉が一人歩きして要らぬ誤解を生むようなことも考えられます。リスクを考えると広くオープンにする経営判断はしづらいだろうな、という気もしています。その辺にも技術開発の余地がありそうです。