Interview
機械学習モデルを通して
この世の全ての複雑現象を観察する「望遠鏡」や「顕微鏡」を作る
一橋大学 ソーシャル・データサイエンス学部 准教授
本武 陽一 先生
熱機関の開発をきっかけに食料不足を解決する
科学による課題解決の好例
1769年にジェームズ・ワットによって開発された熱機関が、産業革命や工業化社会の原動力とななったことはよく知られています。科学者は、その性能を向上させ原理を解明することを通して熱力学の構築をはじめました。最初は、圧力や体積といった観測可能な物理量のモデル化から始まりました。このような特定の現象について観測されたデータの範囲内でその現象をモデル化したものを「内挿モデル」と呼ぶことにします。科学者は、単なる特定の現象の内挿モデル構築だけにとどまらず、この宇宙であまねく成立するエントロピー増大則や、自由エネルギーといった抽象的で汎用的な原理・法則・概念を発見するに至りました。この宇宙に存在するあらゆる現象を記述する熱力学は、最終的にアメリカの物理学者のウィラード・ギブズ(1839-1903)が完成させました。これによって、熱機関の理論であった熱力学が化学反応における新たな指針の存在を予言し、その結果、ハーバー・ボッシュ法によるアンモニアの合成から化学肥料づくりの技術開発が導かれました。このような特定の現象の観測データの範囲を超えた一般的に成り立つモデルのことを、ここでは「外挿モデル」と呼ぶことにします。つまり、単なる内挿モデルを超えた一般原理(外挿モデル)の解明が実現されたことによって、大きな社会課題であった食料不足が解決されたのです。
AIにも苦手があり、科学者に置き換わることはできないから
人間と機械学習の橋渡しをする
しかしながら、現象が初期宇宙の形成や高分子材料内の構造形成、生物の群れのダイナミクス、各種経済現象といった非線形・非平衡で複雑な現象となると、そもそも内挿モデルの構築自体が困難となります。その場合、科学者の洞察による一般原理の探索の段階に至ることができなくなってしまいます。
近年、機械学習モデルを用いて複雑な科学データを分析・モデル化する研究が活発に行われています。一部の人は、機械学習によってAIが科学者に置き換わることを期待するかもしれませんが、残念なことに機械学習は、原理的に与えられたデータの「内挿モデル」構築を得意としており、人間の科学者のような柔軟な「外挿モデル」の発見は苦手としています。したがって、機械学習だけによって前述のような、外挿的な一般原理の発見への流れを実現することは困難です。そこで私の研究している「データ駆動理学」では、複雑なデータの内挿モデル構築を得意とする機械学習と、科学的洞察によって大胆な演繹的外挿を実現する人間の協業が重要と考え、機械学習を用いて複雑現象の一般原理・法則を探索する科学者を支援する枠組みの構築に取り組んでいます。
人間と機械学習の協業を実現するうえで、最も重要な課題の一つとなるのが機械学習で得られた内挿モデルを解釈して人間に伝達する手法の開発になります。特に、近年発展した深層ニューラルネットワークのような複雑な機械学習モデルは、多量のパラメータを持つ非線形関数で構成されたブラックボックスとなるため、学習結果の解釈が一般に非常に困難とされています。そこで私の研究室では、機械学習の解釈手法や解釈可能な高性能モデルの開発、解釈可能な機械学習モデルを用いた社会課題の解決を目指しています。ChatGPTなどの、近年の高性能な機械学習関連技術の発展によって、AIの判断や推論の機序を解釈することの重要性がますます増大しています。これらの機械学習モデルも複雑現象の内挿モデルととらえることができるため、データ駆動理学のために開発された解釈可能AI技術は、このような社会課題の解決にも直接貢献できると考えています。
私の研究室では特に、最終的なゴールである社会課題の解決を強く意識し、その課題の専門家との議論を通して、研究課題を具体化・定量化したうえで、その課題を解決するために必要な解釈可能な機械学習モデルの開発を行うといった、目的志向型の研究開発を行っています。具体的な課題を重視するのは、科学の真の威力は前述のような抽象化による外挿性にあるため、開発した手法で抽出された複雑現象の原理・法則の正しさと威力を検証するには、研究室で発見した原理・法則を、現実世界の課題解決にある種の外挿をして検証をする必要があると考えるためです。
現在具体的に扱っている社会課題は、革新的な材料開発や核融合技術の実現といった持続可能な社会の実現のための各種技術課題の解決です。そのような革新的な技術開発をする科学者をサポートする、解釈可能AIの枠組みを開発するためには、構造材料、磁性材料、高分子材料、電磁流体などの幅広い材料・現象において観測される、複雑なパターンダイナミクスの物理法則・原理を解明する必要があります。私の研究室では、このような材料科学による社会課題の解決を志向するデータ駆動理学の研究を、科学技術振興機構の戦略的創造研究推進事業「さきがけ」や、NEDO「未踏チャレンジ2050」といった国のプロジェクトとして採択してもらい、一橋大学内にとどまらず複数の学外研究者との協力のもとで実施しています。また、研究室に高性能マルチGPU計算機や、600コアCPU計算機、大容量メモリ搭載計算機といった大規模な計算機環境を構築することで、大規模で複雑な実課題を解決するための手法開発やその有用性を検証するための体制も確保しています。
「この世界の現象をすべて知りたい」
私は子供の頃より、「この世界の現象をすべて知りたい」と思っていました。それを実現できる枠組みとして、物理学が最も可能性が高いと考えました。しかしながら高校の時点で自分には物理学の能力が足りないと認識するようになり、その自分の足りない能力を拡張するAIのような技術が必要であると考え、東北大学の情報系の学部に入りました。ところが、当時の人工知能は、今日のような柔軟で高い性能を持っておらず、自分の知能拡張には活用できそうにありませんでした。そこで理学部物理学科に転部し、北海道大学大学院理学院宇宙理学専攻の修士課程に進みました。
ところが案の定、自分の能力不足に悩むとともに、そもそも「この世界の現象をすべて知りたい」という目標を100年程度で実現することは困難であるという当然の事実が現実として突きつけられました。そこで、今では人生の目標を「この世界の現象をすべて知るように努力し続ける」ことへと緩和し、今度は東京大学大学院総合文化研究科の修士課程に入学して機械学習による知能拡張の試みに立ち戻ることにしました。2012年、「Googleが、深層ニューラルネットワークで猫を認識する学習をしたところ、猫に対応するような表象が自然と出現した」というニュースが飛び込んできました。「これだ!」と直感して修士課程の修了後の2013年に、同じ研究科の人工生命や複雑系分野の先駆的研究者である池上高志教授の研究室の博士課程に進み、深層ニューラルネットワークを分析してその内部構造を部分的に理解したり、そこで得られた知見をもとに大規模な複雑現象を分析する研究を行いました。その結果、深層ニューラルネットワークのような機械学習モデルは、理解することが困難である、大自由度な複雑現象を観察することができる望遠鏡や顕微鏡のような測定装置になり得るとの確信を持つに至りました。
その確信のもと、2016年4月から3年間、東京大学大学院新領域創成科学研究科の特任研究員として、鋼材の破壊現象や放射光測定系を対象として、既存の物理モデルを改善したり、そのためのヒントをデータから抽出するような研究を行いました。これによって、既存の物理モデルの素晴らしさを再確認するとともに、その人類の資産をいかに機械学習に取り込むかが重要であるということを気づかされました。
このように、私の動機はデータ分析そのものや、その手法開発にあるのではなく、現象の理解にあります。また、「この世界の現象をすべて知りたい」ということがそもそもの人生の目標ですので、研究を通してこの世界のあらゆる分野について知ることに大きな喜びを感じます。
機械学習という技術は今後さらに一般化し、多くの人が習得・活用できるようになります。しかし、その技術を身につければ、現象が解明できるというものではありません。重要なのは、問題を設定し、仮説を立て、データを集めて分析し、モデルを提示・評価し、社会実装するといった一連の研究プロセスを実現できる能力を身につけることです。こうした能力なくして、データサイエンスによって科学を発展させ、社会課題を解決していくことは困難です。そして何よりも、ある現象のメカニズムを知ったり制御したりしたいという強い動機が重要と考えます。学生の皆さんには、そういった目的志向型の動機を持ちながら、大学選びや日々の勉強をしてもらえると良いのではないかと思います。
一橋大学 ソーシャル・データサイエンス学部
本武 陽一先生の研究室
https://mototakelab.github.io/
一橋大学_本武 陽一先生
https://www.sds.hit-u.ac.jp/faculty/%E6%9C%AC%E6%AD%A6-%E9%99%BD%E4%B8%80/
https://hri.ad.hit-u.ac.jp/html/100001641_profile_ja.html