お問い合わせはこちら

多様な領域特化型AIの開発が日本の活路/経済産業省 渡辺 琢也氏

わたなべ たくや/昭和54年6月30日生まれ、兵庫県出身。東京大学工学部卒業、同大学院工学系研究科修了。平成16年経済産業省入省、令和3年商務情報政策局情報技術利用促進課長(併)ソフトウェア・情報サー ビス戦略室長、7年7月より現職。
わたなべ たくや/昭和54年6月30日生まれ、兵庫県出身。東京大学工学部卒業、同大学院工学系研究科修了。平成16年経済産業省入省、令和3年商務情報政策局情報技術利用促進課長(併)ソフトウェア・情報サー ビス戦略室長、7年7月より現職。

 経済産業省は現在、「競争力ある生成AI基盤モデルの開発(GENIAC=Generative AI Accelerator Challenge)を展開している。産学官の一体的連携のもと、日本の現場で具体的に活用可能なAIの開発を目指す。各産業分野の特性をAIに学習させるにはデータと人材、スピード感が必要だ。渡辺琢也情報産業課AI産業戦略室長に、日本のAIをつくり、使っていく上でのポイントや課題等を解説してもらった。

商務情報政策局情報技術利用促進課長
     兼 情報産業課AI産業戦略室長 渡辺琢也氏

――経済産業省が進めているGENIACについて、その背景をお願いします。

渡辺 Chat GPTがLLM(大規模言語モデル)の社会実装の扉を開け、AIはまた新たな革命を迎えました。日本は少子化および人口減少が進む中、生産性向上を図るため、AIの利活用が必須とされています。

 ただ、AI利活用には大きな課題が二つあります。一つ目は、拡大するデジタル赤字です。AIを使えば使うほど国富が海外に流出する現状に対し、海外から提供された技術を使うだけでよいのか、という問題意識が生じます。二つ目は、こちらの方がさらに重要ですが、海外でつくられたAIだけで果たして本当に日本の現場で上手く使えるのかどうか、という点です。

 AIの革命が起こったこのタイミングで、日本はこの二つの課題を共に解決する、すなわち自らAIをつくり、かつ使える国にならなくてはなりません。しかし、民間企業だけでその実現を図るのは困難です。LLMを作るにはGPUという半導体が必要で、今でこそだいぶ提供するサービス事業者が増えてきましたが、少し前まで日本の企業規模ではほとんど入手できませんでした。その時には、GPUを提供する、いわゆるビッグテックからの提案のうち、最も好条件の内容をわれわれ経産省が一括調達し、スタートアップや大学に配分するという方式を採らざるを得ない状況でした。

――おそらく価格面だけでも、個社では調達が困難なのは想像に難くありません。

渡辺 そこで経済産業省とNEDO(国立研究開発法人新エネルギー・産業技術総合開発機構)は、日本における生成AIの持続的な開発力を高め、社会実装を加速するため、2024年2月に、GENIACプログラムを立ち上げました。

 産業界やアカデミアにおける基盤モデルの開発に必要な計算資源の調達、データセットの構築、ナレッジの共有等を支援しているほか、GENIAC-PRIZE(NEDO懸賞金活用型プログラム)において、さまざまな地域や事業者等から、生成AIアプリケーションの開発・実証成果の応募を募ることで、生成AIの全国的な開発・利活用を促進していきます。当時採択したスタートアップがその後に急成長するなど、着実にプログラムの成果が上がっています。

特定業務ドメインに絞り性能向上を

――具体的な方向性などはいかがでしょう。

渡辺 海外のビッグテックは非常に広範な領域で高性能なAIを提供していますが、日本で同じことをするのは難しいと考えます。しかし、特定の専門領域において追加データの投入と丁寧な学習を施せば、当該領域で性能の高いAIをつくることは大いに可能です。例えば流ちょうな日本語、エンターテインメントや製造業などの、ある業務ドメインに絞って性能を上げることが期待されます。

 GENIACはおよそ半年ごとに支援サイクルを回しているのですが、こうした領域特化型のAIづくりに強みを発揮できることが最初のサイクルで判明しました。それ故、2サイクル目以後の公募は領域特化型AIへの申請が一気に増えました。当初、日本でLLMをつくることに半信半疑の空気があったのですが、今では領域特化型のモデル開発が数多く進展しています。正直、当初はここまで多様なモデルが出てくるとは想定していませんでした。

――マッチング活動も行っているとか。

渡辺 はい、GENIACはコミュニティ活動も重視しており、社会実装に関わる各種関係事業者間のマッチングも推進します。LLMをつくる点に比重を置いてGENIACはスタートしましたが、現在はユーザーサイドへの比重が高まっており、使う側のプレーヤーもだいぶ数が増えてきました。

 とはいえ、LLMが十分に社会実装しているとはまだまだ言い難く、産業界においては業務のもっと深いレベル、ROI(Return On Investment =投資利益率)にインパクトを与えるレベル、組織改編を伴うレベル等で、AIを使いこなせるはずだと考えています。従ってGENIACにおいては、AIを十分に使えるよう、ユーザー企業同士の勉強会やベストプラクティスの発表など、文字通り〝つくって使う〟ことに向けてさまざまな活動を展開しています。

社会実装によってAIは進化

――数年のプログラムで、着実に手応えが得られているようですね。

渡辺 トランスフォーマーという技術が登場して、次の文字を予測する形で流ちょうな言語を紡ぎ出し、画像や音声に応用することができるようになりました。一方でフィジカルAIが注目されていますが、人間のように動くことは、AIではまだ実現できていません。今後、さらに次のステージへ向かおうとしています。

 基盤モデルが今般のAIづくりを支えていますが、世界的に研究開発が行われているので、日本がキャッチアップできたという状況と捉えるには今なお時期尚早です。先行に対して、まだまだ追いかけ続けねばなりません。

 ただ、AIは学習することによって進化するので、突き詰めれば社会実装することが何より重要だと思います。

――社会実装こそ、なにより学習の機会であると。

渡辺 はい、それによってAIの進化が期待されます。その際、現在の学習方法で十分な性能が引き出せないとするならば、研究開発を通じて性能実現を図るという営みが、間断無く連続的に行われていく必要があります。まさに、エコシステムの構築です。AIは新社会人のようなもので、使って鍛えてあげることが重要です。各専門分野で蓄積したデータ類を上手く学習させるプロセスが重要視されます。そのプロセスの確立が、AIの性能を引き出すためのカギになると言えるでしょう。

――やはりデータの重要性に帰することになりますね。

渡辺 LLM は、インターネット上に大量のデータが集まり、そこにAI開発者がアクセスできることによって生まれたものですが、いよいよインターネット上のデータは枯渇しつつあります。しかし世の中には、インターネット上にないデータ、すなわち各分野で長い年月に蓄積されてきたデータの方が圧倒的に多いわけです。

 この点、AIの社会実装がまだ十分でないというのは、これら既存のデータとAIが、現実的には効果的に接合できていないことも意味しています。

 今後AIの進化には、現場のデータが不可欠となりますが、単にデータが蓄積されているだけではAIの性能が上がるわけではありません。データの種類、つまりモーダルも千差万別で、人間でなければ、さらには専門家でなければ、意味する内容や示している現状を理解・把握できないデータも山ほどあります。こうした点は、まだまだAIは学習されていません。

 このように、AIは研究室だけでつくられ、役立つものではありません。産学連携と言われますが、AIほど産と学が表裏一体であることを求められる分野はないと思います。学術界の研究とAIをつくりこむエンジニアリングが一体的であることが不可欠であり、そうあらねばなりません。また、AIとはデータであり、データは使われることによってさらに生まれます。研究開発によってデータをAIに生かすテクノロジーが生み出され、エンジニアリングによってAIがつくりこまれ、それが使われることでさらにデータが生み出され、AIの性能が上がるのです。