コラム

社会・経営課題×DXデジタルトランスフォーメーション

「データ駆動型事業運営」シリーズ　第3回：AIを活用したリスク管理

サービス分野から探す

タグから探す

トレンド

目的

業種

2021.5.25

DX技術本部富永祐

第2回連載では、データ駆動型事業運営に転換を図るべき事業・業務として、マーケティング、リスク管理、ビジネスリソース最適化を取り上げた。今回はデータ駆動型事業の具体的な事例としてリスク管理分野への適用事例を紹介する。AIを活用した、新たなリスク管理手法の導入メリットと課題にも触れる。

大手企業各社のIR情報を見ると、以下のような事業を取り巻くリスクが散在している。

事故・災害リスク（事業継続リスク）
財務リスク・信用リスク・不正リスク
運用リスク・システムリスク（サイバー攻撃によるリスクも含む）
風評リスク・法務リスク・コンプライアンスリスク

これらのリスクについて、発生確率の予測やリスクが顕在化した場合の影響把握などに対応するため、それぞれ定量化が行われてきた。リスク定量化については、以前からデータ活用が他分野と比べ進んでおり、各種リスクに応じた統計モデルや分析手法が開発されている。これらの中でも、特に進んでいるのが信用リスク評価である。

信用リスクとは、金融機関において借り手となる個人顧客や法人顧客が債務を履行できなくなる（支払いができなくなる）リスクのことである。

今回はリスク管理分野の中でも特にリスク定量化が進んでいる信用リスクを取り上げ、どのようにデータ駆動の適用が行われているかを解説する。

信用リスク評価の変遷

信用リスクについては、国内では2000年頃からデータを活用した統計モデルの導入が拡大してきた。信用リスクは、以下の理由からデータ駆動型事業運営と相性が良い。

審査ノウハウに関する高度な知識・経験が社員に求められる。さらにそれらのノウハウが一部の社員に集中しがちである。
頻繁に意思決定が発生する（1日に数百～数千件）。
審査の精度向上が、ダイレクトにリスクコストの削減、貸し倒れの減少による利益増大につながる。

このようなデータ駆動との相性の良さから、信用リスク評価の分野では、古くからデータに基づく予測モデル（従来型モデル）が活用されてきた。これらはロジスティック回帰分析などの古典的な統計手法を使用したものであり、なぜそう判断したかという理由を説明しやすい一方で、予測精度が不十分な場合もある。

近年はさまざまな分野において、AIを利用した将来予測モデル（AIモデル）が活用されるようになった。金融業界などにおける信用リスク評価においても、AIモデルを導入することで予測精度の向上が期待できる。昨今の最先端のAIモデルでは、勾配ブースティング決定木（GBDT）^※1などの信用リスク予測に適用可能なモデルがあり、従来型モデルと比べ予測精度が高いことが知られている。

AIモデルと従来型モデルとの予測精度比較

以下、AIモデルの導入により予測精度がどの程度向上するのかを、具体的な事例を基に検証した結果を紹介する。住宅ローンにおける信用リスク予測を題材とし、従来型モデル／ロジスティック回帰とAIモデル／GBDTを使用して貸し倒れ確率を予測するモデルを構築し、両者の予測精度を比較した。モデル構築には、20万件の住宅ローン申込案件（うち1,000件がデフォルト案件）を使用した。予測に使用する変数については、年齢や年収などの基本属性、申込金額などの申込受付情報（全19項目）の中から検討した。従来型モデルでは6項目、AIモデルでは19項目が変数として採用された^※2。

図1　従来型モデルとAIモデルの予測精度の比較

出所：MRI住宅ローンコンソーシアムデータを活用し、三菱総合研究所作成。

図1に、両者の予測精度の比較結果を示す。横軸は各モデルにて予測された貸し倒れ確率に基づき、A（＝低リスク）～G（＝高リスク）の7段階でランキングした結果である。縦軸は、各ランクについて実際にデフォルト（債務不履行）した案件の割合（デフォルト率）を算出した結果である。低リスクと予測された案件（A～D）に着目すると、従来型モデルと比べAIモデルのデフォルト率が低い傾向にある。

また、高リスクと予測された案件（F～G）については、従来型モデルと比べAIモデルのデフォルト率が高い傾向にある。これは、従来型モデルと比べAIモデルの方が実績値により近い予測結果を示しており、すなわち予測精度が高いことを意味する。実際、貸し倒れリスクの高い上位20%に含まれる貸し倒れ案件（この値をCAP20と呼ぶ）は、従来モデルで57%であったが、AIモデルでは78%に大きく向上した。

AIモデル導入の課題点

一方で、AIモデル導入にあたっては課題もある。第1に、モデル仕様がブラックボックス化してしまうことが挙げられる。従来型モデル／ロジスティック回帰は、変数の単純な足し算で表現されるモデルであり、変数の予測への寄与度や予測結果との相関（値が大きいほど貸し倒れ確率が大きいなど）が明確である。一方でAIモデル／GBDTは、多数の決定木の重ね合わせで表現されるモデルであり、多くの変数が予測に寄与することから予測結果の解釈が困難となる。ブラックボックス化は避けられないものの、変数重要度などの指標により変数が予測に与える影響を評価することは可能であり、これらの指標を積極的に活用していく必要がある。

第2に、AIモデルの精度が経年劣化するため、予測性能維持に向けて定期的なモデルチューニングが必要な点が挙げられる。図2は、AIモデルと従来型モデルのモデル構築時以降の予測精度（CAP20）をプロットしたものである。AIモデルの予測精度はモデル構築時には従来型モデルを大きく上回る一方、時間がたつにつれ低下傾向にある。逆に従来型モデルの予測精度は、モデル構築時からほぼ一定であり、経年劣化に強いといえる。AIモデルを導入する際には、予測精度の定期的なモニタリングと、経年劣化が確認された際には速やかなモデル再構築が必要となる。

図 2　モデル予測精度の経年比較

出所：MRI住宅ローンコンソーシアムデータを活用し、三菱総合研究所作成

データ駆動型事業運営の実現に向けたAIモデル導入の必要性

信用リスクに関連する事業は、リスクを高頻度かつ高精度で計測・評価することで、収益性と競争力を向上させることが目標となる。この目標の実現に向けて、従来モデルと比べ予測精度が高いAIモデルの導入は不可欠である。一方で、AIモデルは予測精度の経年劣化が早いという課題があるが、モデル導入後の再構築作業の完全自動化によって、常に高い精度でリスクを計測することが可能になる。このように、AIモデルによる高精度な意思決定を行いつつ、AIモデルの精度についても自動的にチューニング・維持される仕組みを構築することにより、信用リスク評価においてデータ駆動型の事業運営が実現するのである。

※1：複数の決定木の組み合わせによりデフォルト（債務不履行）確率などを予測する機械学習モデル。

※2：MRI住宅ローンコンソーシアムデータを活用し、三菱総合研究所作成。

社会・経営課題×DX