価格設定における説明可能なAI:ブラックボックスモデルを信頼できる意思決定へと変える

執筆:RNA Analytics主席アクチュアリーコンサルタント、スニル・ユン

1.はじめに

データサイエンスの分野が急速に発展し続ける中、多くの企業が機械学習や深層学習を用いたモデリングにますます関心を寄せ、これらの技術を実際の業務に活用しています。これらの技術には高い予測性能という利点がありますが、多くの場合、モデルがどのように結果を導き出しているのかを明確に説明することは困難です。こうしたモデルは、一般に「ブラックボックスモデル」と呼ばれています。

実際には、アクチュアリーであっても、複雑なモデル構造や内部の計算プロセスを直感的に説明するのは難しい場合があります。その結果、AIに基づくモデリング結果を外部に活用したり、意思決定に反映させたりする際に、限界が生じる可能性があります。

近年、こうした実用上の制約に対処するため、XAI(説明可能な人工知能)の活用に向けた取り組みが拡大しています。XAIとは、ユーザーがAIモデルの結果を容易に解釈し、モデルが意思決定を行う際にどのような変数やパターンを用いているかを理解するのに役立つ手法です。本記事では、XAIの主な手法を紹介し、保険の価格設定やモデリングの実務においてそれらをどのように活用できるかについて考察します。

 2. XAIのさまざまな手法

2025年11月にIAA AIタスクフォースが発表した論文「人工知能ガバナンス・フレームワーク」によると、XAIの手法は、大きく分けて「ローカルメトリクス」と「グローバルメトリクス」に分類される。それぞれには以下の特徴がある。

ローカルメトリクスは、各入力変数が個々の予測にどのように影響するかを説明することに重点を置いています。代表的な手法としては、個別条件付期待値(ICE)、ローカル解釈可能モデル非依存説明(LIME)、シャプレー加法説明(SHAP)などが挙げられます。これらの手法は、特定の観測値や契約について、各変数が最終的な予測に与える影響の方向性と大きさを示します。以下は、SHAPの結果の一例です。

SHAPの結果を通じて、特定の観測値について、各変数が最終的なモデル出力にどの程度寄与しているかを特定することができます。例えば、最終的なモデル出力が-2.83と算出され、入力変数「BonusMalus」の値が50である場合、この変数は、ベース予測値と比較して最終出力を約0.15下げる要因として解釈できます。 このようにして、個々の予測に対する各入力変数の影響の方向性と大きさを特定し、特定の契約やデータポイントに対するモデルの判断の根拠をより直感的に理解することができます。

一方、グローバルメトリクスは個々の予測に焦点を当てるのではなく、モデル全体という観点から、各変数が予測結果にどのような影響を与えるかを評価するものです。代表的な手法としては、部分依存プロット(Partial Dependence Plot)、特徴量の重要度の安定性(Feature Importance Stability)、フェアネスメトリクス(Fairness Metric)などが挙げられます。複数の変数を用いてモデルを構築する場合、グローバルメトリクスは、モデル全体を通じてどの変数が比較的大きな影響力を持っているかを理解するのに役立ちます。 以下は、R3S GIPで生成された特徴量重要度の結果を可視化した例です。

これらの結果は、SHAPに基づく特徴量の重要度であり、モデル出力に対する各変数の相対的な影響度を示しています。重要度の合計を100に正規化した場合、変数NV2の値が約26であるということは、モデルによる予測生成の過程において、NV2が比較的大きな影響力を持っていると解釈できます。 ただし、この値は実際の損害率や保険金請求に対する直接的な因果関係を示すものではなく、あくまでモデル出力に基づく相対的な重要度であることを留意する必要があります。

重要度の低い変数は、候補となる変数の削除やモデルの簡素化を検討する際の出発点として活用できます。ただし、実際に変数を削除するかどうかは、再学習を通じてモデルの性能、安定性、およびビジネス上の妥当性を確認した上で決定する必要があります。このプロセスを通じて、モデルの予測性能を確認しつつ、より軽量で解釈しやすいモデルの構築を検討するのに役立ちます。

3. 検討事項と代替案

XAIの手法を用いることで、AIベースのモデルに対して一定レベルの説明可能性を確保することができます。しかし、これらの手法だけではすべてを説明できるわけではなく、いくつかの重要な制限があります。

例えば、特徴量の重要度は、ある変数がモデルの予測結果や出力にどの程度寄与しているかを示すことができます。しかし、これは必ずしも、その変数と実際の結果との間に直接的な相関関係や因果関係があることを意味するわけではありません。さらに、変数間に相関関係が存在する場合、特定の変数の重要度が過大評価されたり、過小評価されたりすることがあります。

同様に、特徴量の重要度だけでは、特定の変数が1単位増加した際に最終出力がどの程度変化するか、あるいはその変化が実際のビジネスの観点からどのような意味を持つかを明確に説明することはできません。したがって、XAIの結果はモデルを理解するための参考資料として活用すべきであり、完全な説明や因果関係の証拠として解釈する際には注意が必要です。

こうした制限を補う方法の一つとして、代理GLMモデル(Surrogate GLM Model)のアプローチが挙げられます。 代理GLMモデルとは、ニューラルネットワークや勾配ブースティングモデルなどの複雑なAIモデルの予測結果を学習し、それらの結果を近似的に説明するGLMモデルを構築する手法です。具体的には、まず機械学習モデルが分析対象のデータセットに対して予測を生成し、次にこれらの予測値をターゲット値として設定し、最も類似した結果を生成するモデルを適合させることで、GLMモデルが構築されます。

GLMには、構造が比較的直感的であり、説明対象となる予測値と入力変数との関連性、および各変数の係数や影響の方向性をユーザーが把握できるという利点があります。したがって、サロゲートGLMを活用することで、AIに基づく価格設定結果の説明可能性をより理解しやすい形で補完することができます。

ただし、代理GLMは、元の機械学習モデルそのものを直接説明するモデルではなく、既存のモデルの予測結果を近似的に再現する補助的なモデルである。したがって、実際の価格設定モデルの代替としてではなく、AIモデルにおける変数の影響の全体的なパターンや方向性を理解するための補助的な解釈手段として用いるのが適切である。

4. 結論

機械学習が広く普及して以来、AI技術を活用してモデリングを高度化しようとするアクチュアリーの取り組みは、発展を続けています。最近では、LLMをはじめとするさまざまなAI技術の発展に伴い、以前はデータサイエンティストの専門分野と見なされていたML/DLベースのモデリングへのアクセスが、徐々に容易になってきています。その結果、保険実務におけるAIベースのモデリングの適用範囲は拡大しています。

アクチュアリーは、さまざまな実務経験を通じて得た深い専門知識を有しています。この専門知識をAIを活用したモデリング技術と組み合わせることで、より洗練され、実務上有用な価格設定やモデリングの枠組みが開発できると期待されています。

「説明可能なAI」は、AIを活用するアクチュアリーが導き出したモデリング結果を、より解釈しやすい形で提示し、従来の説明フレームワークと組み合わせて活用できるようにします。これにより、AIに基づくモデリング結果の信頼性を高め、企業の実際の意思決定プロセスに、より円滑に反映されるよう支援します。

RNAは、世界的なアクチュアリー向けソフトウェア企業として、さまざまな関連製品ラインを展開しており、今後も顧客と連携して関連機能やソリューションの開発を継続していく予定です。

Vicky Daniels