「データ駆動型事業運営」シリーズ 第6回:実装の進め方

タグから探す

2021.9.27

DX技術本部高橋怜士

社会・経営課題×DX

データ駆動型事業実装の難しさ

本シリーズ第3回第5回ではデータ駆動型事業の事例や活用のポイント、第4回ではデータ分析環境を紹介した。第6回は自社でデータ駆動型事業を実装する時の進め方を紹介したい。

ビッグデータを業務に直接つなげて活用するデータ駆動型事業は、「データにより変化する挙動を扱う」点で通常の事業と大きく異なる。データを用いた意思決定では多くの要素を考慮して最適な判断を行う。過去のケースと全く同じ状況で判断を行うことは無く、一見似たような状況でも異なる判断が自動でなされる。加えて、判断を行うためのAIモデルは適時更新されシステムは常に変化する。最適な判断・行動のために必要ではあるが、このようなシステムをコントロールすることは簡単ではない。

データ駆動型事業では新たに収集したデータを用いてシステムの性能を上げていく。そのためにモニタリングと検証が重要であり開発とシステム運用、サービス運用を切り離すことができない。これら運用を巻き込みながら新たなデータから変化を把握し対応すること、それを回し続けることにデータ駆動型事業実装の難しさがある。

AI判断の精度を上げるサイクル

データを取り扱う一般的なプロセスとして業界標準のフレームワークであるCRISP-DM(CRoss Industry Standard Process for Data Mining)がある。ここではCRISP-DMに沿ってデータ駆動型事業を実装する際のステップを紹介する(図1)。
図1 データ駆動型事業実装のステップ—CRISP-DMの流れと主なアウトプット
データ駆動型事業実装のステップ—CRISP-DMの流れと主なアウトプット
出所:三菱総合研究所
データ駆動型事業では一度実装して終わりではなく状況に応じて見直す必要がある。ここでは「営業成約率を上げるためのリスト作成」を例に、実装ステップの1サイクル目に実施すべきことと2サイクル目以降に実施すべきことをそれぞれ紹介する。

1サイクル目に実施すべきこと

①ビジネスの理解

自社のビジネスといってもプロセスの特徴などについては案外熟知できていないものである。

1サイクル目の①では対象となるビジネスの状況を理解した上で、業務課題を特定し、目的を決める。目的は「〇〇指標の改善」など、具体的に数字で測れるものが望ましい。営業成約率を高めるために既存顧客向けの営業を重視すると新規顧客獲得数が減るなど、指標はトレードオフの関係にあることが多い。自社のビジネスの状況を正しく把握しないと、成約率が高まる一方で全体の利益は減るような意味のない最適化や間違った判断を行うことになる。

営業リスト作成における具体的な検討例

まずは現状を把握することが重要である。例えば以下のような対応が考えられる。
  • 「営業方法」「使用している対象顧客リストとその作成方法」を確認。
  • 電話営業が主体であれば「使用しているトークスクリプト(シナリオ)」を取得し業務フローを整理。
  • 設定した課題の前提が正しいかを確認。
「営業成約率の向上」を大きな課題として設定する場合、絶対額ではなく成約率を重視してよいのかの確認は必要である。その上で課題を細分化し目的を設定する。
課題を細分化する軸はさまざまで、例えば顧客属性の軸では、継続受注がある顧客と新規に近い顧客とでは取り扱いが異なる。受注に至るまでのステップの軸では、営業成約率の高い顧客リストが重要なのか、受注率を高めるトークスクリプトが重要なのかは大事な確認事項である。
以降は「新規に近い顧客に対する対象顧客リストの改善、営業成約率の向上」といった指標を目的とした状況を考える。

②データの理解

データから見ても正しく対象が理解できているかを本ステップで確認する。AIなどを構築する前には、保有しているデータの種類や概要の確認が必要である。加えて基礎的な分析を行い、目的を達成するために必要なデータを確認する。1サイクル目は対象範囲を広げすぎてはいけない。まずは、ビジネスに強く関連すると思われるデータのみを対象とした方が良い。

ステップ①と②を繰り返し、それぞれの理解を深めていく。ビジネスの理解とデータの理解が進んだら、ユースケースと問題設定(解くべき問題)の整理を行う。例えばAIを活用する場合。ここでユースケースは「AIの使い方」、問題設定は「AIにやって欲しいこと」が該当する。ユースケース・問題設定はデータ駆動型事業において最も重要な作業である。以降のステップで大きく変えることは難しく十分に時間をかけて検討する必要がある。

営業リスト作成における具体的な検討例

自社内で利用可能なデータを整理し、前ステップでの疑問をデータ面から検討する。
例えば過去の営業ログを取得し、営業対象リストの改善が営業成約率向上に資するか否か(顧客属性の違いが成約率にどのように影響するか)を確認する。最終的に以下のようなユースケース・問題設定を作成する。
ユースケース:継続して受注が見込める顧客を除き、AIモデルによって付与された成約確率が高い顧客順に営業を行う。
問題設定:過去の営業ログを用いて顧客1人別・商品ごとに成約確率を予測する。

③データの準備

本ステップでは①と②で決めた問題を解くために大規模データを準備する。データはさまざまな場所やシステムに存在し、その定義(データの持ち方、取得時間や単位系)が異なるため、それらを収集、統一、整理する。データ駆動型事業では、この処理を一定期間ごと(理想的にはリアルタイム)に実行できるよう自動化を視野に入れて準備することが望ましい。

営業リスト作成における具体的な検討例

社内システムのデータを収集、名寄せなどを行い統合。AIモデル構築に適した形に変換する。
システムによって週次や月次など、締めやデータ送付のタイミングが異なる運用を考慮した調整が必須である。データ分析やAIモデル構築のためには、イベントの順序が変化しないよう時系列性を考慮した整理も必要となる。

④モデリング

③で準備したデータを元にAIモデルを構築するのが「④モデリング」のステップである。構築したモデルは次の「⑤評価」でその品質を確認する。③④⑤を繰り返し行いながら①②で決めたユースケースが実現できるようAIモデルの精度を向上させていく。

実運用時にモデリングの詳細確認が必要になることは多い。特にトラブル発生時には振り返りが必要である。そのため、モデリング時のプロセス明確化と再現性の確保が重要となる。

営業リスト作成における具体的な検討例

準備したデータを用いてモデル構築を行う。
この例では顧客別の特徴量(成約に関係すると思われるデータを整理・加工して出した数値)を作成した上で商品別に成約するか否かを予測するモデル(2値分類モデル)を構築する方針が有力である。モデル出力の候補には「成約有無のみ」「成約可能性のランキング」「成約確率」の3パターンがあり、それぞれ適した手法が異なる。本件のユースケースからは確率を求める必要はなくランキングを算出できれば良いことが分かるが、確率が必要な場合は別途対処する。

⑤評価

AIモデルが正しく構築できたかの評価は難しい。モデルの性能以外にも実用性の評価や倫理的な問題が無いかの確認など多面的な評価が必要である。まずは正しい品質目標を定め評価方法を決定することが重要である。品質目標は①②の整理結果に基づき設定する。前述の通り③データの準備・④モデリング・⑤評価は品質目標をクリアするまで繰り返し行う。

営業リスト作成における具体的な検討例

この例では成約予測の精度として一般的な性能評価指標(F値やROC AUC)とともにビジネスインパクト(AIモデル使用前後の成約率と成約額の変化など)を合わせて評価する方針が有力である。
営業時にはAIモデルの予測根拠を知りたい場合が多いため、予測結果を説明する手法を用いることもある。営業対象の商品によっては倫理的な問題を考慮する必要がある。例えば各種ローンのような金融商品ではセンシティブな属性で有利不利が生じないようにするなど対応が必要となる。

⑥展開

本ステップでは構築したモデルをシステムなどへ組み込んで利用する。展開後、システムのモニタリングを実施。取得したデータに基づいて2サイクル目を開始する。

営業リスト作成における具体的な検討例

自社の営業管理システムへの組み込みなどを行う。
継続的なAIモデルの改善のためにはモニタリングが重要である。必要に応じてモニタリング項目の追加やデータ取得タイミングの追加・見直しを行う。

2サイクル目以降に実施すべきこと

①ビジネスの理解・②データの理解

1サイクル目で得た経験とデータを踏まえ、正しい目的が設定できていたか否かを確認する。時間の推移に伴いビジネス状況や目的が変化した場合は問題設定を変更する。初回に取り込めなかったデータを追加してAIモデルの改善を目指すことも多い。

③データの準備・④モデリング・⑤評価

2サイクル目以降ではデータソースの変化や追加、問題設定の変更などが発生する。時間がたつにつれデータの整合性やAIモデルの仕様・再現性を確保する事が困難になるため、事前にこれらの変化に対応可能なツールを用いることが望ましい。1サイクル目の予測結果と現実との差分を分析し、AIモデルを高精度化・高度化する事も重要である。

⑦展開

2サイクル目以降では改善したモデルの組み込みのほか、モニタリング項目の見直しを行う。
データ駆動型事業の実装ではこのサイクルを回し続ける必要がある。サイクルの期間は規模や対象によってさまざまだが、短い方が良く、1サイクルは3カ月以内とすることが望ましい。データマネジメント、データ分析、AI開発、ソフトウエア開発、運用など多岐にわたるタスクをマネジメントするには、ツールやマネジメントプロセスの導入が欠かせない。

データ分析やAI開発を進め、データ駆動型事業の実装を促進するためのソリューションとして、SADP(Secured AI Democratization Platform:セキュアなAI民主化基盤)が存在する。SADPは上記のサイクルを回すために有用である。そのインフラは、サイクルのすべてのステップで活用できる低コストかつ高速、セキュアな統合プラットフォームであるForePaaSで充足される。

SADPより上位のレイヤー、例えばソフトウエア開発部分はアジャイル開発手法を導入し相性の良いツール群を活用する。

AIモデル構築ではモデルの管理や再現性の確保を行うため、MLOps(システム開発/AIモデル開発/システム運用を一体として行う方法論)を考慮したプロセス・ツールの導入が必要である。プロセス、ツールともに活用事例のあるものが存在しており、適切に組み合わせて使用することが重要である。

パイロットプロジェクトのすすめ

開発プロジェクトの担当者であれば一度は経験したことがあるかもしれないが、新たな開発手法を導入する際に現行プロセスを順次置き換えていく方法はうまくいかないことが多い。これは考え方が大きく異なる手法は混在できないからである。例えばアジャイル開発手法の一部を切り出してウォーターフォールの中に混ぜて運用するよりも、そのまま導入する方が容易で効果的である。

データ駆動型事業の実装でも同じことが言える。本コラムで紹介した内容と現行のプロセスが大きく異なる場合、パイロットプロジェクトを決め、SADP基盤と開発/運用プロセスおよびツール群を一度に導入することも検討に値する。SADP基盤、開発/運用プロセスとも規模が拡大した場合も十分にスケールする手法であり、パイロットプロジェクトで得た経験はより大規模なプロジェクトにも適用可能である。重要性を増しているデータ駆動型事業運営の中身を知り、今後のビジネスに活用する上でも、より良いツールやプロセスを一括採用し、小規模な試行から着手してみてはいかがだろうか。

関連するサービス・ソリューション

連載一覧

関連するナレッジ・コラム

もっと見る
閉じる