データ分析とは?方法やデータの種類、役立つツールなどを解説

「情報爆発時代」と呼ばれる現代市場において、企業が持続的に発展するためには、ビッグデータの戦略的な運用が欠かせません。そこで重要な役割を担うものが、データ分析への取り組みと、それに関する知識です。本記事では、データ分析が求められる背景やメリットについて解説するとともに、代表的な分析手法や役立つツールを紹介します。

データ分析とは?

「データ分析」とは、収集・累積されたデータ群から、狙いを定めた情報をピックアップし、規則性や傾向などを分析することで、意思決定の材料を導出するプロセスを表します。現代の企業経営における、重要な経営課題として挙げられるものが、指数関数的に増大しつつあるビッグデータの戦略的な運用です。組織のデータベースに累積された膨大なデータ群を、適切な手法を用いて分析し、マネジメント領域の経営判断やマーケティング戦略の立案・策定などに役立てることが、データ分析の主な狙いとなります。

データ分析が求められる背景

データ分析が求められる背景にあるのは、「DX(デジタルトランスフォーメーション)」の推進です。現代では、科学技術や情報通信技術の進歩・発展に伴って、市場の変化が加速しており、製品や技術のライフサイクルが短命化していく傾向にあります。それと同時に、顧客や消費者のニーズが多様化かつ高度化していく中で、企業が持続的な競争優位性を確立するためには、DXの推進が欠かせません。そして、DXの実現には事業活動を通して、収集・累積されたビッグデータの運用が不可欠です。

このような背景から、勘や経験などの曖昧な要素に依存しない、データドリブン経営の重要性が高まっており、「BI(ビジネスインテリジェンス)」を導入する企業が増加しています。BIとは、累積されたデータ群を見える化・分析し、的確な経営判断や迅速な意思決定を支援する手法や技術を意味します。しかし、事業領域において、ビッグデータやBIを的確に運用できている企業は決して多くありません。DXを実現するためには、データ分析に関する理解を深め、その知見をどのようにして、マネジメントやマーケティングの領域に応用するかが重要な課題となるでしょう。

データ分析のメリット

事業領域にデータ分析を用いることで得られる、主なメリットは以下の3つです。

・企業の経営判断が加速する
・データに基づいた精度の高い意思決定が可能になる
・新たなビジネス分野に参入できる

企業の経営判断が加速する

企業が組織としての成長と発展を通じて、社会に貢献するためには、競合他社にはない独自の付加価値を創出しなくてはなりません。そのためには、市場の需給や経済の動向、競合他社の経営状況などを詳細に調査・分析し、勘や経験などの先入観に捉われないデータを起点とする、ロジカルな意思決定が求められます。また、データ分析の推進によって、自社が抱える問題や課題の早期発見につながり、スピーディーな経営判断と、的確な対策の立案に寄与する点が大きなメリットです。

データに基づいた精度の高い意思決定が可能になる

市場のニーズが多様化・高度化していく傾向にある現代では、どのようにして見込み客の潜在的な需要や、消費者のインサイトを的確に捉えるかが重要な課題です。テクノロジーの発展とともに、変化の加速する現代市場の中で、市場の潜在需要を的確に捉え、精度の高い経営判断を下すことは容易ではありません。市場や需要の動向、自社製品の売上推移など、さまざまな要素を多角的に分析することで、客観的かつ論理的なデータ分析に基づく、高精度な意思決定が可能になるでしょう。

新たなビジネス分野に参入できる

DXを実現するためには、最先端のデジタル技術を経営体制に取り入れるとともに、新しい時代に即した新規事業の創出を推進する必要があります。新たな市場へ参入する際は、中長期的な視点から事業リスクを多角的に分析し、マーケティングやプロモーションの妥当性を検討するプロセスが不可欠です。組織内に散在している、さまざまなデータを統合・分析することで、事業リスクの見える化やビジネスチャンスの発見に寄与し、新たなビジネスモデルを確立する一助となります。

データ分析の流れ3ステップ

基本的に、「目的の明瞭化」→「データの収集・統合」→「データの分析」の3ステップを、段階的に踏破していくことが一般です。

目的の明瞭化

ファーストステップは、分析を実践する狙いの明瞭化です。例えば、航海において安全かつ確実に目的地に辿り着くためには、まず最終的なゴールを明瞭化しなくてはなりません。最終的な目的地の明瞭化により、適切なルートの選定やスケジュールの設計、必須の装備品の調達などが可能になります。これと同様に、データ分析も狙いを定めない限り、データベースからどのデータをピックアップし、どのような分析手法を用いるべきかを決定することは難しいです。

前述したデータ分析の3ステップを、さらに細分化すると「データの収集」に始まり、「データの累積」→「データのピックアップ」→「データの変換」→「データの見える化」→「データの分析」のプロセスを辿ります。このプロセスを確実に踏破するためには、まず必須のデータセットや分析手法を具体化しなくてはならないでしょう。そして、自社が抱える経営課題や業務プロセスのボトルネックなどを洗い出し、データ分析を実践する狙いの明瞭化が必須です。

データの収集・統合

次は、データベースに収集・累積されているデータをピックアップし、分析に適した形式に変換・統合するステップに移行します。このステップにおける重要課題となるものが、「前処理」と呼ばれる工程です。基幹システムや顧客管理システムなどに累積されているデータは、基本的に規模が不均一であるため、破損・重複・不正確なデータが含有されています。

分析対象となるデータに、欠損値や外れ値などが含有されているほど、データ分析は多くの時間を要するため、エラーやノイズを除外して、構造化データに変換するプロセスが欠かせません。このプロセスこそが前処理と呼ばれる工程であり、データ分析における全工程の6〜8割を占めます。前処理のプロセスを経て、分析に適した形式に構造化されたデータセットは、データウェアハウスへ送出され、次の工程で見える化・分析されます。

データの分析

データは収集・累積するだけでは意味を成さず、マネジメントやマーケティングなどの事業領域に運用してこそ、真価を発揮します。そこで重要となるものが、データの傾向やパターンなどを視覚的に表現する「データビジュアライゼーション」です。前処理によって、変換・統合されたデータは、構造化データのみを保管するデータウェアハウスへ送出され、BIツールを用いて、グラフやフローチャートなどにイメージ化されます。

したがって、単純な数値や曖昧な言語では理解しにくいデータを、俯瞰的かつ視覚的な視点から分析できる点が大きな特徴です。データセットをグラフやフローチャートなどに見える化することで、傾向やパターンなどを発見し、新たな知見を得られる可能性が高まるでしょう。このような分類・取捨選択・整理などのプロセスを経て、見える化されたデータセットを適切な手法を用いて分析し、経営判断や意思決定の材料へと昇華することが、データ分析の本質的な役割です。

データの種類

データを大きく分けると、「定量データ」と「定性データ」の2種類が存在します。定量データとは、売上高や受注金額、商談回数、受注率、時系列情報、WebサイトのPVやUU、自然検索流入数、コンバージョン率などの、数値化できるデータを表す概念です。具体的な数値として集計・計測されるため、客観的な分析や情報の加工が比較的容易であり、参入市場や需要動向の調査、顧客分析、売上予測、マーケティング分析などの領域における、基礎データとして運用されます。

定性データとは、数値化できない言語的かつ抽象的なデータを意味する概念です。例えば、見込み客の購買意欲やコールセンターに寄せられる顧客の声、自社ブランドに対する愛着心、プロダクトデザインに対する評価などが該当します。つまり、感覚的で言語化しにくい見込み客の潜在需要や、消費者のインサイトを発掘する際の基礎データとなる要素です。分析手法によって、求められるデータの種類が異なるため、適切な情報のピックアップには、事前にデータ分析の狙いや用途を明瞭化する必要があります。

代表的なデータ分析の手法9選

現代では、多種多様なデータ分析の手法が確立されており、狙いや用途に応じた、適切なフレームワークの使い分けが求められます。データ分析の代表的な手法として挙げられるものが、以下の9つです。

アソシエーション分析

「アソシエーション分析」とは、複数のデータセットから、規則性や類似性を割り出す際に用いられるフレームワークです。

例えば、購買データに基づいて、顧客や消費者の購買行動に内包される関連性を分析し、「Aの条件ならば、Bの結果が発生するだろう」などと仮説を立てます。「商品Aを買う顧客は、商品Bを同時に購入する傾向がある」という規則性を発見できれば、クロスセルによる売上高と、顧客単価の向上が期待できます。オムツとビールを近くの棚に陳列することで、それぞれの売上が向上した「オムツとビールの法則」が、アソシエーション分析の代表的な事例です。

バスケット分析

「バスケット分析」は、購買データの分析に基づいて、一緒に購入されやすい商品を洗い出す分析手法です。アソシエーション分析に含有される手法のひとつであり、顧客の購買履歴から、消費活動における特定の法則性を発見することが、主な狙いとなります。

アソシエーション分析は、さまざまな業界で運用されるフレームワークですが、バスケット分析の対象は、基本的に小売業界における消費者の購買行動です。前述した「オムツとビールの法則」のように、「トーストを買う消費者は牛乳も同時に購入する」などの相関関係を発掘し、売り場のレイアウトや在庫管理などに応用します。

クロス集計

「クロス集計」とは、アンケート調査を経て収集された回答データに対し、設問を掛け合わせて集計する分析手法です。

一例としては、「プロダクトAに対する満足度を回答してください」の設問に対し、「非常に満足している」「どちらでもない」「不満がある」など、複数の回答を用意します。そして、回答結果を性別や年代別で分類し、回答者の属性によって、反応の違いを集計することが基本的なプロセスです。その他の調査によって得られた集計結果を掛け合わせたり、回答者の属性を細分化したりすることで、より詳細かつ多角的なデータを得られるでしょう。

決定木分析

「決定木分析」は、頂点に据えたキーワードに対し、「もし~だったら」の仮説を立て、その回答をツリー状に分岐することにより、関連性を分析するフレームワークです。

例えば、商品Aを最も購入している顧客層は「男性」か「女性」か、「ブランド重視」か「コスパ重視」か、「既婚」か「未婚」などの要領で、頂点から質問と回答をツリー状に分岐していきます。関連性の発見や複雑な要因の視覚的な分析が可能であり、主にマーケティング分析や機械学習モデルによる、分類・予測の領域で運用されます。

クラスター分析

「クラスター分析」とは、異なる要素が混合している集団から、類似する要素をグルーピングする分析手法です。多数のデータ群から仮説をもとにして、関連性を解明する「多変量解析」の一種であり、特定の傾向に則ってグルーピングされたデータセットは「Cluster(集団)」と表現され、規則性や類似点などから相関関係を分析します。

例えば、BtoB企業の場合は事業内容や売上高などに基づいて、顧客企業をグルーピングし、BtoC企業の場合は見込み客となる消費者の年齢層や性別、年収などに分類し、対象の傾向やパターンなどを深く掘り下げることが、基本的なプロセスです。

ロジスティック回帰分析

「ロジスティック回帰分析」は多変量解析の一種で、「ある事象が発生する確率」を分析するフレームワークです。目的変数が0から1までの値からなる確率について、説明変数を取り入れた数式で表す分析手法であり、まだ判明していない結果を予測する、あるいは既知の結果を定量的に説明する際に運用されます。

例えば、「喫煙と飲酒の量に応じて、がんが発生する確率が高まる」との研究結果がありますが、その際に用いられた分析手法がロジスティック回帰分析です。マーケティングの領域では、見込み客が商品を購入する可能性や、サービス継続率の予測などの用途に用いられます。

ABC分析

「ABC分析」とは、複数の指標に「A・B・C」のランクを設定し、優先順位を定める分析手法です。「重点分析」とも呼ばれるフレームワークであり、「全体を構成する80%の成果は、20%の要素が生み出している」を提唱した、統計モデルの「パレートの法則」がベースとなっています。

ビジネスにおいて、ABC分析が運用される、主なシーンは在庫管理の領域です。売上高への貢献度に基づいて、商品をA・B・Cにグルーピングし、最も重要度の高いグループの商品を優先的に確保します。このプロセスによって、在庫管理の優先順位が明瞭になり、販売機会の損失による、売上高の減少を最小限に抑えられるでしょう。

グレイモデル

「グレイモデル」は、過去のデータに基づいて、明瞭なデータを白色に、不明なデータを黒色に分類し、どちらにも属さない曖昧なデータを灰色で表す分析手法です。分析対象となる要素を色で分類することが、グレイモデルの大きな特徴であり、データベースに収集・累積されたデータをもとに、曖昧な要素を灰色で表現することから「灰色理論」とも呼ばれます。

「セキュリティインシデント」「売掛債権の回収不能」「製品のリコール」など、他の分析手法と組み合わせて、事業領域に潜む曖昧かつ不確実性が高い要素を明らかにします。

因子分析

「因子分析」とは、多変量解析の一種であり、対象となるデータがもつ、変数に共通する因子を発掘する分析手法です。因子とは、特定の現象や関係性を構成する要素を表す概念であり、複数のデータの背後に隠れている因果関係や関連性をピックアップし、多変量データに潜む共通項目を探り出すことが、因子分析の狙いとなります。具体的なプロセスとしては、あるデータに対する共通因子による影響の度合いを計測した後、全体に与える影響を把握することで、変数の共通性をつかめます。

例えば、人気商品が「なぜ売れているのか」などの曖昧な要因を発掘できるため、顧客理解を深めるプロセスにおいて、有効となる分析手法です。

データ分析に役立つ2つのツール

データ分析を効率的かつ効果的に実践するためには、必要に応じて適切なツールを選定しなくてはなりません。データ分析の領域で役立つ代表的なソリューションとして、「Excel」と「BIツール」の2つが挙げられます。

Excel

「表計算ソフトの代名詞」と言えるExcelは、数値の集計やグラフの作成だけではなく、データ分析の領域においても、運用できる優れたソリューションです。「分析ツール」のアドインを導入することにより、「分散分析」や「基本統計量」「フーリエ解析」「移動平均」「乱数発生」「回帰分析」などの、さまざまなデータ分析に対応できます。統計学的分析や工学的分析などの領域でも、ある程度対応可能ですが、あまりにも大きなデータセットの分析には向いていません。比較的少量で同系統の形式をもつデータセットを、短期間で分析する際にふさわしい点が特徴です。

BIツール

BIツールは、前述したBI(ビジネスインテリジェンス)の実践を支援するITシステムを表します。特定のデータをグラフやチャート、ヒートマップ、図形、イラスト、散布図などに見える化し、俯瞰的かつ視覚的な分析を機能するソリューションです。前処理の工程で構造化されたデータは、基本的にデータウェアハウスに送出され、BIツールによってビジュアライゼーションされます。Excelでは実現できない高度なデータ分析が可能であり、ビッグデータ分析基盤を構築する上で欠かせない要素のひとつです。BIツールの代表的な製品としては、「Power BI」と「Tableau」の2つが挙げられます。

Power BI

Power BIは、米国のソフトウェア企業である「Microsoft社」が提供するBIツールです。従来、ビジネスインテリジェンスの工程は、高度な知見を備えるデータアナリストや、データサイエンティストの存在が不可欠でした。データ分析に関する専門知識を有していない人材でも、さまざまなデータをノンプログラミングでイメージ化できるソリューションです。また、Microsoft社の製品であるため、Excelとの連携が容易で、より効率的なデータ分析を進められる点も大きなメリットでしょう。

Tableau

Tableauは、米国に本社を置くソフトウェア企業の「Tableau Software」が提供するBIツールであり、専門的な知識をもたない人でも、データビジュアライゼーションを実践できるソリューションです。UIに優れるユーザーファーストであり、従来のBIツールのように、分析対象や分析視点を決定することなく、直感的なビジュアル分析ができます。データの準備から分析、探索、共有、コラボレーションまで、サイクル全体を一貫してサポートし、ロジカルなデータ分析を起点とする経営体制の構築に貢献します。

関連記事:https://yapp.li/magazine/1966/

データ分析の運用事例3つを紹介

以下より、データ分析を自社の経営体制に取り入れ、優れた成果を創出した企業事例を紹介します。

コマツ(株式会社 小松製作所)|事実に基づいたデータ分析

 

建設機械・鉱山機械のメーカーである「コマツ(株式会社 小松製作所)」は、事実に基づいたデータ分析を推進している企業であり、主に需要予測の領域において、さまざまな予測モデルを運用しています。代表的な分析手法として挙げられるものが、時間の変化に注目して、対象データの推移を予測・分析する「時系列分析」です。

時系列分析の定常時系列データを使用する「自己回帰モデル」と、2つ以上の変数との相関関係を数式化する「重回帰分析」を組み合わせて体系化し、販売・生産・在庫に関する情報を一元的に管理することで、精度の高い需要予測を実現しています。

日本航空株式会社|お客様に合ったレコメンデーション

航空運送事業を展開する「日本航空株式会社」では、Webサイトで行う航空券の効率的な販売が、重要な経営課題となっていました。オンライン上のチャネルで航空券を効率的に販売するためには、一人ひとりのユーザーに最適化されたコンテンツを提示する、レコメンデーションの仕組み化が欠かせません。

そこで同社が取り入れたものが、月間2億PVの膨大なトラフィックを誇る、Webサイトのログデータ分析です。Webサイトのログデータには、ユーザーの閲覧履歴が記録されており、行動履歴や購買情報などを多角的に分析することにより、潜在ニーズを捉えたレコメンデーションが叶いました。

東京ガス株式会社|ガス会社ならではのデータ分析

4大都市ガス事業者の一角である「東京ガス株式会社」は、さまざまな部署において、データ分析を戦略的に運用している企業です。例えば、マーケティング部門では「Product(製品)」「Price(価格)」「Place(流通)」「Promotion(販売促進)」の各要素を関連付ける、「4P分析」の運用を推進しています。

具体的には、アンケート調査を通じて、「価格を下げると売れるのか」「予算の範囲内でどの機能をつけたいのか」などの要素を明瞭化します。そして、商品全体の評価から構成要素の重要度を推定する、「コンジョイント分析」のフレームワークを組み合わせ、見込み客の潜在需要を捉えた製品ラインアップの選定を実現しました。

まとめ

データ分析とは、収集・累積されたデータ群から、必須の情報をピックアップ・分析し、経営判断や意思決定に役立てるプロセスです。企業の経営判断を加速させ、データを起点とするロジカルな意思決定が実現します。勘や経験などの曖昧な要素に依存しない、データドリブンな経営体制の確立を目指していきましょう。