「統計学を学ぶと世界の見え方が変わる」――本書の著者、鈴木伸介さんの言葉です。たとえば、自分がビジネス書の企画を考えるときは、「今これが面白い!おそらく関心を持っている人も多いのではないか」というのが最初の出発点となります。ただ、この時点ではあくまで仮説(というよりも思いつき)だったりするため、類書を何冊か探して、その売れ行きを調べ、仮説を検証して、「おおむねこのジャンルの本は売れている」ということであれば、企画書を作って提案します。おそらくほかの業界であっても同じように商品・サービスの開発が行なわれているはずです。また、開発以外のセールス、マーケティング活動においても、さまざまな調査が行なわれ、データに基づいて意思決定がなされているでしょう。つまり、あらゆるビジネス活動はデータが起点になっています。さらに言うならば、データの読み方・使い方がビジネスの成否を分けるということでもあります。本書を通じて、1人でも多くのビジネスパーソンがデータ強者となって成功を収めていただけることを強く願います。
POSTED BY貝瀬
ビジネスは「統計学」を中心に動いている
今や、あらゆるビジネスがデータを中心に動いています。自社製品の売れ行き、顧客の関心・動向などの調査、広告効果の測定などのデータを活用できるか否かは、企業にとって重要な課題となってます。
そのため統計学やデータ分析の素養を身につけたいと思っているビジネスパーソンは多いことでしょう。
ただ、その一方で、グラフ、表データ、平均や割合の計算、複雑な数式・耳慣れない専門用語のせいで、学びの一歩を踏み出せずにいる人も多いはず。
「統計学、データサイエンスに興味はあるけれど、何だか難しそう……」
「仕事でデータ分析をするために統計学を学びたいのだが、どこから手をつければいいかわからない……」
「過去に何度か統計学を勉強してみたけれど、途中でわからなくなり挫折してしまった……」
このような方にこそ、本書をお読みいただきたいと思います。
本書は次のような方を対象としています。
・統計学やデータ分析に興味はあるけれど、これまで学ぶ機会がなかった方
・過去に何度か統計学を学ぼうとしたが、とにかく数字が苦手で、難しく感じて途中であきらめてしまった方
・仕事において、統計的な考え方やデータの読み解きが必要になった方(マーケター、セールスパーソンなど)
・経済学や社会学などを学ぶ学生(大学生・院生)で、調査結果をまとめる必要があり、統計の基礎を身につけたい方
ビジネスの現場で使える活きた統計学が学べる
現代のビジネスの現場では、多くの職種で統計学・データ分析の知識・スキルが求められています。たとえば……
・売上データを分析するセールス担当者
・広告の効果を測定するマーケティング担当者
・アンケート結果から顧客の嗜好を読み解く商品・サービス開発の担当者
・製造現場の歩留まりや品質データを管理する生産管理者
本書は、こうしたお仕事で統計学・データ分析をする必要があるが、「数字が苦手」「統計学は難しそう」と感じている方たち(特に文系ビジネスパーソン)に向けて、架空のスーパーマーケットとお菓子工場のストーリーをベースに、統計学の具体的な使い方をわかりやすく解説します。
□店舗ごとの売上高・来店客数の推移を比べるには?
□広告宣伝費と売上高の関連性を調べるには?
□顧客アンケート結果から購買傾向を分析するには?
□不良品の発生確率や品質のばらつきを調べるには?
数学が苦手な人でも統計検定3~4級レベルの知識が身につく
本書は「これまで統計学をまったく学んだことがない人」でも、最初の一歩からしっかりと学べます。統計学の基礎の基礎から、少し実践的な内容までを順を追って丁寧に解説しています。
数値を扱うため、どうしても計算が登場しますが、そのほとんどがいわゆる「四則演算」(足し算・引き算・掛け算・割り算)です。
後半に「不等号」や「ルート(平方根)」が出てきますが、それらについてもやさしく丁寧に説明しているので、数学が苦手な方でも無理なく読み進めていただけます。
本書で扱っているテーマは、統計検定の3~4級レベルの内容が中心ですが、難しい理論や証明は省いて、身近なデータを題材に、データをどう読み取り、どう使うかという点を重視して解説しています。
先述したように、スーパーマーケットとお菓子工場のストーリーをベースに解説するため、状況が頭に浮かびやすく、ストレスなく読み進めていただけます。
「ああ、こういうときに統計学が使えるのか」と思いながら理解を深めていただけるでしょう。
データが読めるようになると「世界の見え方」が変わる
統計学は、身につけると「世界の見え方」が変わる“面白い学問”です。たとえば、自分の部署の売上グラフを見たときに、単なる数字の羅列ではなく、次のようなことが読み取れるようになります。
「売れ筋商品には何か傾向があるな」
「季節の変化と関係がありそうだな」
あるいは、アンケートの結果を見たときにも、次のようなことが考えることができます。
「業界全体の傾向はこんな感じになっているのではないか?」
「顧客の年代ごとに好みの違いがあるのでは?」
本書では、そうした「気づき」や「納得」がたくさん生まれるように、図やグラフ、実例をふんだんに盛り込みました。また、難しい言葉や複雑な数式は、できるだけかみくだいて解説しています。
データが「読める」「わかる」「使える」という実感を、ぜひ皆さんに味わっていただきたいと思っています。
統計学は、「数学が得意な特別な人のためだけの学問」ではありません。
誰にとっても身近で、誰にとっても役立つ、「現代を生きる上での道具」です。
ぜひとも本書を通じて、統計学の楽しさを味わっていただけたらと思います。
気になる本書の内容
本書の内容は以下の通りです。【第1部 記述統計編】
第1章 スーパーマーケットの売上高や来店者数をグラフにする
――グラフ、平均変化率、移動平均、指数
1-01 商品カテゴリごとの売上データを棒グラフで表す
数字が並んでいるだけではわかりづらい
棒グラフで大きさを比較する
1-02 円グラフで各カテゴリの売上構成比率を見る
商品カテゴリの売上比率を見える化する
1-03 帯グラフで構成比率を比較する
C店にシニア層のお客様が多い理由は?
1-04 折れ線グラフで時系列の推移を視覚化する
日々の売上高の推移を見える化する
1-05 グラフのウソを見抜く
グラフはどこから始まっているのか?
1-06 時系列データと変化率で「流れ」を見る
10年間の売上高の推移を見える化する
各年の売上高の増減を変化率で表す
1-07 10年間の平均変化率(幾何平均)は?
「変化率の平均」はどのように計算すればよいのか?
1-08 移動平均で全体のトレンドを捉える
毎月の売上高の推移を折れ線グラフで分析する
移動平均で全体のトレンドを見る
1-09 指数を使って過去のある時点と比較する
本店とC店の売上高の推移を折れ線グラフで比較する
指数を使って時系列データの増減の度合いを比較する
第2章 お客様の買い物の傾向を捉える
――代表値(平均値・中央値・最頻値)、度数分布、ヒストグラム、箱ひげ図、分散、標準偏差
2-01 代表値(平均値・中央値・最頻値)とは?
平均値と中央値は何が違うのか?
中央値と最頻値
2-02 度数分布表とヒストグラムでデータ全体の特徴をつかむ
購入金額の度数分布表を作る
2-03 相対度数と累積相対度数
各階級の相対度数(度数の比率)を追加する
累積相対度数を表の右側に追加する
2-04 ヒストグラムを使って度数を見やすくする
ヒストグラムで度数の分布をわかりやすくする
ヒストグラムに平均値、中央値、最頻値を書き込む
2-05 箱ひげ図でデータの特徴を読み解く
箱ひげ図とは?
外れ値について
2-06 分布の様子を比較する
本店とC店の同じ日の売上データを比較する
2-07 ばらつきの大きさを数値化する(分散・標準偏差)
データのばらつきを調べると何がわかるのか?
分散と標準偏差でばらつきの度合いを数値化する
分散の計算方法
標準偏差の計算方法
第3章 広告と売上の相関関係を調べる
――散布図、相関関係、疑似相関、回帰分析、最小二乗法
3-01 散布図で2変数データを分析する
広告宣伝費は売上向上につながっているか?
散布図で広告宣伝費と売上高の関連性を調べる
3-02 「関係ありそうで実はない」擬似相関に注意しよう
相関関係はあっても因果関係はない疑似相関
3-03 散布図を比較しよう
複数のお店の散布図を比較する
3-04 負の相関と無相関とは?
一方が大きいともう一方が小さくなるケース
データ間に特に関係が見られないケース
3-05 相関係数で関係の強弱を数値化する
相関係数の性質を知ろう
負の相関と無相関
3-06 相関係数の計算方法
共分散と標準偏差を使って相関係数を計算する
共分散の符号はどう決まるか?
3-07 回帰分析で相関する数値を予測する
一方がわかれば、もう一方の数値を予測できる
最小二乗法
【第2部 推測統計編】
第4章 クッキーの不良品発生率とチョコレートの重さのばらつきを調べる
――二項分布、正規分布、標準正規分布、大数の法則、中心極限定理
4-01 不良品の個数を検査する
不良率2%なのに焦げたクッキーが100枚中5枚も発生!
4-02 不良品が0枚である確率は?
「良品率を100回掛ける」と考える
4-03 不良品が1枚である確率は?
不良率を1回、良品率を99回掛ける
4-04 不良品が2枚である確率は?
「2枚が不良品になる」パターンはいくつある?
「組み合わせ」の計算方法
4-05 「起こる/起こらない」を二項分布で表す
不良品の発生確率の分布を見える化する
4-06 不良率や検査数が変わると分布はどうなる?
不良率に応じて分布は変化する
検査の個数が変わるとどうなる?
4-07 統計の基本中の基本「正規分布」
正規分布とは?
正規分布の特徴
4-08 チョコレートの重さの正規分布
重さのばらつき具合を調べる
4-09 標準正規分布と標準化
すべての正規分布は標準正規分布に変換できる
正規分布を標準正規分布に変換する手順
4-10 標準正規分布表
身長174cmの40代男性は全体の何%か?
4-11 チョコレートの重さを正規分布で考える
31g、29gのときのz値を計算する
標準正規分布表を確認する
4-12 大数の法則と中心極限定理
試行の回数を増やすほど実際の平均値に近づく「大数の法則」
サンプル数を増やすほど正規分布に近づく「中心極限定理」
第5章 お客様の平均滞在時間を推測する
――全数調査、標本調査、統計量、母数、不偏分散、区間推定、信頼区間、t分布
5-01 全数調査と標本調査
30人の平均滞在時間はどこまで信用できるか?
5-02 推測統計とその方法
統計量と母数(パラメータ)について
推定と検定の違い
点推定とは?
サンプルサイズとサンプル数の違いに注意
推測に範囲を持たせる区間推定
5-03 区間推定の考え方
信頼区間と信頼係数
5-04 母平均の区間推定(①母分散がわかっている場合)
ひとまず「母分散がわかっている」と仮定する
サンプルサイズが大きくなるほど、ばらつきの度合いは小さくなる
標本平均を標準化する
5-05 母平均の区間推定(②母分散がわからず、サンプルサイズが十分に大きい場合)
サンプルサイズが大きければ正規分布が使える
標本分散を使って母平均の信頼区間を計算する
5-06 母平均の区間推定(③母分散がわからず、サンプルサイズが小さい場合)
サンプルサイズが小さいときはt分布を使う
t分布は自由度によって形状が変わる
t分布表の読み方
標本平均と不偏分散を計算する
5-07 ナッツの殻の混入率は?
母比率の区間推定
データの平均と分散を計算する
第6章 おにぎりが以前よりも小さくなった?
――仮説検定、帰無仮説、対立仮説、z検定、t検定、母比率の検定
6-01 仮説検定の考え方
おにぎりの平均重量は許容範囲内といえるか?
6-02 検定(仮説検定)の手順
帰無仮説と対立仮説
統計量を計算する
有意水準とは?
6-03 おにぎり50個の重さを検定する
サンプルサイズが十分に大きいのでz検定を使う
p値と有意水準を比較すると……
片側検定と両側検定
6-04 ポテトサラダの重さをt検定で調べる
サンプルサイズが小さいときはt検定を使う
t値を計算する
t分布表を確認する
6-05 アンケートの結果を検証する
顧客満足度は本当に下がったのか?
母比率の検定
第7章 売り場が変わると売れ行きも変わる?
――適合度検定、カイ二乗検定、クロス集計、独立性の検定
7-01 売り場によって売れ行きが変わる?
実際の分布と理論上の分布は一致するか?
ズレの大きさを表すカイ二乗値
7-02 カイ二乗分布
カイ二乗分布のグラフ
カイ二乗分布表
7-03 年代ごとに買う商品に違いはある?
アンケート結果をクロス集計表にまとめる
7-04 年代と購入カテゴリに関連があるかを調べる
独立性の検定
期待度数を計算する
著者について
-
株式会社数学アカデミー代表取締役
View More
早稲田大学理工学部応用物理学科卒業。
大学受験2浪目時代に自ら学ぶことの楽しさを知り、大学卒業後に教育の道に進む。数学個別指導講師として担当した生徒数は、マンツーマンだけで400 名を超える。現在は医学部を中心とした数字受験指導だけに留まらず、社会人向けに数学の楽しさや価値を伝える活動にも尽力。苦手な数学を克服したい大人や、昔好きだった数学をもう一度学び直したい大人に対し、楽しみながら学ぶ数学を提唱。数学を通して培われる力をビジネスに活かすためのセミナーも多数開催している。著書に『AI時代に差がつく 仕事に役立つ数学』(小学館新書)、『もう一度解いてみる 入試数学』(すばる舎)など。











