広告 データサイエンス力を鍛える

統計学とは?概観から2つの種類・学び方を5分で分かりやすく解説

統計学とはのアイキャッチ画像

この記事で解決できる悩み

  • 統計学って何だか分からない
  • 記述統計と推測統計ってなんなの?
  • 統計学ってどうやって学んでいくの?

最近、データサイエンスやAIが流行りになっています。ですが、データサイエンスってなんだ?って思う方も多くいることも確かです。

データサイエンスの基礎は統計学であることを皆さん知っていましたか?

今回はデータサイエンスの基礎でもある『統計学』について詳しく解説していきます!

統計学の概観をつかみ、統計学を学びましょう!

本記事の信頼性

サルでもわかるデータサイエンスの運営者のプロフィール画像
しょー

それでは本編です

統計学とは?

統計学はデータを専門とする学問です。

スマートフォンやPCの普及により、世の中にはデータが溢れかえりました

溢れたデータを正しく扱えるようにする学問が統計学なのです。

しょー

皆さんの身近なところでも
多く使用されていますよ!

以下で例を挙げて説明していきます!

統計学の身近な例は?

皆さんの身近な例を挙げて統計学について説明します。

学校のテスト返しが代表的な統計学の使用例です。

学校のテストで平均点が発表されていましたよね。平均も統計学のデータの指標の1つです。

サル

でも統計学ってもっと難しいんでしょ?

統計学の基礎は難しい数学の知識は必要ありません数学が嫌いでも統計学を学べます。

データの特徴をつかむために、統計学では

  • 平均値
  • 中央値
  • 分散

などのデータの概観を掴むうえでの代表値を習います。

しょー

身近な統計として国勢調査があります

政府が5年に1回実施している国勢調査は、統計学を使うためのデータを集めています。

5年に一度、すべての家庭に調査依頼が届いていますが、皆さんの回答したデータが統計学に使われているのです。

しょー

実際に調べてみましょう

インターネットで「国勢調査の結果」と調べてみてください。

煩わしい!という方は、(https://www.stat.go.jp/data/kokusei/2020/index.html)をクリックしてください!

国勢調査の結果と調べた時の検索画面のスクリーンショット

総務省統計局というものが出てきましたよね?

総務省に統計局が設置されていることから分かるように
統計学は国に部署が作られるほど重要です。

少しページの使い方を説明しておきます!

リンクをクリックすると以下のようなページに飛びます。

総務省統計局ホームページのスクリーンショット画像

令和2年国勢調査のところの調査の結果をクリックしてください(https://www.stat.go.jp/data/kokusei/2020/kekka.html)

総務省統計局の令和2年度国勢調査の結果のページのスクリーンショット画像

このページまで来たら、もういろいろな統計データを見れます!

基本統計>人口等基本集計>結果の要約を見てみましょう。

すべてが統計学によって作られたグラフです。政府で集めたデータは統計学を用いて分析され、国民に公開されています。

しょー

ここからは統計学の2つの分野について話していきます。

記述統計と推測統計の違い|統計学の2つの分野

記述統計と推測統計についての図解画像

統計学は大きく2つの分野に分けられます。

  • 記述統計:データの特徴をつかむ分野
  • 推測統計:一部のデータから全体を推測する分野

新しい用語が出てきて混乱するかと思いますが
以下で分かりやすく例を挙げて説明していきますので安心してください。

2つの分野について理解するとしないでは、統計学全体の理解度は大きく変わります。

記述統計

記述統計学はデータの特徴をつかむ統計学の分野です。

データ分析を始めるには、どのようなデータなのかを理解しないといけません。

具体例を挙げて説明します。

例題

あなたには高校の学生の身長データが渡されたとします。
そして、校長先生から何か分析してねー!
と言われました。

あなたはどうしますか?

サル

どうしたら分かりません!

記述統計学を学べば、どう行動すればいいかが明確に分かります。

1つの解答例を示しましょう。

解答例

平均値、中央値、分散などを出すことで基本的な概観をつかみます。
そして、グラフにすることで校長先生に見せる資料を作ります。

サル

え、そんなことでいいの?

3つの指標を出しただけでもある程度の概観は掴めます。

  • 平均値:平均身長の把握
  • 中央値:真ん中の身長の値の把握
  • 分散:高校生の身長のばらつきや差の把握

たった3つの指標で、平均からどんな分布なのかまで知れました。

記述統計は皆さんも馴染みのある部分が多いので、記述統計から勉強しましょう

ですが業務にも活かしたい!という人は推測統計も勉強することをおすすめします

一部から全体を推測する推測統計の便利さについて解説していきます!

推測統計

推測統計学とは、一部のデータから求めたい全体のデータを推測する統計学です。

記述統計学はデータの特徴をつかむ分野でしたね。

ですが、実際求めたいすべてのデータを手に入れることは不可能に近く、ビジネスで利用するデータは一部のデータであり、一部から全体を推測する必要があります。

全体のデータは集められないけど、一部のデータなら集められそうな場合、推測統計学はとても重宝されるのです。

サル

めちゃくちゃ大事なんだね

推測統計は記述統計ほど皆さんに馴染みがある分野ではありません。

しかし、現実でよく使われているのは推測統計です。

テレビの視聴率が正しいのかと疑問に思ったことはありませんか?

サル

あるある!
だって、僕のところに電話かかってきたことないもん!

テレビの視聴率は、統計学を用いて比較的正しい結果になるだろうという仮定の下で算出されています

推測統計を学べば多くの人より違った視点から物事を観察できますよ

推測統計のイメージをさらにつかむために推測統計で扱う2つの概念について説明していきます!

推定と検定

推測統計には推定と検定という2つの概念があります。

推測統計は勉強する領域が広いので、2つの概念をしっかり区別して理解しましょう。

混同することのないように説明していきます。

  • 推定:全体のデータがどんな分布をしているのか確認する
  • 検定:全体のデータであり得そうな仮説を立てて本当にそうかを検証する

それぞれについて分かりやすく説明していきます。

推定:一部から全体のデータの特徴を把握

推定は、一部から知りたい全体のデータの特徴を把握するものです!

サル

データの特徴を把握するって記述統計みたいだね!

データの概観を知るという点では記述統計と似ています。

推定は手元にあるデータから知りたい全体のデータの特徴を把握しようとする点で違います!

全体の平均値を出す例を挙げてみましょう。

例題

あなたは靴屋さんです。
来月の仕入れに向けて店舗で大人の足のサイズについてアンケート調査を行いデータを集めました。

このとき、あなたの手元には店舗に来た人の足のサイズのデータがありますよね。

手元にあるデータでは、足の平均サイズは、25cmだと判明したとします。

推定を用いることで、来月は25cmを多く仕入れることや22cm〜27cmぐらいを幅広く仕入れたらどれかのサイズがほぼ確実に来月も売れるという見通しを立てられるのです。

このように、手元にあるデータから全体の傾向をつかむことで、在庫予測などにも使えます。

検定:全体のデータに対して仮説を立て検証

検定は、全体のデータに対して仮設を立てて、正しいかを検証するものです。

工場の不良品の割合を調べて、機械が何か故障してるかもしれないなどの故障検知で使われます。

コイントスを例に考えてみましょう。

例題

表が出たら私の勝ち、裏が出たらあなたの勝ち
という条件で、5番勝負をしましょう。

私が勝ったらあなたは記事を最後まで見てください。

この勝負の結果が以下の通りだったとします

コイントスの結果を画像にしたもの
サル

ちょっと待った〜!
表が5回も出るわけないじゃん!
おかしいよ!

しょー

おかしいってどうやって証明するんですか?

サル

それは......

この状況を打開できるのが検定です。

しょー

コインの表が出る確率はいくつですか?

サル

コインは表と裏だから.......\(\frac{1}{2}\)

5回すべてで表が出ているので、\(\frac{1}{2}\)の確率を5回引き当てていることになります。

図で示すと以下のようになりますね

確率の計算を図解した画像

よって計算式では、

$$\frac{1}{2}\times\frac{1}{2}\times\frac{1}{2}\times\frac{1}{2}\times\frac{1}{2}=\frac{1}{32}=0.03125$$

となり、確率はおおよそ3%であると判断できます。

このように検定を使うことで、私が細工しているかもと見破れるのです。

しょー

具体的な勉強方法について説明します。

統計学の学び方

統計学は学ぶ順番を意識して学べば力になりますし、仕事でも活用できます!

統計学の学び方は大きく2つです。

  • 書籍で勉強する
  • ブログで学ぶ

書籍で勉強する

ネット社会になりいろいろな学び方がありますが、本はまだまだ優秀です。

手元に一冊持っておくとすぐに復習できますし、信頼性もあります。

以下では、2つの書籍を参考書籍として紹介します。

新版|確率統計:岡本和夫著

著者岡本和夫
発売日2021年3月20日
ページ数136ページ

確率とは......?という部分から統計の基礎的な部分を抑えてくれている良書です。

確率は統計を分かりやすく理解するうえで必要な概念のため、きっちり勉強しておきましょう。

確率について不安な箇所がある方にはこの書籍がおすすめです

楽天ブックス
¥1,980 (2024/01/07 02:54時点 | 楽天市場調べ)

統計の基礎をすべて把握するためには以下の書籍を購入することをおすすめします。

統計学入門:東京大学教養学部統計学教室著

著者東京大学教養学部統計教室
発売日1991年7月9日
ページ数328ページ

統計学入門は分かりやすさに定評があるロングセラー書籍です。

日常的な例を含めて、体系的かつ分かりやすく、統計のことを理解できます。

統計学入門となっていますが、多くの単元をカバーしており、
これ一冊持っておけば、統計の基礎は確実に身につくでしょう。

一冊の本だけで勉強したい!という方はこの書籍を買うことをおすすめします。

楽天ブックス
¥3,080 (2024/01/06 22:12時点 | 楽天市場調べ)
  • 新版|確率統計:確率もしっかりと勉強しておきたい人
  • 統計学入門:確率は理解していて、統計学だけ抑えたい人

ブログで学ぶ

皆さんが悩みを検索して出てきている記事の大半はブログです

ブログやネットは痒いところに手が届きます。

普段から分からないところを検索する癖をつけましょう!

まとめ

統計は、データサイエンスの基礎です!

統計を身につければ、データサイエンティストへの道も見えてきます。

以下の記事ではデータサイエンスとは何か?について紹介しています。

AIって何なんだろう?

データサイエンスって何だろう?

データサイエンスは、データの溢れた現代では必須の知識です。

データサイエンス』についてご興味のある方はこちらの記事をご参照ください。

しょー

統計学を学んで、人生を良きものにしましょう!

ブログランキング・にほんブログ村へ
人気ブログランキングでフォロー
サルでもわかるデータサイエンスのブログアイキャッチ画像
運営者の画像

しょー

地方公立大学でデータサイエンスについて学んでいる大学3年生のしょーです。

これまで、大学で学んできたこと、個人的に調べてきた情報を、「大学の先輩」的なポジションから大学生をサポートしたいと考えております。

何か分からないことがあれば、X(Twitter)のDMやブログ内のお問い合わせにてご相談ください。

また、記事作成依頼やサービスの体験依頼も承っております。 お気軽にご相談ください。

-データサイエンス力を鍛える
-, ,