統計学を勉強していくと必ずつまづく質的変数と量的変数。

どっちがどっちか分からない!
そもそもなんで判別する必要があるのか分からない!
そんなことで悩んだことはありませんか?

私も最初、統計学を学んでいるとき、なんで質的変数と量的変数に分かれているんだろう?と考えていました。
統計学において、質的変数と量的変数の違いは重要です。
今回は、現役でデータサイエンスを学んでいる学生のしょーが「質的変数と量的変数の違い」から付随する尺度に関しての知識まで網羅的に解説していきます。
本記事の信頼性

こんな悩みがある方読んで欲しい
- 統計学における変数ってなに?
- 質的変数と量的変数ってなに?
- 尺度ってなんなの?
本記事を読むことで統計学における変数についての理解が段違いになり、今後の統計学の勉強が頭にスッと入ってきますよ!
統計学について知りたい方は以下の記事もおすすめです!

それでは本編です!
質的変数と量的変数の違いとは?
質的変数と量的変数の違いについて説明する前に・・・
「変数とは何か」について軽くおさらいしておきましょう!
変数は統計やプログラミングにおいて最も重要な概念です。
図を用いて分かりやすく説明していきます!
変数は、
- データを入れるための箱
- 入れるデータ
の2つで構成されます。
以下では、職業の例を用いて説明していきます。

職業という変数は、職業という名称の箱に職業名であるデータが入っているものです。
- 箱:職業という名称
- データ:弁護士や医師などの職業名
職業名は職業という変数に格納されていると表現できます。

格納されている......?
図解を見てください。
職業名が多くあるデータの円から、職業という箱に向けて矢印が向けられていますよね。
このように、データを職業という変数に入れることを格納すると表します。

質的変数と量的変数の違いについて触れていきましょう。
統計で扱うデータは大きく2つの変数に分けられます。量的変数と質的変数です。
2つの違いは文字を扱うか数値を扱うかにあります。
質的変数:カテゴリや属性の変数
質的変数は、文字を扱う変数です。
カテゴリー変数とも呼ばれ、カテゴリや属性のデータを格納できる変数になります。
カテゴリや属性
データが持つ特性・特徴のこと
例:性別(人の属性)、職業(カテゴリ)
質的変数は、文字を扱えますが数値を扱うことはできません。
具体例を挙げて説明していきます。。
性別・職業
性別や職業は人の属性のことで、質的変数です。
性別という変数に男や女などの性別分類が格納されています。
次は間違いやすい例です。
評価

え?数値で評価することもあるよね?
評価も質的変数です。
5段階評価では、5,4,3,2,1と数値を使っています。
ですが、5と4の差を何らかの数値で説明することはできません。
評価はあくまで大小関係を数値で表現しているのです。
学校の成績評価を例に考えていきましょう。
- 成績が5の人と4の人との差
- 成績が4の人と3の人との差
この2つの差は数値で表せますか?

5 - 4 = 1で、4 - 3 = 1だから、どちらも1?
この時、比較対象は「人」です。

5の人と4の人との差、4の人と3の人の差は違いますよね?

なんで?
人の差は数値で表せないからです。
授業の積極性が違う!や、点数が違う!などさまざまな要因から人の評価(大小関係)は決定されます。
質的変数はさらに、名義尺度と順序尺度の2つの分類に分かれます。
今説明すると頭が混乱するので、次は量的変数について学びましょう。

質的変数の尺度について知りたいよ!という方はこちらのリンクをクリックすると飛べます!
量的変数:数値の変数
量的変数は、数値を扱う変数です。
質的変数は文字を扱うのに対して、量的変数は数値を扱えます。

例を見ていきましょう
温度
温度は量的変数です。
0℃や15℃など数値で表せることからも分かりますね。
身長・体重
身長や体重は数値で表されますよね。
160cmや50kgなど数値で表現できれば良いのです。
基本的に、数値で表せるデータは量的変数と覚えてください。
評価の例は例外ケースです。
量的変数も、間隔尺度と比例尺度の2つの尺度に分解できます。

もう量的変数の尺度について知りたいよ!という方はこちら
それぞれの尺度について学んでいきましょう!
質的変数の尺度

質的変数は名義尺度と順序尺度に分解できます。
質的変数の例で紹介したものだと、
- 性別や職業:名義尺度
- 評価:順序尺度
に分けられます。
名義尺度:カテゴリ
名義尺度はカテゴリなどの質的変数です。
多くの日常的な場面で名義尺度は使われています。
血液型を例に見ていきましょう。
血液型:A型・B型・AB型・O型
血液型はこのように並べてカテゴリとして見れますね。カテゴリ別で分けられるものは名義尺度です。
職業や性別、学部が名義尺度にあたります。
すべてが並列に扱われる変数が名義尺度です。

カテゴリになりそうな質的変数は名義尺度だと覚えましょう!
順序尺度:順番
順序尺度は順序がある質的変数です。
世の中の順序は順序尺度でつけられているケースが多くあります。
別の例を挙げてもう一度確認しましょう。
例題
以下の質問に答えてください。
質問:
あなたは勉強が好きだ
回答:
よくあてはまる
すこしあてはまる
どちらとも言えない
あまりあてはまらない
あてはまらない
このようなアンケートの回答は順序尺度です。
以下のような図を思い浮かべてください。

よくあてはまる〜あてはまらないにかけて、図のように順序をつけることができます。
順序をつけられ、大小関係を表す質的変数は順序尺度だと覚えましょう!

名義尺度と順序尺度の違い、判断方法についておさらいしていきます!
名義尺度と順序尺度の違いと判断方法
名義尺度と順序尺度の違いは順序があるかないかです。
名義尺度はカテゴリというものでふわっとした定義であるため、順序尺度であるかないかで判断していきます。
もう一度図でおさらいしていきましょう。

名義尺度はカテゴリなどで並列に扱えるのに対し、順序尺度は大小関係があります。
- 順序尺度:評価などの順序があるもの
- 名義尺度:それ以外の質的変数
と考えましょう。
量的変数の尺度

量的変数は間隔尺度と比例尺度に分解されます。
量的変数で紹介した例だと
- 温度:間隔尺度
- 身長・体重:比例尺度
と分けられます。
間隔尺度:間隔が意味を持つ変数
間隔尺度とは間隔が意味を持つ変数です。
例を用いて説明していきます。
質問
「0」という数字にどんなイメージがありますか?

「0」?
「ない」を表す数字のイメージがあるなぁ
あなたの言う通り、「0」は「ない」を表すイメージが浸透しています。
ですが、間隔尺度では「0」は「間隔を構成する一部分」であり、「ない」という意味ではありません。
間隔尺度である温度を例に理解していきましょう!
質問
「0℃」と聞いてどうイメージしますか?

寒い......かな
℃という単位がついただけで「0」が「ない」という意味じゃなくなりましたね。
間隔尺度では「0」は「間隔の一部」となります。図で表してみましょう。

図のように、-1℃と「0」℃、1℃は間隔が一定です。
0に意味があり間隔が重要視される量的変数は間隔尺度と覚えましょう!
更に理解するために次の質問です。
質問
気温が10℃から20℃に上がりました。
このとき、なんと言いますか?

うーんと、10℃も上がった!かな?
数字だけ見ると2倍と言えるのに、「10℃上がった」と間隔を指摘しますよね?
『~倍』と言わないことも間隔尺度の特徴になります。
他にも、時刻が間隔尺度として挙げられます。
比例尺度:0が原点の変数
比例尺度は、0が原点の変数で、比率で表せる変数です。
比例尺度(比尺度)は、身長を例に挙げて説明していきます!
0が原点であることがポイントです。
質問
身長「0」cmの人はいますか?

いないに決まってるじゃん!
0cmはもういないのと同じだよ.....
間隔尺度は「0」は間隔としての意味がありました。
比例尺度では「0」は「ない」という意味になります。
「0」が「ない」というイメージになっていたのは、比例尺度に普段から触れていたからです。

数直線では、「0」が原点として表されます。
「0」が「ない」という意味で使われ、原点(起点)として扱われるとき、比例尺度と分類できます。
さらに比例尺度の特徴をつかみましょう。
質問
身長1mの人と2mの人がいました。
どう表しますか?

え、そんな状況ありえないけど......
2倍の身長差がある!かな
2「倍」と表しましたね?
~「倍」と表せるのが比例尺度の特徴です。
図に表してみましょう。

0を原点として2倍の関係にあると表せます。0が原点だからこそ比率で表せます。
他にも、
- 時間(例:勉強時間)
- お金
- 体重
などが比例尺度に分類されます。
比例尺度は
- 0が原点
- 比率で表せる
と覚えましょう。
間隔尺度と比例尺度の違いと判断方法
間隔尺度と比例尺度の違いは、「0」にあります。
「0」で判断するのがもっとも分かりやすいでしょう。
図でおさらいしていきます!

間隔尺度は間隔に意味がある変数であるのに対し、比例尺度は0が原点で比率で表せる変数です。
- 間隔尺度:「0」は間隔の一部
- 比例尺度:「0」は原点の役割
と覚えましょう!
質的変数は文字、量的変数は数値
質的変数と量的変数の違いは「文字か数値か」です。
と頭に叩きこみましょう!
質的変数と量的変数では、描けるグラフが変わってきます。尺度に関しては覚えられなくても、質的変数と量的変数の違いについては絶対に抑えましょう。
質的変数は2つの尺度に分けられましたね。
量的変数も同様に2つの尺度がありました。
「もう一度出されるとよく分からない部分がある!」
という方は、リンクから繰り返し復習しましょう。

日常はいろいろな変数、尺度で溢れています。
身近なところから意識するだけで定着度が変わりますよ!

今日、身体測定なんだぁ!

身長と体重は比例尺度
視力は順序尺度ですね!