2変数に相関関係がみられるとき、散布図の点の散らばりの傾向性を示すような直線を、スパッと引きたくなるのが心情です。いま散布図の中に、点の集まりの中をうまく通るような右上がりの直線を引いていますが、これを「回帰直線」といいます。
全部のデータが直線の上に乗っていない限り、どれだけうまく直線を引いたとしても、直線と実際のデータは少しずれます。直線のy軸の値と、散布図の全ての点のy軸の値の「ずれ」の二乗の総和が最小になるよう、計算によって求めた直線が回帰直線です。もう少し急な角度の直線を引けば、直線のy軸の値は神奈川や京都に近づきますが、大阪や愛知など直線のy軸の値と離れてしまう県もでてきます。
この直線は、一次方程式(y=ax+b)の形で表現することができ、4円貸台数割合yと県民賃金xの関係は、次のように表せます。
y=0.1714x+6.8436
この式を「回帰式」と呼びます。
回帰式は何の役に立つのか?
これが何の役に立つのかというと、代表的な用途は次の2つで、このような分析を「回帰分析」と言います。
(1)例えば、宣伝費(x)と売上高(y)の関係がわかっていた場合、目標とする売上高に対して宣伝費を決定することができます。……制御
(2)例えば、人口(x)と商店数(y)の関係が分かっていれば、ある市の人口からその市の商店数を予測することができます。……予測
県民平均賃金(x)と4円貸台数割合(y)の場合でいうと、一方の数値がわかった場合、他方の数値を予測することができます。
もし回帰直線、回帰式がなく、「全国のパチンコ設置台数に占める4円貸の台数割合の割合は56・2%」というデータしかなかったら、どの県であろうと4円貸台数の割合は「56・2%」と予測するのが最も自然です。ところが、これでは実際との誤差が大きいのです。
神奈川の実際の4円貸台数割合は67・4%なので、全国平均との誤差は11・2ポイント。先述の回帰式があり、神奈川の県民賃金が33万6千円とわかると、4円貸台数割合は64・7%と予測でき、誤差はわずか3ポイントです。愛知の実際の4円貸台数割合は59・2%なので、全国平均との誤差は3ポイント。回帰分析による予測値は60・4%で、誤差はわずか1・2ポイントです。
回帰式による予測が有効なのは、今回のように2変数(この場合は県民賃金と4円貸台数割合)に相関がある場合です。相関がない散布図にも、計算によって回帰直線を引くことはできますが、予測に用いることはできません。
p.s.
シンプルながら、けっこうパワフルだと思いませんか? 企業内、店内には、まだまだ活用されてい居ないさまざまなデータが眠っているかもしれませんね。
どのデータを使って、何をするのか? それを考えることがマーケティング部門に求められていることなんじゃないかと思います。
〔記事=田中 剛/アミューズメントジャパン 編集部〕
0 件のコメント:
コメントを投稿