http://kogolab.chillout.jp/elearn/icecream/chap4/sec0.html
https://data.wingarc.com/regression-analysis-31489
やりたいこと
バイトの数を最適化したい。(アイスクリームの店長さん)
どうやってやるか
お客さんの数を予測する
・過去のデータを使って
散布図で把握する(大まかに)
思うこと
よくわからん(特定できてない)
改善策
最高気温がわかれば、客の数がすぐに計算できるような線を書けばよい
→回帰直線と呼ばれる
回帰直線を引く
内容
4つの点を通る良い感じの直線を書きたい
思うこと
どれだけうまく線を引いても、実際のデータとは乖離がある
→「残差」という。
→(自分のことばで)残差とは、予測した値と実際の値の差
→「残差」を利用。残差から回帰直線を引く
→最小2乗法という方法を使う
→残差の2乗の合計を計算して、それを最も小さくする直線を求める
どうやって最小2乗法は計算するのか
回帰直線の傾き=相関係数*((yの標準偏差)/(xの標準偏差))
y切片=yの平均-(傾き*xの平均)
Excelで計算
平均 | 31.95 | 321.1 | 偏差席の平均 | 142.255 | |
標準偏差 | 2.871846 | 56.913 | 相対係数 | 0.870352 | |
傾き | 17.24826 | ||||
切片 | -229.982 |
導かれた結論
y = 17.25x -229.98
→最高気温が1度上がると、約17人お客さんが増える。
活用
たとえば、最高気温30度の時、288人の来店が見込まれる。
まとめ
回帰分析を理論的に理解できた・・気がする。プログラミングでコードを書くことと、書いている内容を理解していることは、必ずしも一致しない。(論理的に理解してなくても、正解にたどり着ける。)論理と手段実行。バランスよく自力を鍛えたい。