ぺーぱーの日々

上機嫌でいること、夢中でいることを目標に、今日も色んなことに手を出します。

MENU

回帰分析を理解する

http://kogolab.chillout.jp/elearn/icecream/chap4/sec0.html

 

https://data.wingarc.com/regression-analysis-31489

 

やりたいこと

バイトの数を最適化したい。(アイスクリームの店長さん)

どうやってやるか

お客さんの数を予測する

・過去のデータを使って

 

散布図で把握する(大まかに)

思うこと

よくわからん(特定できてない)

改善策

最高気温がわかれば、客の数がすぐに計算できるような線を書けばよい

→回帰直線と呼ばれる

 

回帰直線を引く

内容

4つの点を通る良い感じの直線を書きたい

思うこと

どれだけうまく線を引いても、実際のデータとは乖離がある

→「残差」という。

→(自分のことばで)残差とは、予測した値と実際の値の差

→「残差」を利用。残差から回帰直線を引く

最小2乗法という方法を使う

残差の2乗の合計を計算して、それを最も小さくする直線を求める

 

どうやって最小2乗法は計算するのか

相関係数=偏差積の平均/(xの標準偏差*yの標準偏差

回帰直線の傾き=相関係数*((yの標準偏差)/(xの標準偏差))

y切片=yの平均-(傾き*xの平均)

 

Excelで計算

平均 31.95 321.1   偏差席の平均 142.255
標準偏差 2.871846 56.913   相対係数 0.870352
傾き 17.24826        
切片 -229.982        

 

導かれた結論

y = 17.25x -229.98

→最高気温が1度上がると、約17人お客さんが増える。

 

活用

たとえば、最高気温30度の時、288人の来店が見込まれる。

 

まとめ

回帰分析を理論的に理解できた・・気がする。プログラミングでコードを書くことと、書いている内容を理解していることは、必ずしも一致しない。(論理的に理解してなくても、正解にたどり着ける。)論理と手段実行。バランスよく自力を鍛えたい。