
대체모형(alternative model) 식 ** 29분 20초
=> 대체모형을 사용하는 이유??
회귀계수 베타0, 베타1을 구할때 미분하는 이유??
최소제곱법을 Sxx Sxy로 간단한 표현으로 나타냄 39분 55초
여기서 Sxx와 Sxy가 나타내는 것이 무엇인지 체크
산점도 위에 회귀직선을 긋는 방법
pch옵션은 point character로 점의 모양
abline함수는 절편과 기울기가 있는 직선
abline의 매개변수로 회귀모형을 적으면 회귀선을 그어줌
identify함수: 그래프를 클릭하면 몇번 점을 클릭한건지 알려줌. -> 종료하려면 마우스 우클릭 해서 상태를 종료할 수 있음
# 회귀모형 구하기
market_lm = lm(Y ~ X, data=market)
summary(market_lm)
# 산점도와 회귀선 그리기
plot(market$X, market$Y, xlab="인테리어비", ylab="총판매액", pch=19)
title("인테리어비와 판매액의 산점도")
abline(market_lm)
identify(market$X, market$Y)
잔차들의 Xi에 대한 가중합이 0이고
잔차들의 Yi햇에 대한 가중합이 0임
=> X와 e(오차)가 수직이기 때문이라함..
=> 48분 15초를 보고 이유를 정리하기
SST=SSR+SSE
1시간 3분쯤..
분산분석표에서 자유도, 제곱합, 평균제곱, F를 알수있음
평균제곱=제곱합/자유도
F=MSR/MSE
자유도가 뭔지 찾아보기**
회귀계수(기울기)가 0이 아니면 그 변수는 유용하다.
따라서 귀무가설을 기울기가 0이다
대립가설을 기울기가 0이 아니다로 해서
F를 계산해서 귀무가설을 기각하고 대립가설을 채택할건지 봐야됨
=> F(1, n-2; 알파) 가 F0보다 작으면 귀무가설 기각.
R스퀘어(=결정계수) = SSR/SST = 1-SSE/SST
R스퀘어가 회귀직선이 얼마나 설명을 잘하는지 설명력임
R스퀘어는 0~1 사이의 값이고 1에 가까울수록 설명력이 높은 좋은 회귀선이다.
SSR을 Sxx와 Sxy로 나타내는데 이 식을 어떻게 나타낸 것인지 과정 정리하기 1시간 8분 36초
분산분석표에 의한 F검정
R에서는 F0 검정통계량에 따른 p-value가 주어짐
유의수준 알파보다 작으면 귀무가설을 기각하게 되는데
보통 유의수준 알파는 0.05로 지정한다.
※ market_lm = lm(Y ~ X, data=market)
summary(market_lm)했을 때 나오는 Residual standard error는
anova(market_lm)했을 때 나오는 분산분석표 mean squared error에 root를 씌운 것임
** 단순선형회귀에선 상관계수와 결정계수에 특별한 관계가 있다. 1시간 15분 15초
학습개요
두 변수 사이에 선형관계가 있으면 두 변수 간에 직선방정식을 만들어 하나의 변수가 변하는 값을 보고 다른 변수의 값을 추정하는 방정식을 만들 수 있다. 이렇게 한 변수로부터 다른 변수의 값을 직선방정식을 구하여 추정하거나 예측하는 방법을 단순회귀분석이라 한다. 이 장에서는 단순회귀모형을 설명하고, 최소제곱법에 의하여 단순회귀모형을 적합 시키는 방법을 설명한다. 회귀직선이 어느 정도 유의한가를 검정하는 분산분석과 결정계수에 대하여 알아본다.
학습목표
- 단순회귀모형을 이해한다.
- 최소제곱법을 이용하여 모수를 추정하는 방법을 안다.
- 잔차의 성질을 안다.
- 분석분석표를 이해한다.
- R을 이용하여 회귀분석하는 방법을 안다.
'대학교' 카테고리의 다른 글
[다변량분석/메모] 4강. 인자분석 (1) (1) | 2024.03.26 |
---|---|
[다변량분석/메모] 3강. 제2장 주성분 분석 (1) | 2024.03.26 |
[데이터마이닝/메모] 3강. 회귀모형 II (0) | 2024.03.16 |
[데이터마이닝/메모] 2강. 회귀모형 I (4) | 2024.03.16 |
[데이터마이닝/메모] 1강. 데이터마이닝 (0) | 2024.03.13 |