
** R 실습
R로 2강에서 배운 회귀모형과 선형회귀모형을 코딩해본다.
선형회귀모형 함수 lm
lm: linear model 약자
8분 28초
로지스틱회귀모형 함수 glm
glm: generalized linear model 약자
family = binomial으로 지정해서 로지스틱회귀를 사용
family 옵션을 변경해서 로지스틱회귀모형이 아닌 다른 모형으로도 쓸 수 있음(목표변수의 분포를 변화시킴)
step 함수: 변수 선택(전진, 후진, 단계적 선택방법)
step(object, direction=c("both", "backword", "forward"))
Object에는 회귀모형(lm, glm 등에서 생성한) 객체
predict 함수: 적합된 모델에 새로운 데이터가 주어졌을때 y값을 예측
회귀모형일 경우 type=response 옵션 지정
==== R 실습 20:15~
실습을 보며 R에서의 모델을 만들고 예측하는 과정의 흐름을 파악하였음
데이터는 1강에서 전처리한 것을 저장해서 사용
학습개요
회귀분석은 변수들 사이에 함수적 관계를 조사하는 통계적 방법이다. 그 관계는 목표변수와 입력변수들을 연결하는 방정식 또는 모형의 형태로 표현된다. 목표변수가 연속형인 경우에 선형회귀모형, 이항형인 경우에 로지스틱회귀모형을 이용하게 되는데 이는 결과적으로 각각 예측의 문제와 분류의 문제로 귀결된다. 본 강에서는 예측과 분류의 문제에 관해 R을 이용하여 실제데이터를 분석하면서 방법론을 정리해 보도록 한다.
학습목표
- R을 이용하여 선형회귀모형을 적합할 수 있다.
- R을 이용하여 로지스틱회귀모형을 이해하고 적합할 수 있다.
- 회귀모형에 활용되는 R 함수를 이해할 수 있다.
주요용어
- lm : 선형모형을 적합하기 위해 사용되는 R 함수
- glm : 일반화선형모형을 적합하기 위해 사용되는 R 함수
- step : AIC를 이용한 모형 선택을 위해 사용되는 R 함수
- predict : 다양한 모형 적합 결과로부터 예측 값을 계산할 때 사용되는 R 함수
정리하기
- R에서 lm은 선형모형을 적합하기 위해 사용되는 함수이고 glm은 일반화선형모형을 적합하기 위해 사용되는 함수이다.
- AIC를 이용한 모형 선택을 위해 사용되는 R 함수로는 step 함수가 있으며 옵션에 따라 후진소거법, 전진선택법, 단계적선택법 등을 수행할 수 있다.
- 회귀모형에서 다양한 모형 적합 결과로부터 예측 값을 계산할 때 사용되는 R 함수는 predict이다.
'대학교' 카테고리의 다른 글
[다변량분석/메모] 3강. 제2장 주성분 분석 (1) | 2024.03.26 |
---|---|
[회귀모형/메모] 1강. 단순회귀모형(1) (0) | 2024.03.24 |
[데이터마이닝/메모] 2강. 회귀모형 I (4) | 2024.03.16 |
[데이터마이닝/메모] 1강. 데이터마이닝 (0) | 2024.03.13 |
[예측방법론/메모] 1강. 예측의 개요 (0) | 2024.02.23 |