반응형

** R 실습

R로 2강에서 배운 회귀모형과 선형회귀모형을 코딩해본다.

 



선형회귀모형 함수   lm
lm: linear model 약자  

 

 


8분 28초
로지스틱회귀모형 함수  glm
glm: generalized linear model 약자

family = binomial으로 지정해서 로지스틱회귀를 사용  
family 옵션을 변경해서 로지스틱회귀모형이 아닌 다른 모형으로도 쓸 수 있음(목표변수의 분포를 변화시킴)



step 함수: 변수 선택(전진, 후진, 단계적 선택방법)
step(object, direction=c("both", "backword", "forward"))
Object에는 회귀모형(lm, glm 등에서 생성한) 객체

 

 

 




predict 함수: 적합된 모델에 새로운 데이터가 주어졌을때 y값을 예측
회귀모형일 경우 type=response 옵션 지정



==== R 실습 20:15~

 

 

 

실습을 보며 R에서의 모델을 만들고 예측하는 과정의 흐름을 파악하였음

데이터는 1강에서 전처리한 것을 저장해서 사용


 

학습개요

회귀분석은 변수들 사이에 함수적 관계를 조사하는 통계적 방법이다. 그 관계는 목표변수와 입력변수들을 연결하는 방정식 또는 모형의 형태로 표현된다. 목표변수가 연속형인 경우에 선형회귀모형, 이항형인 경우에 로지스틱회귀모형을 이용하게 되는데 이는 결과적으로 각각 예측의 문제와 분류의 문제로 귀결된다. 본 강에서는 예측과 분류의 문제에 관해 R을 이용하여 실제데이터를 분석하면서 방법론을 정리해 보도록 한다.

 

 

학습목표

  1. R을 이용하여 선형회귀모형을 적합할 수 있다.
  2. R을 이용하여 로지스틱회귀모형을 이해하고 적합할 수 있다.
  3. 회귀모형에 활용되는 R 함수를 이해할 수 있다.

 

 

주요용어

  1. lm : 선형모형을 적합하기 위해 사용되는 R 함수
  2. glm : 일반화선형모형을 적합하기 위해 사용되는 R 함수
  3. step : AIC를 이용한 모형 선택을 위해 사용되는 R 함수
  4. predict : 다양한 모형 적합 결과로부터 예측 값을 계산할 때 사용되는 R 함수

 

 

정리하기

  1. R에서 lm은 선형모형을 적합하기 위해 사용되는 함수이고 glm은 일반화선형모형을 적합하기 위해 사용되는 함수이다.
  2. AIC를 이용한 모형 선택을 위해 사용되는 R 함수로는 step 함수가 있으며 옵션에 따라 후진소거법, 전진선택법, 단계적선택법 등을 수행할 수 있다.
  3. 회귀모형에서 다양한 모형 적합 결과로부터 예측 값을 계산할 때 사용되는 R 함수는 predict이다.

 

 

 

 

반응형
복사했습니다!