본문 바로가기

공부와 공부와 공부/R

5-2 다변량 자료의 탐색 R상관분석, 상관계수 plot(), cor(), cbind(), rbinds(), lm()

상관분석

  • 두개의 변수, 두개의 양적 자료에 대한 분석 방법
  • 산점도와 항상 함께 이용
  • 수치적으로 변수들의 상관관계를 표현

상관계수 R

 

상관계수 R

  • -1<= r <=1 의 분포
  • r>0 양의 상관관계
  • r< 음의 상관관계
  • 1이나 -1에 가까울수록 상관성이 높고 0에 가까울수록 상과성이 낮음

 

beers=c(5,2,9,8,3,7,3,5,3,5)

bal=c(0.1,0.03,0.19,0.12,0.04,0.0062,0.07,0.06,0.02,0.05)

tbl=data.frame(cbind(beers,bal))

tbl; class(tbl)

plot(bal~beers,data=tbl)

res<-lm(bal~beers,data=tbl)

abline(res)

cor(beers,bal)

 

 

여러 변수들 간의 상관계수를 동시에 구하는 방법

 

cor(iris[,1:4])

 

※위 자료는 K-MOOC 단국대학교 오세종 교수님의 R 데이터 분석 입문을 참고하였습니다.