공부와 공부와 공부/R
5-2 다변량 자료의 탐색 R상관분석, 상관계수 plot(), cor(), cbind(), rbinds(), lm()
인생의 띠로리
2019. 5. 19. 15:28
상관분석
- 두개의 변수, 두개의 양적 자료에 대한 분석 방법
- 산점도와 항상 함께 이용
- 수치적으로 변수들의 상관관계를 표현
상관계수 R
- -1<= r <=1 의 분포
- r>0 양의 상관관계
- r< 음의 상관관계
- 1이나 -1에 가까울수록 상관성이 높고 0에 가까울수록 상과성이 낮음
beers=c(5,2,9,8,3,7,3,5,3,5)
bal=c(0.1,0.03,0.19,0.12,0.04,0.0062,0.07,0.06,0.02,0.05)
tbl=data.frame(cbind(beers,bal))
tbl; class(tbl)
plot(bal~beers,data=tbl)
res<-lm(bal~beers,data=tbl)
abline(res)
cor(beers,bal)
여러 변수들 간의 상관계수를 동시에 구하는 방법
cor(iris[,1:4])
※위 자료는 K-MOOC 단국대학교 오세종 교수님의 R 데이터 분석 입문을 참고하였습니다.