상관분석
- 두개의 변수, 두개의 양적 자료에 대한 분석 방법
- 산점도와 항상 함께 이용
- 수치적으로 변수들의 상관관계를 표현
상관계수 R
- -1<= r <=1 의 분포
- r>0 양의 상관관계
- r< 음의 상관관계
- 1이나 -1에 가까울수록 상관성이 높고 0에 가까울수록 상과성이 낮음
beers=c(5,2,9,8,3,7,3,5,3,5)
bal=c(0.1,0.03,0.19,0.12,0.04,0.0062,0.07,0.06,0.02,0.05)
tbl=data.frame(cbind(beers,bal))
tbl; class(tbl)
plot(bal~beers,data=tbl)
res<-lm(bal~beers,data=tbl)
abline(res)
cor(beers,bal)
여러 변수들 간의 상관계수를 동시에 구하는 방법
cor(iris[,1:4])
※위 자료는 K-MOOC 단국대학교 오세종 교수님의 R 데이터 분석 입문을 참고하였습니다.
'공부와 공부와 공부 > R' 카테고리의 다른 글
6-1 R 프로그래밍 if(), for(), while(), for문과 while문 차이 (0) | 2019.05.23 |
---|---|
5-3 다변량 자료의 탐색 R 선그래프 plot() lines() (0) | 2019.05.19 |
5-1 다변량 자료의 탐색 - 산점도 plot(), pch(), pairs() (0) | 2019.05.12 |
4-4 문자열 함수 Paste(), Substr(), nchar(), gstr() (0) | 2019.05.12 |
4-3 R을 이용해 만드는 일변량 양적 자료 그래프 Mean(), diff(), sd(), range(), boxplot(), hist(), stem() (0) | 2019.05.09 |