5-3 다변량 자료의 탐색 R 선그래프 plot() lines()
R 선그래프 두개의 변수 중 하나가 시간을 나타내는 값일 때 사용 시계열 분석 month=c(1:12) late=c(5,8,7,9,4,6,12,13,8,6,6,4) plot(late~month, main="Late Students", type="l", lty=1, lwd=1) 복수의 선 그래프 그리기 하나의 선 그래프를 그린 후에 그 위에 다른 선그래프를 겹쳐 그리는 방식 month=c(1:12) late1=c(5,8,7,9,4,6,12,13,8,6,6,4) late2=c(4,6,5,8,7,8,10,11,6,5,7,3) plot(late1~month, main="Late Students", type="l", lty=1, lwd=1) lines(late2~month, type="b", col="blue")..
4-3 R을 이용해 만드는 일변량 양적 자료 그래프 Mean(), diff(), sd(), range(), boxplot(), hist(), stem()
일변량 양적 자료를 활용해 만드는 다양한 그래프 양적 자료는 크기 비교가 가능해 질적 자료 대비 분석 방법이 다양하다. 평균(Mean) 개별 값들의 합계를 그 개별 값들의 개수로 나누는 것 ex) 균형점, 무게중심 절사평균(Trimmed Mean) 표본중에서 작은값n%와 큰값 n%를 제외하고 나머지(100-2n)%의 자료만 사용하여 구한 평균 극단적인 값에 의한 오차를 줄이기 위해 사용 자료가 정규분포를 이루면 평균이 의미가 있으나 어느 한쪽으로 치우친 경우 평균 보다는 중앙값을 대표값으로 사용할 수 있음 4분위수 3개의 수로 데이터를 추정 나열한 것을 4등분 함 등분점 3개 mydata=c(50,60,100,75,200) mydata.big 구간을 나누어 표시할 것 막대그래프와 히스토그램의 차이 his..