본문 바로가기

공부와 공부와 공부/R

4-1 기초 통계 개념

기초 통계 개념

자료분석에는 자료의 성질에 대한 이해가 먼저 필요

 

자료 성질에 따른 분류

 

1.    질적 자료=범주형 자료 : 숫자 형태와 같이 크기로 표현될 수 없는 데이터

    ex) 교육수준(초졸, 중졸, 고졸, 대졸), 성별 표시

 

2.    양적 자료: 자료가 숫자로 표현되고 크기를 가짐

       1)    이산자료: 정수값을 취할 수 있는 자료 ex) 각 세대의 자녀 수

       2)    연속자료: 실수 값을 취하 수 있는 자료 ex) , 몸무게, 온도

       >> 자료 형태에 따라 분석 방법이 달라짐

 

변수의 개수에 따른 분류

 

1.    일변량 자료: 변수가 하나인 데이터

       ex) 몸무게 분포 분석 à 몸무게 하나에 대한 데이터

       >> 몸무게가 변수, 벡터에 저장

 

2.    다변량 자료: 변수가 두 개 이상인 데이터

      ex) 출생 지역과 몸무게의 상관 관계

       >> 출생지역, 몸무게가 변수, matrix, 데이터 프레임에 저장

 

통계 용어의 이해

 

1.    모집단: 조사 대상의 전체를 말함

2.    표본: 모집단의 일부만 조사 대상으로 함. 모집단의 부분 집합이 됨

3.    모수: 모집단의 특성을 나타내는 척도 ex) 평균과 표준 편차

 

※위 자료는 K-MOOC 단국대학교 오세종 교수님의 R 데이터 분석 입문을 참고하였습니다.