기초 통계 개념
자료분석에는 자료의 성질에 대한 이해가 먼저 필요
자료 성질에 따른 분류
1. 질적 자료=범주형 자료 : 숫자 형태와 같이 크기로 표현될 수 없는 데이터
ex) 교육수준(초졸, 중졸, 고졸, 대졸), 성별 표시
2. 양적 자료: 자료가 숫자로 표현되고 크기를 가짐
1) 이산자료: 정수값을 취할 수 있는 자료 ex) 각 세대의 자녀 수
2) 연속자료: 실수 값을 취하 수 있는 자료 ex) 키, 몸무게, 온도
>> 자료 형태에 따라 분석 방법이 달라짐
변수의 개수에 따른 분류
1. 일변량 자료: 변수가 하나인 데이터
ex) 몸무게 분포 분석 à 몸무게 하나에 대한 데이터
>> 몸무게가 변수, 벡터에 저장
2. 다변량 자료: 변수가 두 개 이상인 데이터
ex) 출생 지역과 몸무게의 상관 관계
>> 출생지역, 몸무게가 변수, matrix, 데이터 프레임에 저장
통계 용어의 이해
1. 모집단: 조사 대상의 전체를 말함
2. 표본: 모집단의 일부만 조사 대상으로 함. 모집단의 부분 집합이 됨
3. 모수: 모집단의 특성을 나타내는 척도 ex) 평균과 표준 편차
※위 자료는 K-MOOC 단국대학교 오세종 교수님의 R 데이터 분석 입문을 참고하였습니다.
'공부와 공부와 공부 > R' 카테고리의 다른 글
5-1 다변량 자료의 탐색 - 산점도 plot(), pch(), pairs() (0) | 2019.05.12 |
---|---|
4-4 문자열 함수 Paste(), Substr(), nchar(), gstr() (0) | 2019.05.12 |
4-3 R을 이용해 만드는 일변량 양적 자료 그래프 Mean(), diff(), sd(), range(), boxplot(), hist(), stem() (0) | 2019.05.09 |
R 그래프를 만드는 데 뜨는 에러 Error in RStudioGD() (0) | 2019.05.08 |
4-2 R을 이용해 막대그래프와 파이그래프 만들기 table(), barplot(), par(), pie() (0) | 2019.05.07 |