※해당 내용은 <현대통계학> 다산출판사의 내용을 토대로 작성하였음을 안내드립니다.
통계학이란?
의사결정에서 불확실성을 줄이기 위해 자료를 수집하고 수량화한 뒤, 그 자료를 분석하고 해석하기 위한 학문적 체계를 확립시킨 것.
[통계학 개념을 이용한 예]
야구 시합: 세이버매트릭스 (야구통계학) - 개인의 성적과 팀의 승패 예측
대학수학능력시험 성적의 분포와 특정학과의 합격선 등을 체크
▶ 미래의 불확실성을 줄이기 위함
통계학이란,
불확실한 상황에서 현명한 의사결정을 하기 위한 이론과 방법의 체계이며, 통계학은 자료의 수집 · 분류 · 분석과 해석의 체계를 갖는다.
또한, 통계학은 불확실한 상황에서 발생하는 모든 자연현상이나 사회현상을 과학적으로 분석하고 예측하는 분석도구로서 광범위하게 이용되고 있으므로, 자연현상과 사회현상을 다루는 모든 학문에서 중요하게 다루어지고 있다.
화학 · 물리학 · 기상학 · 생물학 등의 자연과학분야는 물론, 정치학 · 경졔학 · 사회학 · 심리학 등의 사회과학분야에도 널리 이용되며, 심지어는 문학 · 미술 등의 예술분야에 이르기까지 통계학은 널리 이용되고 있다.
요즘에는 4차 산업혁명시대의 도래를 계기로 빅데이터의 축적 및 활용이 중요해짐과 동시에, 모든 학문분야에서 과학적 연구방법과 실증적 연구가 강조됨에 따라 통계학의 이용은 급속도로 증가되고 있다.
통계학의 기본 용어
모집단과 표본
모집단: 분석의 대상이 되는 집단 전체 (연구자의 관심의 대상이 되는 모든 개체의 집합)
샘플(표본): 그 모집단에서 추출한 부분집합 (모집단에서 조사대상으로 채택된 일부)
모집단을 구성하는 개체의 수는 조사대상과 상황에 따라 다르다.
예. 세계인구의 평균 몸무게 - 모집단의 구성원 수는 세계인구
가 고등학교 3-1반 학생들의 시험점수 - 가 고등학교 3학년 1반 학생 전체
모집단이 작을 때에는 모집단을 구성하고 있는 모든 개체를 조사하는 데 큰 비용이 소모되지 않으므로, 가능하다면 모든 개체를 조사 · 분석하여 모집단의 성격을 정확하게 파악하여야 한다.
그러나, 모집단의 수가 매우 많거나, 그 구성원을 다 조사할 수 없는 경우가 대부분이며,
그러한 경우 시간적으로나 물리적으로나 모집단 전체를 살펴볼 수가 없기 때문에, 모집단의 일부분인 표본을 뽑아
표본의 평균을 가지고 모집단의 평균 월급 대해 추론.
모수와 통계량
모수: 모집단의 특성을 수치로 나타낸 것
통계량: 표본의 특성을 수치로 나타낸 것
통계적으로 조사를 할 때, 모집단 전부를 대상으로 하여 모집단의 어떤 특성을 수치로 알아보는 경우도 있으며, 모집단을 전부 조사하기 어려울 때에는 표본을 뽑아서 그 특성을 수치로 나타내기도 한다.
예를 들어, 서울시내 초등학생들의 평균 체중을 알기 원할 때 전체 학생들을 조사하여 평균 체중을 산출하는 경우도 있고,
보다 효율적으로 하기 위해 전체 학생 중 표본을 뽑아, 그 표본으로부터 평균을 계산할 수도 있다.
전체 학생들로부터 산출한 평균과 표본으로부터 계산된 평균은 동일해 보일 수 있으나, 두 값이 완전히 동일하다고 할 수 없다.
따라서 '평균'이라는 같은 용어로 표현되어도, 계산의 대상이 되는 집단이 다른 경우 모집단과 표본의 평균은 구분하여 사용하여야 한다.
모집단의 모수를 정확히 계산할 수 있다면 문제없으나, 현실에서는 모집단을 전부 조사해 모수를 계산하는 것은 불가능에 가깝기 때문에, 표본에서 계산된 통계량으로 모수를 대신하게 된다.
모집단 또는 표본의 특성을 나타내는 것: 평균 · 분산 · 표준편차 등
▶ 모집단을 대상으로 할 때와 표본을 대상으로 할 때의 차이를 두기 위하여 기호를 달리하여 사용
기술통계학과 추론통계학
기술통계학: 통계적 자료를 정리하고 요약하는 등 자료특성의 계산 방법과 관련된 통계학
추론통계학: 모집단에서 뽑은 표본을 분석하여 이를 기초로 모집단의 특성을 규명하는 통계학
기술통계학의 예
우리 학급의 평균 시험점수를 알기 위해 자료를 구하여 평균을 구하는 방법
추론통계학의 예
우리나라 고등학교 3학년 학생들의 수능모의고사 평균을 알아보기 위하여 몇백 명만 표본으로 뽑아 그들의 점수를 바탕으로 전국 고등학교 3학년 학생들의 수능모의고사의 평균을 알아내는 방법에 관한 통계학
▶ 오늘날에는 표본의 자료로부터 그 표본이 추출된 모집단의 특성을 추론하는 추론통계학이 통계학의 주류를 이루고 있음
모수통계학과 비모수통계학
모수통계학: 모집단의 분포에 대한 가정이 필요하며 대체로 수량적 자료 중에서도 연속형 자료 사용
비모수통계학: 모집단에 대한 가정이 필요하지 않으며 질적 자료나 수량적 자료 중에서 빈도수와 같은 비연속형 자료 사용
모수통계학에서는 모집단의 분포 모양에 대한 가정을 필요로 하며, 사용되는 자료로는 수량적 자료 중에서도 연속형 자료를 요구하는 경우가 많다.
그러나 비모수통계학은 모집단의 분포 모양에 대한 가정을 할 수 없거나 표본의 크기가 작은 경우에 많이 사용된다. 그렇기 때문에 사용하기 편리하며 분석 방법도 대체로 간편하여 이해하기 쉽다.
그러나 추론통계학에서 모수통계학을 자주 사용하는 이유는, 분포에 대한 가정이 틀리지 않다면 모수통계학이 비모수통계학보다 모수를 추정하는 데 더 신뢰할 만한 결과를 내기 때문이다.
'[파이썬 Projects] > <파이썬 - 수학 | 통계학>' 카테고리의 다른 글
[통계학] 자료 정리 - 2 (1) | 2024.10.03 |
---|---|
[통계학] 자료 정리 - 1 (4) | 2024.10.02 |
[개발자를 위한 수학] 미분, 적분 (+파이썬) (5) | 2024.10.02 |
[개발자를 위한 수학] 로그, 자연로그, 오일러 수 (+파이썬) (6) | 2024.10.02 |
[개발자를 위한 수학] 기초수학 (+파이썬) (0) | 2024.10.02 |