기술 통계 이전 내용
z 점수
표준 정규 분포(standard normal distribution): 평균이 0이고 표준 편차가 1이 되도록 정규 분포의 크기를 재조정하는 것. 이렇게 하면 평균과 분산이 다른 경우에도 정규 분포 간의 퍼짐 정도를 쉽게 비교할 수 있다.
표준 정규 분포에서 특히 중요한 것은 모든 x값을 표준 편차, 즉 z 점수로 표현한다는 점이며, 공식은 아래와 같다.
예를 들어, 서로 다른 동네에 있는 주택 두 채가 있는데, A 동네에 있는 평균 주택 가격은 1억 8천만 원이고 표준 편차는 300만원이고, B 동네에 있는 평균 주택 가격은 1억원이고 표준 편차는 1000만원이다.
두 동네에 각각 한 채의 집이 있다. A 동네의 집 A의 가치는 2억원이고, B 동네의 집 B의 가치는 1억2천만원이다. 각 동네에 평균 가격에 비해 어느 집이 더 비쌀까?
이 두 값을 표준 편차로 표현하면 각 동네의 평균을 기준으로 비교할 수 있다. z 점수 공식을 사용하면,
집 A와 집 B의 z 점수를 토대로 하면, 집 A가 집 B 보다 각 동네에 평균에 비해 훨씬 더 비싼 것을 알 수 있다.
아래는 어떤 평균과 표준 편차를 가진 분포의 x 값을 z 점수로 변환하는 방법과 그 반대로 변환하는 경우를 파이썬으로 나타낸 것이다.
[z 점수를 x 값으로 또는 그 반대로 변환하기]
# z 점수를 x 값으로 또는 그 반대로 변환하기
def z_score(x, mean, std):
return (x - mean) / std
def z_to_x(z, mean, std):
return (z * std) + mean
mean = 180000000
std_dev = 3000000
x = 200000000
# z 점수로 바꾸고 다시 x로 되돌리기
z = z_score(x, mean, std_dev)
back_to_x = z_to_x(z, mean, std_dev)
print("z점수: {}".format(z))
print("x로 되돌리기: {}".format(back_to_x))
▶ [코드 설명]
- z_score() 함수는 평균과 표준 편차가 주어진 x 값을 받아 표준 편차 단위로 변환. (z 점수를 푸는 함수)
- z_to_x() 함수는 z 점수를 받아 다시 x 값으로 변환. (x 값을 푸는 함수)
★ 변동 계수(coefficient variation)
변동 계수는 두 분포를 비교해 각 분포가 얼마나 퍼져 있는지 정량화 하여 퍼짐 정도를 측정하는 데 유용한 도구이다.
변동 계수는 표준 편차를 평균으로 나눠 계산한다.
변동계수는 단위가 없기 때문에 단위가 다른 속성을 비교하는 경우 유용하다.
위의 계산을 통해 알 수 있듯, A 동네는 B 동네보다 변동 계수가 높아 주택 가격의 다양성이 더 크다는 것을 알 수 있다.
[출처]
개발자를 위한 필수 수학
DATALINK
'[파이썬 Projects] > <파이썬 - 수학 | 통계학>' 카테고리의 다른 글
[개발자를 위한 수학] 추론통계: 가설 검정 (+파이썬) (0) | 2024.10.06 |
---|---|
[개발자를 위한 수학] 추론 통계 (3) | 2024.10.06 |
[개발자를 위한 수학] 기술 통계: 평균, 분산, 정규 분포(+파이썬) (2) | 2024.10.05 |
[파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.2) - 3 (2) | 2024.10.05 |
[파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.2) - 2 (0) | 2024.10.04 |