TOP
class="layout-aside-left paging-number">
본문 바로가기
[파이썬 Projects]/<파이썬 - 수학 | 통계학>

[개발자를 위한 수학] 기술 통계: z 점수(+파이썬)

by 기록자_Recordian 2024. 10. 6.
728x90
반응형
기술 통계 이전 내용

 

 

[개발자를 위한 수학] 기술 통계: 평균, 분산, 정규 분포(+파이썬)

기술 통계 평균, 중앙값, 모드, 차트, 종, 곡선을 계산하거나 데이터를 설명하기 위한 통계.측정이나 실험에서 수집한 자료(data)의 정리, 요약, 해석, 표현 등을 통해 자료의 특성을 규명

puppy-foot-it.tistory.com


z 점수

 

표준 정규 분포(standard normal distribution): 평균이 0이고 표준 편차가 1이 되도록 정규 분포의 크기를 재조정하는 것. 이렇게 하면 평균과 분산이 다른 경우에도 정규 분포 간의 퍼짐 정도를 쉽게 비교할 수 있다.

표준 정규 분포에서 특히 중요한 것은 모든 x값을 표준 편차, 즉 z 점수로 표현한다는 점이며, 공식은 아래와 같다.

 

예를 들어, 서로 다른 동네에 있는 주택 두 채가 있는데, A 동네에 있는 평균 주택 가격은 1억 8천만 원이고 표준 편차는 300만원이고, B 동네에 있는 평균 주택 가격은 1억원이고 표준 편차는 1000만원이다.

 

두 동네에 각각 한 채의 집이 있다. A 동네의 집 A의 가치는 2억원이고, B 동네의 집 B의 가치는 1억2천만원이다. 각 동네에 평균 가격에 비해 어느 집이 더 비쌀까?

 

이 두 값을 표준 편차로 표현하면 각 동네의 평균을 기준으로 비교할 수 있다. z 점수 공식을 사용하면,

 

집 A와 집 B의 z 점수를 토대로 하면, 집 A가 집 B 보다 각 동네에 평균에 비해 훨씬 더 비싼 것을 알 수 있다.

 

아래는 어떤 평균과 표준 편차를 가진 분포의 x 값을 z 점수로 변환하는 방법과 그 반대로 변환하는 경우를 파이썬으로 나타낸 것이다.

 

[z 점수를 x 값으로 또는 그 반대로 변환하기]

# z 점수를 x 값으로 또는 그 반대로 변환하기
def z_score(x, mean, std):
    return (x - mean) / std

def z_to_x(z, mean, std):
    return (z * std) + mean

mean = 180000000
std_dev = 3000000
x = 200000000

# z 점수로 바꾸고 다시 x로 되돌리기
z = z_score(x, mean, std_dev)
back_to_x = z_to_x(z, mean, std_dev)

print("z점수: {}".format(z))
print("x로 되돌리기: {}".format(back_to_x))

 

▶ [코드 설명]

- z_score() 함수는 평균과 표준 편차가 주어진 x 값을 받아 표준 편차 단위로 변환. (z 점수를 푸는 함수)

- z_to_x() 함수는 z 점수를 받아 다시 x 값으로 변환. (x 값을 푸는 함수)


★ 변동 계수(coefficient variation)

변동 계수는 두 분포를 비교해 각 분포가 얼마나 퍼져 있는지 정량화 하여 퍼짐 정도를 측정하는 데 유용한 도구이다.

변동 계수는 표준 편차를 평균으로 나눠 계산한다.

변동계수는 단위가 없기 때문에 단위가 다른 속성을 비교하는 경우 유용하다.

 

위의 계산을 통해 알 수 있듯, A 동네는 B 동네보다 변동 계수가 높아 주택 가격의 다양성이 더 크다는 것을 알 수 있다.

 


[출처]

개발자를 위한 필수 수학

DATALINK

 

728x90
반응형