TOP
본문 바로가기
📚 목차
자격증/빅데이터분석기사

[빅분기 실기] 작업형 1유형: transfrom('mean') vs mean()

by 기록자_Recordian 2025. 6. 7.
728x90
반응형
이전 내용

[빅분기 실기] 실기 체험환경 (groom)

이전 내용 [빅분기 실기] 작업형 3유형 요약이전 내용 [빅분기 실기] 작업형 3유형 : 로지스틱 회귀 분석이전 내용 [빅분기 실기] 작업형 3유형 : 회귀 분석이전 내용 [빅분기 실기] 작업형 3유형 :

puppy-foot-it.tistory.com


transform('mean')
vs
mean()

 

아래와 같은 코드가 있다고 하자.

df.groupby('지역코드')['판매금액'].transform('mean')
df.groupby('지역코드')['판매금액'].mean()

 
그룹핑(groupby)에서 사용하는 두 문법은 서로 비슷해 보이나, 결과값의 구조와 목적이 전혀 다르다.

항목 transform('mean') mean()
결과원래 행 개수와 동일한 Series그룹별 평균만 남은 Series (또는 DataFrame)
반환 형태모든 행에 지역코드별 평균을 반복해서 채움그룹별 하나의 평균값만 보여줌
주로 사용 용도기존 데이터프레임에 평균값을 컬럼으로 붙일 때단순히 그룹 평균만 보고 싶을 때
예시 행 개수1000행 → 1000행 유지1000행 → 지역코드 수만큼 줄어듦

 
예를 들어, 아래와 같은 코드로 데이터프레임을 생성했다고 하면

import pandas as pd

df = pd.DataFrame({
    '지역코드': ['A', 'A', 'B', 'B', 'C'],
    '판매금액': [100, 200, 300, 400, 500]
})

 
1. df.groupby('지역코드')['판매금액'].transform('mean')

df['지역별평균'] = df.groupby('지역코드')['판매금액'].transform('mean')

 

지역코드판매금액지역별평균
A100150.0
A200150.0
B300350.0
B400350.0
C500500.0

▶ 그룹별 평균을 원래 데이터의 각 행에 그대로 뿌려줌.
 
2. df.groupby('지역코드')['판매금액'].mean()

df.groupby('지역코드')['판매금액'].mean()
지역코드 판매금액
A150.0
B350.0
C500.0

▶ 그룹별 평균만 요약해서 보여줌.
 
 [목적에 따른 사용 방법]

목적 추천 구문
각 행에 "그룹 평균"을 새로운 컬럼으로 추가transform('mean')
그냥 그룹별 평균이 궁금한 경우mean()

 


다음 내용

[빅분기 실기] 작업형 1유형 판다스 중요 문법 정리

이전 내용 [빅분기 실기] 작업형 1유형: transfrom('mean') vs mean()이전 내용 [빅분기 실기] 실기 체험환경 (groom)이전 내용 [빅분기 실기] 작업형 3유형 요약이전 내용 [빅분기 실기] 작업형 3유형 : 로지

puppy-foot-it.tistory.com

 

728x90
반응형