728x90
반응형
이전 내용
[빅분기 실기] 실기 체험환경 (groom)
이전 내용 [빅분기 실기] 작업형 3유형 요약이전 내용 [빅분기 실기] 작업형 3유형 : 로지스틱 회귀 분석이전 내용 [빅분기 실기] 작업형 3유형 : 회귀 분석이전 내용 [빅분기 실기] 작업형 3유형 :
puppy-foot-it.tistory.com
transform('mean')
vs
mean()

아래와 같은 코드가 있다고 하자.
df.groupby('지역코드')['판매금액'].transform('mean')
df.groupby('지역코드')['판매금액'].mean()
그룹핑(groupby)에서 사용하는 두 문법은 서로 비슷해 보이나, 결과값의 구조와 목적이 전혀 다르다.
항목 | transform('mean') | mean() |
결과 | 원래 행 개수와 동일한 Series | 그룹별 평균만 남은 Series (또는 DataFrame) |
반환 형태 | 모든 행에 지역코드별 평균을 반복해서 채움 | 그룹별 하나의 평균값만 보여줌 |
주로 사용 용도 | 기존 데이터프레임에 평균값을 컬럼으로 붙일 때 | 단순히 그룹 평균만 보고 싶을 때 |
예시 행 개수 | 1000행 → 1000행 유지 | 1000행 → 지역코드 수만큼 줄어듦 |
예를 들어, 아래와 같은 코드로 데이터프레임을 생성했다고 하면
import pandas as pd
df = pd.DataFrame({
'지역코드': ['A', 'A', 'B', 'B', 'C'],
'판매금액': [100, 200, 300, 400, 500]
})
1. df.groupby('지역코드')['판매금액'].transform('mean')
df['지역별평균'] = df.groupby('지역코드')['판매금액'].transform('mean')
지역코드 | 판매금액 | 지역별평균 |
A | 100 | 150.0 |
A | 200 | 150.0 |
B | 300 | 350.0 |
B | 400 | 350.0 |
C | 500 | 500.0 |
▶ 그룹별 평균을 원래 데이터의 각 행에 그대로 뿌려줌.
2. df.groupby('지역코드')['판매금액'].mean()
df.groupby('지역코드')['판매금액'].mean()
지역코드 | 판매금액 |
A | 150.0 |
B | 350.0 |
C | 500.0 |
▶ 그룹별 평균만 요약해서 보여줌.
[목적에 따른 사용 방법]
목적 | 추천 구문 |
각 행에 "그룹 평균"을 새로운 컬럼으로 추가 | transform('mean') |
그냥 그룹별 평균이 궁금한 경우 | mean() |
다음 내용
[빅분기 실기] 작업형 1유형 판다스 중요 문법 정리
이전 내용 [빅분기 실기] 작업형 1유형: transfrom('mean') vs mean()이전 내용 [빅분기 실기] 실기 체험환경 (groom)이전 내용 [빅분기 실기] 작업형 3유형 요약이전 내용 [빅분기 실기] 작업형 3유형 : 로지
puppy-foot-it.tistory.com
728x90
반응형
'자격증 > 빅데이터분석기사' 카테고리의 다른 글
[빅분기 실기] 작업형 3유형: groom 체험 문제 풀이 (0) | 2025.06.13 |
---|---|
[빅분기 실기] 작업형 1유형 판다스 중요 문법 정리 (3) | 2025.06.07 |
[빅분기 실기] 실기 체험환경 (groom) (0) | 2025.06.03 |
[빅분기 실기] 작업형 3유형 요약 (2) | 2025.06.02 |
[빅분기 실기] 작업형 3유형 : 로지스틱 회귀 분석 (1) | 2025.06.01 |