이전 내용
[빅분기 실기] 작업형 3유형: groom 체험 문제 풀이
이전 내용 [빅분기 실기] 작업형 1유형 판다스 중요 문법 정리이전 내용 [빅분기 실기] 작업형 1유형: transfrom('mean') vs mean()이전 내용 [빅분기 실기] 실기 체험환경 (groom)이전 내용 [빅분기 실기] 작
puppy-foot-it.tistory.com
1. 함수 사용법이 기억나지 않을 때: dir(), help()
빅데이터분석기사 (이하 빅분기) 실기 시험 때 코드를 전부 다 외워서 써야 하는데, (제일 좋은 것은 이해하고 사용하는 것이긴 하다.) 인간의 기억력은 한계가 있기 때문에 난관에 봉착할 것이다.
책이나 유튜브 강의를 보면 이럴 때 dir() 함수나 help() 함수를 사용하라고 권하고 있다.
특히, 3유형 시험에서 매우 유용할 것으로 생각된다.
그중에서도 t-검정 (t-test)에서 검정 종류별로 다른 함수 또는 다른 인자를 사용해야 하는데, 아래와 같이 사용하면 될 거 같다.
※ 중요!
dir()과 help() 함수를 사용하기 전에, 반드시 사용할 모듈을 import 해야 한다.
from scipy import stats
- dir() 함수
print(dir(stats.ttest_1samp))
- help() 함수
print(help(stats.ttest_1samp))
해당 내용을 복사하여 구름(실기 시험 프로그램)의 메모장에 붙여넣기 한 뒤 활용하면 될 거 같다.
2. 모듈명이 길어 뒤의 이름이 기억나지 않을 때
그런데, 분산 분석의 경우 불러야 할 모듈의 이름이 매우 길다.
from statsmodels.formula.api import ols
이럴 때는
1) statsmodels import
2) dir() 함수를 사용하여 단계별로 조회한다.
import statsmodels
print(dir(statsmodels))
그러면 statsmodels에서 사용할 수 있는 모듈 리스트가 나오는데, 이중에서 우리가 사용할 formula도 뜨는 것을 확인할 수 있다.
(볼드 및 색상 변경은 값을 보여주기 위함)
['__all__', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__path__', '__spec__', '__version__', '__version_info__', '__version_tuple__', '_version', 'base', 'compat', 'debug_warnings', 'discrete', 'distributions', 'duration', 'emplike', 'formula', 'gam', 'genmod', 'graphics', 'iolib', 'monkey_patch_cat_dtype', 'regression', 'robust', 'stats', 'test', 'tools']
그러면 기존의 dir 함수에 formula도 붙여서 다시 호출
print(dir(statsmodels.formula))
불러와야 할 api 모듈이 확인된다.
['PytestTester', '__all__', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__path__', '__spec__', 'api', 'formulatools', 'handle_formula_data', 'test']
역시 기존의 dir() 함수에 api도 붙이고 다시 호출
print(dir(statsmodels.formula.api))
ols는 ordinary least squares 즉, 일반 최소제곱법 회귀분석을 수행하는 함수로,
기본적으로 일반 선형 회귀분석(ordinary least squares regression)을 위한 함수이지만, 그 결과를 활용하여 분산분석(ANOVA, Analysis of Variance)에도 널리 사용 된다.
['__all__', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', 'conditional_logit', 'conditional_mnlogit', 'conditional_poisson', 'gee', 'glm', 'glmgam', 'gls', 'glsar', 'logit', 'mixedlm', 'mnlogit', 'negativebinomial', 'nominal_gee', 'ols', 'ordinal_gee', 'phreg', 'poisson', 'probit', 'quantreg', 'rlm', 'wls'
이 결과를 토대로
모듈과 함수를 정확히 불러오면 된다.
from statsmodels.formula.api import ols
다음 내용
'자격증 > 빅데이터분석기사' 카테고리의 다른 글
[빅분기 실기] 제10회 빅데이터분석기사 실기 후기 (2) | 2025.06.22 |
---|---|
[빅분기 실기] 9회 기출문제 1유형: melt 안 쓰고 더 쉽게 풀기 (0) | 2025.06.20 |
[빅분기 실기] 작업형 3유형: groom 체험 문제 풀이 (0) | 2025.06.13 |
[빅분기 실기] 작업형 1유형 판다스 중요 문법 정리 (3) | 2025.06.07 |
[빅분기 실기] 작업형 1유형: transfrom('mean') vs mean() (0) | 2025.06.07 |