TOP
본문 바로가기
📚 목차
자격증/빅데이터분석기사

[빅분기 실기] 모듈의 뒷부분 이름이 기억나지 않을 때

by 기록자_Recordian 2025. 6. 14.
728x90
반응형
이전 내용
 

[빅분기 실기] 작업형 3유형: groom 체험 문제 풀이

이전 내용 [빅분기 실기] 작업형 1유형 판다스 중요 문법 정리이전 내용 [빅분기 실기] 작업형 1유형: transfrom('mean') vs mean()이전 내용 [빅분기 실기] 실기 체험환경 (groom)이전 내용 [빅분기 실기] 작

puppy-foot-it.tistory.com


1. 함수 사용법이 기억나지 않을 때: dir(), help()

빅데이터분석기사 (이하 빅분기) 실기 시험 때 코드를 전부 다 외워서 써야 하는데, (제일 좋은 것은 이해하고 사용하는 것이긴 하다.) 인간의 기억력은 한계가 있기 때문에 난관에 봉착할 것이다.

책이나 유튜브 강의를 보면 이럴 때 dir() 함수나 help() 함수를 사용하라고 권하고 있다.

 

특히, 3유형 시험에서 매우 유용할 것으로 생각된다.

그중에서도 t-검정 (t-test)에서 검정 종류별로 다른 함수 또는 다른 인자를 사용해야 하는데, 아래와 같이 사용하면 될 거 같다.

 

※ 중요!

dir()과 help() 함수를 사용하기 전에, 반드시 사용할 모듈을 import 해야 한다.

from scipy import stats

 

- dir() 함수

print(dir(stats.ttest_1samp))

 

- help() 함수

print(help(stats.ttest_1samp))

 

해당 내용을 복사하여 구름(실기 시험 프로그램)의 메모장에 붙여넣기 한 뒤 활용하면 될 거 같다.


2. 모듈명이 길어 뒤의 이름이 기억나지 않을 때

그런데, 분산 분석의 경우 불러야 할 모듈의 이름이 매우 길다.

from statsmodels.formula.api import ols

 

이럴 때는

1) statsmodels import

2) dir() 함수를 사용하여 단계별로 조회한다.

import statsmodels
print(dir(statsmodels))

그러면 statsmodels에서 사용할 수 있는 모듈 리스트가 나오는데, 이중에서 우리가 사용할 formula도 뜨는 것을 확인할 수 있다.

(볼드 및 색상 변경은 값을 보여주기 위함)

['__all__', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__path__', '__spec__', '__version__', '__version_info__', '__version_tuple__', '_version', 'base', 'compat', 'debug_warnings', 'discrete', 'distributions', 'duration', 'emplike', 'formula', 'gam', 'genmod', 'graphics', 'iolib', 'monkey_patch_cat_dtype', 'regression', 'robust', 'stats', 'test', 'tools']

 

그러면 기존의 dir 함수에 formula도 붙여서 다시 호출

print(dir(statsmodels.formula))

 

불러와야 할 api 모듈이 확인된다.

['PytestTester', '__all__', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__path__', '__spec__', 'api', 'formulatools', 'handle_formula_data', 'test']

 

역시 기존의 dir() 함수에 api도 붙이고 다시 호출

print(dir(statsmodels.formula.api))

ols는 ordinary least squares 즉, 일반 최소제곱법 회귀분석을 수행하는 함수로, 

기본적으로 일반 선형 회귀분석(ordinary least squares regression)을 위한 함수이지만, 그 결과를 활용하여 분산분석(ANOVA, Analysis of Variance)에도 널리 사용 된다.

['__all__', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', 'conditional_logit', 'conditional_mnlogit', 'conditional_poisson', 'gee', 'glm', 'glmgam', 'gls', 'glsar', 'logit', 'mixedlm', 'mnlogit', 'negativebinomial', 'nominal_gee', 'ols', 'ordinal_gee', 'phreg', 'poisson', 'probit', 'quantreg', 'rlm', 'wls'

 

이 결과를 토대로

모듈과 함수를 정확히 불러오면 된다.

from statsmodels.formula.api import ols

다음 내용

 

728x90
반응형