[빅분기 실기] 제10회 빅데이터분석기사 실기 후기
이전 내용
[빅분기 실기] 9회 기출문제 1유형: melt 안 쓰고 더 쉽게 풀기
이전 내용 [빅분기 실기] 모듈의 뒷부분 이름이 기억나지 않을 때이전 내용 [빅분기 실기] 작업형 3유형: groom 체험 문제 풀이이전 내용 [빅분기 실기] 작업형 1유형 판다스 중요 문법 정리이전 내
puppy-foot-it.tistory.com
제10회 빅데이터분석기사 실기 시험 후기
드디어, 빅데이터분석기사 실기시험을 치르면서, 2년간의 빅데이터분석기사와의 대장정이 끝이 났다.
(과연 끝이 났을까.. 났겠지)
작년 8회 시험에 60점이지만 과락으로 떨어진 후, 10회 필기시험을 준비해서 합격 후 실기시험을 치르기까지 많은 시간이 흘렀다.
10회 필기 때도 그랬지만,
이번 실기 시험때도 느낌이 좋다. (물론 점수가 공개될 때까지는 확신할 수 없지만)
어쨌든, 기분 좋은 마음으로 이번 실기 시험에 대한 후기를 적어보려 한다.
시험 준비 방법
실기 시험 준비를 위해 실기시험 책 구입, 유튜브 영상 시청, 데이터마님 블로그 들어가서 문제 풀기 등 여러 방법을 시도해봤는데, 그중에서 가장 효과있었던 것은 실기시험 책을 구입해서 여러 번 반복해 본 것이다.
필자는 시나공에서 나온 유튜버 '퇴근후 딴짓'님이 만든 빅데이터분석기사 실기 책 2026년 버전을 구입해서 공부했는데, 너무나도 큰 도움이 됐다. (그러나 정작 해당 유튜브 채널 영상은 안 봤다.)
특히, 시험이 얼마 남지 않았을 때는 마지막에 나오는 지난 기출 문제 풀어보는 섹션을 풀어보면서 모르는 부분을 메모해서 정리하는 방법으로 공부를 했는데 이게 효과가 있었다.

시험 프로그램인 구름 (groom.io)은 2-3번 정도 사용해보고, 계속 구글 Colab으로 공부했다. (코드 자동 생성, AI 등 모든 기능 끄기)
각 유형에 대해서는
1유형의 경우, 문제를 다 풀어보면서 내가 헷갈려했거나, 몰랐던 부분을 정리해서 급할 때 볼 수 있도록 따로 정리를 했고
2유형의 경우엔,
- 문제가 뭐가 됐건 랜덤포레스트(회귀, 분류)를 사용
- object 변수의 unique 개수를 확인한 후, 5 이상이면 무조건 레이블 인코딩 사용
- 회귀는 결정계수(r2_score), 분류는 정확도(accuracy_score)를 평가지표에 같이 사용해서 모델을 비교적 객관적으로 평가하기
- .shape 를 데이터 로드, 인코딩 후, 인코딩 후 데이터 분할 시, 검증 데이터분할 시, 최종 예측 모델 구현 후 등에 적극 활용해서 데이터셋이 망가지지는 않았는지 수시로 확인하기
의 방식으로 공부했던 거 같다.
3유형의 경우, 처음에 큰일났다 싶었지만, 이 역시 2유형과 마찬가지로 반복적으로 학습하고 어떤 모듈의 함수만 불러오는지 외우면 됐기 때문에 나중엔 좀 수월하게 느껴졌다.
- 로지스틱회귀: logit
- 분산분석, 선형회귀: ols
- 세 가지 전부 statsmodels.formula.api 활용 & model.params, model.pvalues, model.predict 외우기
- 독립표본검정, 대응표본검정, 단일표본검정: ttest (_ind, _rel, _1samp) 정도로만 외워두고 dir이나 help 적극 활용하기
- 카이제곱 검정: chisquare, chi2_contingency 외워두고 dir이나 help 적극 활용하기
정도로 생각하고 최대한 많은 문제를 풀어보려 했다.
[1유형 정리]
[빅분기 실기] 작업형 1유형 판다스 중요 문법 정리
[2유형 정리]
[빅분기 실기] 작업형 2유형 : 머신러닝
[3유형 정리]
[빅분기 실기] 작업형 3유형 요약
9회차 기출문제와 멘붕
처음에는 1유형과 2유형만 잘 외우고, 3유형은 포기하자는 식으로 생각했었는데, 기출 문제를 거듭할수록 1유형이 가장 복병이었다. 시험 전까지 교재에 나와있는 2회부터 8회차까지의 기출문제를 풀어보는데 1유형의 난이도가 회차를 거듭할수록 상승하는 느낌이었지만 큰 문제가 없어서 합격하겠다 싶었는데, 9회차를 풀어보는 순간 멘붕이 와버렸다.
특히 1유형의 문제2번 (검거율 구하는 문제) 이 너무 어려웠어서 몇 번을 반복해서 풀어봤던 거 같다.
시험 전날밤에는 늦은 밤까지 8회차와 9회차 문제를 핸드폰을 켜놓고 시간을 체크해 가면서 풀어봤다. (둘 다 각 1시간 15분 내외로 풀었던 거 같다.)
25년 6월 21일 시험 당일
아침 6시 20분쯤 일어나서 씻고 밥을 먹고 준비를 마친 후, 7시부터 9회차 문제를 한 번 더 풀어보고 갔다.

이번에도 다 풀어보는데 1시간 10분 정도가 걸렸다.

시험은 주안에 있는 직업전문학교로 보러 갔는데, 입실 시간보다 일찍 도착해서 해당 건물 1층에 있는 카페에서 같이 시험을 보는 형님과 얘기를 나누다 들어갔다.


시험 장에 도착하니, 입실 시간이 안 되어 9층 로비에는 많은 분들이 계셨다.

입실시간 (9시 10분이었나..?)이 되어 시험을 보는 고사장으로 입실했는데, 솔직히 시험보는 환경이 좀 열악해서 걱정스러웠다. 마우스는 잘 될지, 인터넷은 잘 될지 하는 걱정이 앞서고 괜히 긴장감이 더 높아졌다.


시험은 10시에 정확히 시작했고,
시험을 보다가 공지사항이라면서 갑자기 팝업으로 2-3번 뭐가 떠서 시험보는 게 다운 먹은지 알고 식겁했었다..
아무래도 문제에 몇 가지 오류가 있어 급하게 수정하느라 그랬던 거 같다.
아무튼, 개인적인 생각으로는 9회차 기출문제보다 난이도는 낮았던 거 같고, 문제를 제대로 써서 제출했는지 확인만 하고는 퇴실 가능 시간(11시 30분)이 된 후 고사실에서 제일 먼저 나왔다.
10회 빅분기 실기 문제
생각나는 문제는
1유형
1) 소문제 정답률 구하기
이건 정확히 기억은 안 나지만, groupby, unstack과 stack을 활용해서 데이터프레임 형태를 소문제, 정답, 응답 의 컬럼 형태로 만들고 df['정답률'] = df['정답'] / df['응답'] 으로 하여 정답률을 구해놓고 풀었던 거 같다.
2) 연월 매출액 구하기
▶ pd.to_datetime 으로 날짜를 형변환 시킨 후, to_period('M') 으로 연월 타입만 출력하여 새로운 컬럼에 넣고, groupby 와 unstack을 활용해서 풀었던 거 같다.
3) 단어개수 구해서 평균값 낸 뒤, 차이 계산하기
▶ str.split(' ') 으로 '내용' 컬럼을 띄어쓰기로 분리한 다음
str.len() 하면 '내용' 컬럼 내의 각 행의 단어 수가 나오므로 이를 이용해 평균값 계산
2유형
가스 사용량 예측하기 (회귀 문제)
▶ 처음에 레이블 인코딩 후 랜덤포레스트회귀를 사용한 다음 결정계수를 봤더니 0.60대가 나와서 원-핫 인코딩 후 랜덤포레스트를 해서 0.61대가 나와서 원-핫 인코딩 + 랜덤포레스트회귀의 조합으로 제출
3유형
1) 로지스틱 회귀 문제
▶ from statsmodels.formula.api import logit 사용하기
print(model.summary()) , model.params, model.pvalues 등 기존에 연습했을 때 사용하던 패턴과 크게 다르지 않았다.
2) 다중선형회귀 문제
▶ from statsmodels.formula.api import ols 사용하기
print(model.summary()) , model.params, model.pvalues 등 기존에 연습했을 때 사용하던 패턴과 크게 다르지 않았다.
였던 거 같다.
1유형 1번의 경우, 갑자기 공지가 떠서 말이 많은데, 나도 공지 확인을 제대로 못해서 오답처리 될 거 같다.
역시나 데이터 카페에 들어가보니, 이슈가 된 거 같다.
문제를 애초에 이슈가 없게 잘 냈어야지, 시험 도중에 갑자기 바꿔버리는 건 옳지 못하다고 생각한다. 그래서 문제 수정 전의 정답과, 문제 수정 후의 정답 둘 다 맞도록 처리해줘야 하는 게 맞다고 본다.

자신은 100점이었는데, 아마 시험 도중 바뀐 문제로 인해 100점은 어려울 거 같다. (입방정 좀...)
시험이 끝나고
시험을 마치고 로비에서 형님을 기다리다 형님과 같이 시험의 답안에 대한 리뷰를 하며
점심으로 곱창 전골과 머릿고기 수육을 맛있게 먹었다.

감사하게도 형님이 사주셔서 더 맛있게 먹었다.

역시나, 빅분기 필기 때도 그랬지만 시험 준비를 하며 열심히 살았더니 긴장이 풀려서 금세 지치는 거 같았다.
그래서 집가서 쉬면서 밀린 집안일도 하다가 저녁엔 아내랑 같이 아내가 예전에 좋아했던 아웃닭 이라는 곳에가서 회포를 풀며 좋은 시간을 보냈다.

시험 준비를 하면서 확실히 머신러닝 모델을 구축하는 기본적인 방법에 대해 숙지할 수 있어 좋은 경험이었다.
다만, 실무에서 사용하려면 하이퍼 파라미터 튜닝 및 다양한 모델에 관해서 더 공부해야 할 거 같다.
다음 내용