TOP
class="layout-aside-left paging-number">
본문 바로가기
728x90

빅데이터 시험17

[ADsP] 시험 후기 (독학) 24년 5월 11일 (토) 드디어 또 하나의 시험이 끝났다.시험 결과 24년 5월 31일 사전 점수합격 예정!시험 공부 관련 요약 공부 기간: 약 1주일공부 방법: 기출 문제 풀이, 유튜브 인강, 기존 정리 자료 솔직히 공부는 그전 시험들 (SQLD, 빅분기 필기) 대비 열심히 하지 않았다.첫째로, 빅분기필기 공부할 때 몸을 갈아 넣으며 준비했더니 시험 끝나고 번아웃이 좀 왔다. (거기에다 불합격, 심지어 점수는 합격인데 과락으로 떨어졌으니...)둘째로, 중간에 거의 열흘 간 중국 상해 출장을 다녀왔다. 물론 공부를 해야 한다는 생각에 기존 빅분기 자료를 가져갔지만... (+ 방을 혼자 써서 공부하기에 환경도 좋았다) 중국어를 다시 해야 한다는 핑계로 중국 드라마에 빠져 공부는 뒷전이었다.셋째로, 사랑니.. 2024. 5. 11.
[빅분기 필기] 자주 헷갈리는 개념 [1과목]★ 프라이버시 보호모델(비식별화 조치) - k-익명성: 주어진 데이터 집합에서 같은 값이 적어도 k개 이상 존재하도록 하여 쉽게 다른 정보로 결합할 수 없게 하는 모델 ▶ 공개된 데이터에 대한 연결 취약성을 방어하나, 동질성 공격과 배경지식에 의한 공격에 취약 - l-다양성: 주어진 데이터 집합에서 함께 비식별 되는 레코드들은 적어도 l개의 서로 다른 민감한 정보를 가져야 하는 모델 ▶ 동질성 공격, 배경지식에 의한 공격을 방어하나, 쏠림 공격과 유사성 공격에 취약 - t-근접성: 동질 집합에서 특정 정보의 분포와 전체 데이터 집합에서 정보의 분포가 t이하의 차이를 보여야 하는 모델 ▶ 쏠림 공격과 유사성 공격을 방어 - m-유일성: 원본 데이터와 동일한 속성 값의 조합이 비식별 결과 데이터에 .. 2024. 4. 2.
[빅데이터 분석기사] 4과목 기출문제 ★ K-Fold에 대한 설명으로 옳지 않은 것은? 1. 데이터를 K개로 나눈다. 2. 1개는 훈련 데이터, (K-1)개는 검증 데이터로 사용 3. K번 반복 수행 4. 결과를 K에 다수결 또는 평균으로 분석 ★ 다음 중 비복원 추출을 이용한 교차 검증 방법은? 1. Bootstrap 2. Holdout Cross Validation 3. K-Fold Cross Validation 4. Leave-One-Out Cross Validation ★ 다음 중 주어진 자료에서 단순 랜덤 복원추출 방법을 활용하여 동일한 크기의 표본을 여러 개 생성하는 샘플링 방법은? 1. 모수 유의성 검정 2. 부트스트랩 3. 랜덤 샘플링 4. 홀드 아웃 교차 검증 ★ 10개의 샘플 데이터를 LpOCV (Leave-p-Out Cr.. 2024. 3. 29.
[빅데이터 분석기사] 3과목 기출문제 ★ 두 개 이상의 집단 간 비교를 수행하고자 할 때 집단내의 분산, 총 평균과 각 집단의 평균 차이에 의해 생긴 집단 간 분산 비교로 얻은 분포를 이용하여 가설검정을 수행하는 방법을 의미하는 분석 기법은? 1. 상관 분석 (CA) 2. 회귀 분석 (RA) 3. 분산 분석 (AV) 4. 주성분 분석 (PCA) ★ 다음 중 초매개변수 (Hyper Parameter)로 설정 가능한 것은? 1. 편향 (Variance) 2. 기울기 (Bias) 3. 서포트 벡터(Support Vector) 4. 은닉층 (Hidden Layer) 수 ★ 다음 중 초매개변수 사례로 가장 부적절한 것은? 1. 신경망 학습에서 학습률 2. 서포트 벡터 머신에서의 코스트값인 C 3. KNN에서 K의 개수 4. 선형 회귀나 로지스틱 분석.. 2024. 3. 29.
[빅데이터 분석기사] 2과목 기출문제 ★ EDA의 4가지 주제에 대한 설명으로 가장 알맞지 않은 것은? 1. 저항성: 수집된 자료에 오류점, 이상값이 있을 때에도 영향을 적게 받는 성질 2. 잔차: 관찰 값들이 주 경향으로부터 얼마나 벗어난 정도 3. 자료의 재표현: 데이터 분석과 해석을 단순화할 수 있도록 원원래 변수를 적당한 척도로 바꾸는 것 4. 현시성: 로그 변환, 제곱근 변환, 역수 변환 등을 통해 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달하는 과정 ★ 다음 중 정제 과정에서 수행하는 내용은? 1. 데이터의 결측값을 처리하고 데이터 탐색 2. 수집된 데이터 통합 3. 데이터를 분석 목적에 맞게 데이터 검증 4. ETL 프로그램 개발 ★ 이상값을 찾는 방법으로 옳지 않은 것은? 1. 단변량이면 박스플롯(Box.. 2024. 3. 29.
[빅데이터 분석기사] 1과목 기출 문제 ★ 다음 중 진단 분석에 대한 설명으로 가장 적합한 것은? 1. 과거에 어떤 일이 일어났고 현재는 무슨 일이 일어나고 있는지? 2. 데이터를 기반으로 왜 발생했는지? 3. 무슨 일이 일어날 것인지? 4. 어떤 대응을 해야 하는지? ★ 다음 중 머신러닝, 빅데이터 분석으로 미래 혹은 알려지지 않은 결과를 분석하는 기법으로 가장 알맞은 것은? 1. Prescriptive Analytics 2. Predictive Analytics 3. Descriptive Analytics 4. Diagnostic Analytics★ 1제타바이트에 1 byte 에 아스키코드를 넣을 수 있는 수의 크기는? 1. 2의 10승 2. 2의 30승 3. 2의 50승 4. 2의 70승★ 다음 중 지식에 대한 예시로 가장 적절한 것은?.. 2024. 3. 29.
[빅데이터 분석기사] 3과목 기출문제 오답노트 ★ 두 개 이상의 집단 간 비교를 수행하고자 할 때 집단내의 분산, 총 평균과 각 집단의 평균 차이에 의해 생긴 집단 간 분산 비교로 얻은 분포를 이용하여 가설검정을 수행하는 방법을 의미하는 분석 기법은? 1. 상관 분석 (CA) ▶ 두 개 이상의 변수 간에 존재하는 상호 연관성의 정도를 측정하여 분석하는 방법 2. 회귀 분석 (RA) ▶ 하나 이상의 독립변수들이 종속변수에 미치는 영향을 추정할 수 있는 통계기법 3. 분산 분석 (AV) 4. 주성분 분석 (PCA) ▶ 많은 변수의 분산방식 (분산-공분산)의 패턴을 간결하게 표현하는 주성분 변수를 원래 변수의 선형 결합으로 추출하는 통계 기법 ★ 다음 중 초매개변수 (Hyper Parameter)로 설정 가능한 것은? 1. 편향 (Variance) 2. .. 2024. 3. 24.
[빅데이터 분석기사] 2과목 기출문제 오답노트 ★ EDA의 4가지 주제에 대한 설명으로 가장 알맞지 않은 것은? 1. 저항성: 수집된 자료에 오류점, 이상값이 있을 때에도 영향을 적게 받는 성질 2. 잔차: 관찰 값들이 주 경향으로부터 얼마나 벗어난 정도 3. 자료의 재표현: 데이터 분석과 해석을 단순화할 수 있도록 원원래 변수를 적당한 척도로 바꾸는 것 4. 현시성: 로그 변환, 제곱근 변환, 역수 변환 등을 통해 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달하는 과정 ▶ 로그 변환, 제곱근 변환, 역수 변환 등은 자료의 재표현에 관한 내용 특징(주제) 내용 저항성 (Resistance) - 수집된 자료에 오류점, 이상값이 있을 때에도 영향을 적게 받는 성질 (탐색적 데이터 분석은 저항성이 큰 통계적 데이터 이용) 잔차(Res.. 2024. 3. 23.
[경영정보시각화 능력] 필기 접수 어느덧 경영정보 시각화 능력 필기 접수 기간이 다가왔다. (1차 - 3월 18일부터 3월 24일 / 2차 - 4월 17일부터 4월 23일) 시험일자는 5월 18일 (발표일자는 6월 18일) 경영정보시각화능력의 시행처는 대한상공회의소 이므로, 먼저 대한상공회의소 자격평가사업단 홈페이지에 접속한다. 대한상공회의소 자격평가사업단 license.korcham.net 그리고, 상단 [개별접수] - [시험접수] - 로그인을 하고 (대한상공회의소에서 마지막으로 시험본 게 유통관리사 2급인데, 10년이 넘었어서 계정정보가 기억이 안 났다... 이런 거 그냥 다 간편로그인 설정 되어있으면 너무 좋으련만ㅠㅠ 네이버랑 카톡 연동 너무 좋은데 말이지.) 로그인을 하고, 응시종목을 선택하고 다음 클릭 실기 소프트웨어는 아무래도.. 2024. 3. 19.
[빅데이터 분석기사] 3과목 빅데이터 모델링(3-2-2) [목차] [빅데이터 분석기사] 시험 과목 및 주요 내용 (필기)빅데이터 분석기사 (필기) 시험 과목 및 주요 내용 출처: 데이터자격검정 (dataq.or.kr) 필기과목명 주요항목 세부항목 세세항목 빅데이터 분석 기획 빅데이터의 이해 빅데이터 개요 및 활용 빅데이puppy-foot-it.tistory.com빅데이터 모델링 - 분석 기법 적용1. 범주형 자료 분석독립변수와 종속변수가 모두 범주형 데이터 (명목형/순서형) 이거나 둘 중 하나가 범주형 데이터일 때 사용각 집단 간의 비율 차이를 비교하기 위해 사용하며, 독립변수와 종속변수의 척도에 따라 분석 기법 다름독립변수종속변수분석 방법범주형범주형- 분할표 분석 - 카이제곱 검정 - 피셔의 정확 검정범주형수치형- T-검정 (독립변수 2개 이하) - 분산 분.. 2024. 3. 14.
[빅분기 기출문제] 오답노트 ★ 비식별화된 개인정보의 재식별 가능성 검토 기법으로 적절하지 않은 것은? 1. s-보안성 2. k-익명성 3. l-다양성 4. t-근접성 ▶ 비식별화된 개인정보의 재식별 가능성 검토 기법: k-익명성, l-다양성, t-근접성 정답은 1 ★ 데이터 변환 방식의 종류로 적절하지 않은 것은? 1.비정형 데이터를 정형 데이터 형태로 저장하는 방식 2. TCP 방식에서 Open API로 수집하여 저장하는 방식 3. 수집 데이터를 분산파일시스템으로 저장하는 방식 4. 주제별, 시계열적으로 저장하는 방식 ▶ TCP 방식에 Open API로 수집하여 저장하는 방식은 데이터 변환 방식의 종류가 아니라 데이터를 수집하는 방식을 변경하는 것 정답은 2 ★ 데이터 적재 완료 테스트를 위한 정형 데이터 체크리스트 항목으로 적.. 2024. 3. 14.
[빅데이터 분석기사] 2과목 빅데이터 탐색(1-2) [목차] [빅데이터 분석기사] 시험 과목 및 주요 내용 (필기)빅데이터 분석기사 (필기) 시험 과목 및 주요 내용 출처: 데이터자격검정 (dataq.or.kr) 필기과목명 주요항목 세부항목 세세항목 빅데이터 분석 기획 빅데이터의 이해 빅데이터 개요 및 활용 빅데이puppy-foot-it.tistory.com빅데이터 탐색 - 데이터 탐색1. 변수 선택(1) 변수 개념데이터 모델에서 사용하는 예측을 수행하는 데 사용되는 입력변수RDBMS에서 '속성(열)' 이라고 부르는 것을 머신러닝에서는 통계학의 영향으로 변수라고 지칭(2) 유형 - 독립변수 / 종속변수 ㄱ. 독립변수종속변수(결과변수)의 값에 영향을 미쳐 종속변수가 특정한 값을 갖게 되는 원인이 된다고 가정한 변수연구자가 의도적으로 변화시키는 변수기계 학습.. 2024. 3. 12.
[빅데이터 분석기사] 1과목 빅데이터 분석 기획 (3-1-1) [목차] [빅데이터 분석기사] 시험 과목 및 주요 내용 (필기)빅데이터 분석기사 (필기) 시험 과목 및 주요 내용 출처: 데이터자격검정 (dataq.or.kr) 필기과목명 주요항목 세부항목 세세항목 빅데이터 분석 기획 빅데이터의 이해 빅데이터 개요 및 활용 빅데이puppy-foot-it.tistory.com빅데이터 분석 기획 - 데이터 수집 및 저장 계획1. 데이터 수집(1) 수집 데이터 대상유형설명분야내부 데이터-조직 (인프라) 내부에 데이터가 위치하며, 데이터 담당자와 수집 주기 및 방법 등을 협의하여 데이터를 수집 - 내부 조직 간 협의를 통한 데이터 수집 - 주로 수집이 용이한 정형 데이터 - 서비스의 수명 주기 관리가 용이서비스 (SCM, ERP, CRM, 포털 등)네트.. 2024. 3. 11.
[빅데이터 분석기사] 1과목 빅데이터 분석 기획 (2-2) [목차] [빅데이터 분석기사] 시험 과목 및 주요 내용 (필기) 빅데이터 분석기사 (필기) 시험 과목 및 주요 내용 출처: 데이터자격검정 (dataq.or.kr) 필기과목명 주요항목 세부항목 세세항목 빅데이터 분석 기획 빅데이터의 이해 빅데이터 개요 및 활용 빅데이 puppy-foot-it.tistory.com 빅데이터 분석 기획 - 데이터 분석 계획 1. 데이터 확보 계획 (1) 데이터 획득 방안 수립 내외부의 다양한 시스템으로부터 정형/비정형/반정형 데이터를 수집하기 위한 구체적 방안 수립 내부 데이터 획득에는 부서 간 업무협조와 개인정보보호 및 정보보안과 관련된 문제점을 사전에 점검 외부 데이터 획득은 시스템 간 다양한 인터페이스 및 법적인 문제점을 고려하여 상세한 데이터 획득 계획 수립 (2) 데.. 2024. 3. 11.
[빅데이터 분석기사] 1과목 빅데이터 분석 기획 (2-1) [목차] [빅데이터 분석기사] 시험 과목 및 주요 내용 (필기) 빅데이터 분석기사 (필기) 시험 과목 및 주요 내용 출처: 데이터자격검정 (dataq.or.kr) 필기과목명 주요항목 세부항목 세세항목 빅데이터 분석 기획 빅데이터의 이해 빅데이터 개요 및 활용 빅데이 puppy-foot-it.tistory.com 빅데이터 분석 기획 - 데이터 분석 계획 1. 분석 로드맵 설정 (1) 개념 분석 단계별로 추진하고자 하는 목표를 명확히 정의하고, 선-후행 단계를 고려해 단계별 추진내용을 정렬하는 종합적인 계획 (2) 단계 데이터 분석체계 도입 → 데이터 분석 유효성 검증 → 데이터분석 확산 및 고도화 단계 추진과제 추진목표 데이터 분석체계 도입 - 분석 기회 발굴 - 분석 과제 정의 - 로드맵 수립 - 비즈니.. 2024. 3. 11.
728x90