728x90 빅분기 시험15 [빅분기 필기] 출제 빈도 높은 기출 오답 노트 1. KDD 분석 방법론 분석절차데이터셋 선택(Selection) → 데이터 전처리(Preprocessing) → 데이터 변환(Transformation) → 데이터마이닝(Data Mining) → 데이터마이닝 결과 평가(Interpretation/ Evaluation) 2. 빅데이터 활용에 필요한 3요소자원, 기술, 인력 3. SEMMA 분석 방법론추출(Sample) → 탐색 (Explore) → 수정 (Modify) → 모델링 (Modeling) → 평가 (Assessment) 4. 분석 방법론의 구성요건상세한 절차, 방법, 도구와 기법, 템플릿과 산출물, 지식 5. 빅데이터 저장시스템 선정을 위한 분석 요소기능성 비교분석, 분석방식 및 환경, 분석대상 데이터 유형, 기존 시스템과의 연계성 6. .. 2024. 4. 4. [빅분기 필기] 자주 헷갈리는 개념 [1과목]★ 프라이버시 보호모델(비식별화 조치) - k-익명성: 주어진 데이터 집합에서 같은 값이 적어도 k개 이상 존재하도록 하여 쉽게 다른 정보로 결합할 수 없게 하는 모델 ▶ 공개된 데이터에 대한 연결 취약성을 방어하나, 동질성 공격과 배경지식에 의한 공격에 취약 - l-다양성: 주어진 데이터 집합에서 함께 비식별 되는 레코드들은 적어도 l개의 서로 다른 민감한 정보를 가져야 하는 모델 ▶ 동질성 공격, 배경지식에 의한 공격을 방어하나, 쏠림 공격과 유사성 공격에 취약 - t-근접성: 동질 집합에서 특정 정보의 분포와 전체 데이터 집합에서 정보의 분포가 t이하의 차이를 보여야 하는 모델 ▶ 쏠림 공격과 유사성 공격을 방어 - m-유일성: 원본 데이터와 동일한 속성 값의 조합이 비식별 결과 데이터에 .. 2024. 4. 2. [빅데이터 분석기사] 2과목 기출문제 ★ EDA의 4가지 주제에 대한 설명으로 가장 알맞지 않은 것은? 1. 저항성: 수집된 자료에 오류점, 이상값이 있을 때에도 영향을 적게 받는 성질 2. 잔차: 관찰 값들이 주 경향으로부터 얼마나 벗어난 정도 3. 자료의 재표현: 데이터 분석과 해석을 단순화할 수 있도록 원원래 변수를 적당한 척도로 바꾸는 것 4. 현시성: 로그 변환, 제곱근 변환, 역수 변환 등을 통해 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달하는 과정 ★ 다음 중 정제 과정에서 수행하는 내용은? 1. 데이터의 결측값을 처리하고 데이터 탐색 2. 수집된 데이터 통합 3. 데이터를 분석 목적에 맞게 데이터 검증 4. ETL 프로그램 개발 ★ 이상값을 찾는 방법으로 옳지 않은 것은? 1. 단변량이면 박스플롯(Box.. 2024. 3. 29. [빅데이터 분석기사] 1과목 기출 문제 ★ 다음 중 진단 분석에 대한 설명으로 가장 적합한 것은? 1. 과거에 어떤 일이 일어났고 현재는 무슨 일이 일어나고 있는지? 2. 데이터를 기반으로 왜 발생했는지? 3. 무슨 일이 일어날 것인지? 4. 어떤 대응을 해야 하는지? ★ 다음 중 머신러닝, 빅데이터 분석으로 미래 혹은 알려지지 않은 결과를 분석하는 기법으로 가장 알맞은 것은? 1. Prescriptive Analytics 2. Predictive Analytics 3. Descriptive Analytics 4. Diagnostic Analytics★ 1제타바이트에 1 byte 에 아스키코드를 넣을 수 있는 수의 크기는? 1. 2의 10승 2. 2의 30승 3. 2의 50승 4. 2의 70승★ 다음 중 지식에 대한 예시로 가장 적절한 것은?.. 2024. 3. 29. [빅데이터 분석기사] 3과목 기출문제 오답노트 ★ 두 개 이상의 집단 간 비교를 수행하고자 할 때 집단내의 분산, 총 평균과 각 집단의 평균 차이에 의해 생긴 집단 간 분산 비교로 얻은 분포를 이용하여 가설검정을 수행하는 방법을 의미하는 분석 기법은? 1. 상관 분석 (CA) ▶ 두 개 이상의 변수 간에 존재하는 상호 연관성의 정도를 측정하여 분석하는 방법 2. 회귀 분석 (RA) ▶ 하나 이상의 독립변수들이 종속변수에 미치는 영향을 추정할 수 있는 통계기법 3. 분산 분석 (AV) 4. 주성분 분석 (PCA) ▶ 많은 변수의 분산방식 (분산-공분산)의 패턴을 간결하게 표현하는 주성분 변수를 원래 변수의 선형 결합으로 추출하는 통계 기법 ★ 다음 중 초매개변수 (Hyper Parameter)로 설정 가능한 것은? 1. 편향 (Variance) 2. .. 2024. 3. 24. [빅데이터 분석기사] 2과목 기출문제 오답노트 ★ EDA의 4가지 주제에 대한 설명으로 가장 알맞지 않은 것은? 1. 저항성: 수집된 자료에 오류점, 이상값이 있을 때에도 영향을 적게 받는 성질 2. 잔차: 관찰 값들이 주 경향으로부터 얼마나 벗어난 정도 3. 자료의 재표현: 데이터 분석과 해석을 단순화할 수 있도록 원원래 변수를 적당한 척도로 바꾸는 것 4. 현시성: 로그 변환, 제곱근 변환, 역수 변환 등을 통해 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달하는 과정 ▶ 로그 변환, 제곱근 변환, 역수 변환 등은 자료의 재표현에 관한 내용 특징(주제) 내용 저항성 (Resistance) - 수집된 자료에 오류점, 이상값이 있을 때에도 영향을 적게 받는 성질 (탐색적 데이터 분석은 저항성이 큰 통계적 데이터 이용) 잔차(Res.. 2024. 3. 23. [빅데이터 분석기사] 4과목 기출문제 오답노트 ★ K-Fold에 대한 설명으로 옳지 않은 것은? 1. 데이터를 K개로 나눈다. 2. 1개는 훈련 데이터, (K-1)개는 검증 데이터로 사용 ▶ 1개는 평가 데이터, (K-1) 개는 훈련 데이터 3. K번 반복 수행 4. 결과를 K에 다수결 또는 평균으로 분석 ▶ K-Fold Cross Validation: 데이터 집합을 무작위로 동일 크기를 갖는 부분 집합으로 나누고, 그중 1개 집합을 평가 데이터로 (Test SET), 나머지 (K-1) 개 집합을 훈련 데이터 (Training Set)로 선정하여 분석 모형을 평가하는 기법. 모든 데이터를 훈련과 평가에 사용할 수 있으며, K번 반복 수행하며, K값이 증가하면 수행 시간과 계산량도 많아짐. ★ 다음 중 비복원 추출을 이용한 교차 검증 방법은? 1. B.. 2024. 3. 19. [빅데이터 분석기사] 3과목 빅데이터 모델링(3-2-1) [목차] [빅데이터 분석기사] 시험 과목 및 주요 내용 (필기)빅데이터 분석기사 (필기) 시험 과목 및 주요 내용 출처: 데이터자격검정 (dataq.or.kr) 필기과목명 주요항목 세부항목 세세항목 빅데이터 분석 기획 빅데이터의 이해 빅데이터 개요 및 활용 빅데이puppy-foot-it.tistory.com빅데이터 모델링 - 분석 기법 적용1. 회귀 분석(1) 회귀 분석독립변수와 종속변수 간에 선형적인 관계를 도출해서 하나 이상의 독립변수들이 종속변수에 미치는 영향을 분석하고, 독립변수를 통해 종속변수를 에측하는 분석 기법독립변수와 종속변수 간에 인과관계가 있다는 말은 독립변수가 원인이 되어 종속변수에 영향을 미친다는 의미이며, 그런 의미에서 독립변수를 원인변수(혹은 설명 변수), 종속변수를 결과변수 (.. 2024. 3. 14. [빅데이터 분석기사] 2과목 빅데이터 탐색(1-1) [목차] [빅데이터 분석기사] 시험 과목 및 주요 내용 (필기) 빅데이터 분석기사 (필기) 시험 과목 및 주요 내용 출처: 데이터자격검정 (dataq.or.kr) 필기과목명 주요항목 세부항목 세세항목 빅데이터 분석 기획 빅데이터의 이해 빅데이터 개요 및 활용 빅데이 puppy-foot-it.tistory.com 빅데이터 탐색 - 데이터 탐색 1. 데이터 정제 (1) 데이터 전처리의 중요성 전처리 결과가 분석 결과에 직접적인 영향을 주고 있어서 전처리는 반복적으로 수행해야 함 데이터 분석의 단계 중 가장 많은 시간이 소요되는 단계 데이터 정제 → 결측값 처리 → 이상값 처리 → 분석 변수 처리 순서로 진행 데이터 분석 과정에서 반드시 거쳐야 하는 과정 (2) 데이터 정제 데이터 정제: 결측값을 채우거나 이.. 2024. 3. 12. [빅데이터 분석기사] 1과목 빅데이터 분석 기획 (3-1-3) [목차] [빅데이터 분석기사] 시험 과목 및 주요 내용 (필기) 빅데이터 분석기사 (필기) 시험 과목 및 주요 내용 출처: 데이터자격검정 (dataq.or.kr) 필기과목명 주요항목 세부항목 세세항목 빅데이터 분석 기획 빅데이터의 이해 빅데이터 개요 및 활용 빅데이 puppy-foot-it.tistory.com 빅데이터 분석기획 - 데이터 수집 및 저장 계획 4. 데이터 품질 검증 (1) 데이터 품질 특성 ㄱ. 데이터 품질 요소와 품질 전략 정확성: 데이터 사용 목적에 따라 데이터 정확성의 기준을 다르게 적용 완전성: 필요한 데이터의 완전한 확보보다는 필요한 데이터를 식별하는 수준으로 적용 가능 적시성: 소멸성이 강한 데이터에 대해 어느 정도의 품질 기준을 적용할 것인지를 결정 일관성: 같은 데이터라 할.. 2024. 3. 12. [빅데이터 분석기사] 1과목 빅데이터 분석 기획 (3-1-2) [목차] [빅데이터 분석기사] 시험 과목 및 주요 내용 (필기)빅데이터 분석기사 (필기) 시험 과목 및 주요 내용 출처: 데이터자격검정 (dataq.or.kr) 필기과목명 주요항목 세부항목 세세항목 빅데이터 분석 기획 빅데이터의 이해 빅데이터 개요 및 활용 빅데이puppy-foot-it.tistory.com빅데이터 분석 기획 - 데이터 수집 및 저장 계획2. 데이터 유형 및 속성 파악(1) 데이터 유형 [구조관점] 1) 정형 데이터정형화된 스키마 구조 기반의 형태를 가지고 고정된 필드에 저장되며 값과 형식에서 일관성을 가지는 데이터컬럼과 로우 구조를 가지며, 설계된 구조 기반 목적에 맞는 정보들종류: 관계형 데이터베이스, 스프레드시트2) 반정형 데이터스키마 구조 형태를 가지고 메.. 2024. 3. 11. [빅데이터 분석기사] 1과목 빅데이터 분석 기획 (3-1-1) [목차] [빅데이터 분석기사] 시험 과목 및 주요 내용 (필기)빅데이터 분석기사 (필기) 시험 과목 및 주요 내용 출처: 데이터자격검정 (dataq.or.kr) 필기과목명 주요항목 세부항목 세세항목 빅데이터 분석 기획 빅데이터의 이해 빅데이터 개요 및 활용 빅데이puppy-foot-it.tistory.com빅데이터 분석 기획 - 데이터 수집 및 저장 계획1. 데이터 수집(1) 수집 데이터 대상유형설명분야내부 데이터-조직 (인프라) 내부에 데이터가 위치하며, 데이터 담당자와 수집 주기 및 방법 등을 협의하여 데이터를 수집 - 내부 조직 간 협의를 통한 데이터 수집 - 주로 수집이 용이한 정형 데이터 - 서비스의 수명 주기 관리가 용이서비스 (SCM, ERP, CRM, 포털 등)네트.. 2024. 3. 11. [빅데이터 분석기사] 1과목 빅데이터 분석 기획 (2-2) [목차] [빅데이터 분석기사] 시험 과목 및 주요 내용 (필기) 빅데이터 분석기사 (필기) 시험 과목 및 주요 내용 출처: 데이터자격검정 (dataq.or.kr) 필기과목명 주요항목 세부항목 세세항목 빅데이터 분석 기획 빅데이터의 이해 빅데이터 개요 및 활용 빅데이 puppy-foot-it.tistory.com 빅데이터 분석 기획 - 데이터 분석 계획 1. 데이터 확보 계획 (1) 데이터 획득 방안 수립 내외부의 다양한 시스템으로부터 정형/비정형/반정형 데이터를 수집하기 위한 구체적 방안 수립 내부 데이터 획득에는 부서 간 업무협조와 개인정보보호 및 정보보안과 관련된 문제점을 사전에 점검 외부 데이터 획득은 시스템 간 다양한 인터페이스 및 법적인 문제점을 고려하여 상세한 데이터 획득 계획 수립 (2) 데.. 2024. 3. 11. [빅데이터 분석기사] 1과목 빅데이터 분석 기획 (1-2) [목차] [빅데이터 분석기사] 시험 과목 및 주요 내용 (필기) 빅데이터 분석기사 (필기) 시험 과목 및 주요 내용 출처: 데이터자격검정 (dataq.or.kr) 필기과목명 주요항목 세부항목 세세항목 빅데이터 분석 기획 빅데이터의 이해 빅데이터 개요 및 활용 빅데이 puppy-foot-it.tistory.com 빅데이터 분석기획 - 빅데이터의 이해 1. 빅데이터 플랫폼 (1) 개념 빅데이터에서 가치를 추출하기 위해 일련의 과정 (수집 > 저장 > 분석 > 활용)을 규격화한 기술 특화된 분석을 지원하는 빅데이터 플랫폼 발전 추세 (의료, 환경, 범죄, 자동차 등) (2) 계층 구조 계층 설명 소프트웨어 계층 데이터 처리 및 분석 엔진, 데이터 수집 및 정제 모듈, 서비스 관리 모듈, 사용자 괸리모듈, 모니.. 2024. 3. 10. [빅데이터분석기사] 1과목 - 빅데이터 분석 기획 (1-1) [목차]<figure data-ke-type="opengraph" data-og-title="[빅데이터 분석기사] 시험 과목 및 주요 내용 (필기)" data-ke-align="alignCenter" data-og-description="빅데이터 분석기사 (필기) 시험 과목 및 주요 내용 출처: 데이터자격검정 (dataq.or.kr) 필기과목명 주요항목 세부항목 세세항목 빅데이터 분석 기획 빅데이터의 이해 빅데이터 개요 및 활용 빅데이" data-og-host="puppy-foot-it.tistory.com" data-og-source-url="htt.. 2024. 3. 10. 이전 1 다음 728x90