TOP
class="layout-aside-left paging-number">
본문 바로가기
728x90

빅데이터 시험17

[ADsP] 시험 후기 (독학) 24년 5월 11일 (토) 드디어 또 하나의 시험이 끝났다.시험 결과 24년 5월 31일 사전 점수합격 예정!시험 공부 관련 요약 공부 기간: 약 1주일공부 방법: 기출 문제 풀이, 유튜브 인강, 기존 정리 자료 솔직히 공부는 그전 시험들 (SQLD, 빅분기 필기) 대비 열심히 하지 않았다.첫째로, 빅분기필기 공부할 때 몸을 갈아 넣으며 준비했더니 시험 끝나고 번아웃이 좀 왔다. (거기에다 불합격, 심지어 점수는 합격인데 과락으로 떨어졌으니...)둘째로, 중간에 거의 열흘 간 중국 상해 출장을 다녀왔다. 물론 공부를 해야 한다는 생각에 기존 빅분기 자료를 가져갔지만... (+ 방을 혼자 써서 공부하기에 환경도 좋았다) 중국어를 다시 해야 한다는 핑계로 중국 드라마에 빠져 공부는 뒷전이었다.셋째로, 사랑니.. 2024. 5. 11.
[빅분기 필기] 자주 헷갈리는 개념 [1과목]★ 프라이버시 보호모델(비식별화 조치) - k-익명성: 주어진 데이터 집합에서 같은 값이 적어도 k개 이상 존재하도록 하여 쉽게 다른 정보로 결합할 수 없게 하는 모델 ▶ 공개된 데이터에 대한 연결 취약성을 방어하나, 동질성 공격과 배경지식에 의한 공격에 취약 - l-다양성: 주어진 데이터 집합에서 함께 비식별 되는 레코드들은 적어도 l개의 서로 다른 민감한 정보를 가져야 하는 모델 ▶ 동질성 공격, 배경지식에 의한 공격을 방어하나, 쏠림 공격과 유사성 공격에 취약 - t-근접성: 동질 집합에서 특정 정보의 분포와 전체 데이터 집합에서 정보의 분포가 t이하의 차이를 보여야 하는 모델 ▶ 쏠림 공격과 유사성 공격을 방어 - m-유일성: 원본 데이터와 동일한 속성 값의 조합이 비식별 결과 데이터에 .. 2024. 4. 2.
[빅데이터 분석기사] 4과목 기출문제 ★ K-Fold에 대한 설명으로 옳지 않은 것은? 1. 데이터를 K개로 나눈다. 2. 1개는 훈련 데이터, (K-1)개는 검증 데이터로 사용 3. K번 반복 수행 4. 결과를 K에 다수결 또는 평균으로 분석 ★ 다음 중 비복원 추출을 이용한 교차 검증 방법은? 1. Bootstrap 2. Holdout Cross Validation 3. K-Fold Cross Validation 4. Leave-One-Out Cross Validation ★ 다음 중 주어진 자료에서 단순 랜덤 복원추출 방법을 활용하여 동일한 크기의 표본을 여러 개 생성하는 샘플링 방법은? 1. 모수 유의성 검정 2. 부트스트랩 3. 랜덤 샘플링 4. 홀드 아웃 교차 검증 ★ 10개의 샘플 데이터를 LpOCV (Leave-p-Out Cr.. 2024. 3. 29.
[빅데이터 분석기사] 3과목 기출문제 ★ 두 개 이상의 집단 간 비교를 수행하고자 할 때 집단내의 분산, 총 평균과 각 집단의 평균 차이에 의해 생긴 집단 간 분산 비교로 얻은 분포를 이용하여 가설검정을 수행하는 방법을 의미하는 분석 기법은? 1. 상관 분석 (CA) 2. 회귀 분석 (RA) 3. 분산 분석 (AV) 4. 주성분 분석 (PCA) ★ 다음 중 초매개변수 (Hyper Parameter)로 설정 가능한 것은? 1. 편향 (Variance) 2. 기울기 (Bias) 3. 서포트 벡터(Support Vector) 4. 은닉층 (Hidden Layer) 수 ★ 다음 중 초매개변수 사례로 가장 부적절한 것은? 1. 신경망 학습에서 학습률 2. 서포트 벡터 머신에서의 코스트값인 C 3. KNN에서 K의 개수 4. 선형 회귀나 로지스틱 분석.. 2024. 3. 29.
[빅데이터 분석기사] 2과목 기출문제 ★ EDA의 4가지 주제에 대한 설명으로 가장 알맞지 않은 것은? 1. 저항성: 수집된 자료에 오류점, 이상값이 있을 때에도 영향을 적게 받는 성질 2. 잔차: 관찰 값들이 주 경향으로부터 얼마나 벗어난 정도 3. 자료의 재표현: 데이터 분석과 해석을 단순화할 수 있도록 원원래 변수를 적당한 척도로 바꾸는 것 4. 현시성: 로그 변환, 제곱근 변환, 역수 변환 등을 통해 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달하는 과정 ★ 다음 중 정제 과정에서 수행하는 내용은? 1. 데이터의 결측값을 처리하고 데이터 탐색 2. 수집된 데이터 통합 3. 데이터를 분석 목적에 맞게 데이터 검증 4. ETL 프로그램 개발 ★ 이상값을 찾는 방법으로 옳지 않은 것은? 1. 단변량이면 박스플롯(Box.. 2024. 3. 29.
[빅데이터 분석기사] 1과목 기출 문제 ★ 다음 중 진단 분석에 대한 설명으로 가장 적합한 것은? 1. 과거에 어떤 일이 일어났고 현재는 무슨 일이 일어나고 있는지? 2. 데이터를 기반으로 왜 발생했는지? 3. 무슨 일이 일어날 것인지? 4. 어떤 대응을 해야 하는지? ★ 다음 중 머신러닝, 빅데이터 분석으로 미래 혹은 알려지지 않은 결과를 분석하는 기법으로 가장 알맞은 것은? 1. Prescriptive Analytics 2. Predictive Analytics 3. Descriptive Analytics 4. Diagnostic Analytics★ 1제타바이트에 1 byte 에 아스키코드를 넣을 수 있는 수의 크기는? 1. 2의 10승 2. 2의 30승 3. 2의 50승 4. 2의 70승★ 다음 중 지식에 대한 예시로 가장 적절한 것은?.. 2024. 3. 29.
728x90