TOP
class="layout-aside-left paging-number">
본문 바로가기
728x90

기타 프로그래밍/통계학, 프로그래밍 상식 등11

통계학의 기초개념 ※해당 내용은 다산출판사의 내용을 토대로 작성하였음을 안내드립니다. 통계학이란? 의사결정에서 불확실성을 줄이기 위해 자료를 수집하고 수량화한 뒤, 그 자료를 분석하고 해석하기 위한 학문적 체계를 확립시킨 것.[통계학 개념을 이용한 예]야구 시합: 세이버매트릭스 (야구통계학) - 개인의 성적과 팀의 승패 예측대학수학능력시험 성적의 분포와 특정학과의 합격선 등을 체크▶ 미래의 불확실성을 줄이기 위함 통계학이란,불확실한 상황에서 현명한 의사결정을 하기 위한 이론과 방법의 체계이며, 통계학은 자료의 수집 · 분류 · 분석과 해석의 체계를 갖는다.  또한, 통계학은 불확실한 상황에서 발생하는 모든 자연현상이나 사회현상을 과학적으로 분석하고 예측하는 분석도구로서 광범위하게 이용되고 있으므로, 자연현상과 사회현상을.. 2024. 5. 2.
정준상관분석 (Canonical Correlation Analysis)이란? 정준상관분석(CCA)이란? 두 개 이상의 변수로 구성되어 있는 종속 변수와 두 개 이상으로 구성되어 있는 독립 변수 사이의 관계를 보는 기법. 종속 변수와 독립 변수들의 선형식을 각각 구하고 이로부터 상관관계를 계산한다. 종속 변수들 사이에 상관성이 있어 별개의 변수로 분리하기 힘들 경우에 이용한다. 정준상관분석에서 두 변수 집단 사이의 상관성을 구하기 위해서 상관계수를 이용한다. 회귀분석에서는 두 집단의 변수들의 관계모형을 만들 때 한 집단에는 하나의 변수가 있고 다른 집단에는 몇 개의 변수가 있으나, 각 집단에 여러개의 변수들이 속해 있을 때 이 두 집단의 관계모형을 만들고자 하면 각 집단에서 변수들의 선형결합을 만들때 이 두 선형관계들의 상관계수가 최대가 되도록 하는 방법이다. 몇 개의 변수들이 집.. 2024. 4. 5.
[하둡 에코시스템] Hadoop Ecosystem 하둡 에코 시스템 (Hadoop Ecosystem)하둡 에코시스템: 대규모 데이터 처리를 위한 여러 오픈 소스 프로젝트의 모음 하둡 에코시스템에 대해 설명하기 전에, "하둡" 이라는 것에 대해 먼저 간단히 짚고 넘어갈 필요가 있다.하둡 (Hadoop) 하둡은 여러 개의 저렴한 컴퓨터를 마치 하나인 것처럼 묶어 대용량 데이터를 처리하는 기술이다. 하둡은 수천대의 분산된 x86 장비에 대용량 파일을 저장할 수 있는 기능을 제공하는 분산파일 시스템과, 저장된 파일 데이터를 분산된 서버의 CPU와 메모리 자원을 이용해 쉽고 빠르게 분석할 수 있는 컴퓨팅 플랫폼인 맵리듀스로 구성돼 있다.※ 출처: [네이버 지식백과] 하둡 [Hadoop] - 빅데이터가 '하둡'을 찾는 까닭 (용어로 보는 IT, 이지영)빅데이터 시.. 2024. 3. 15.
[개인정보보호법 주요 내용] ㄱ. 개인정보 보호 원칙(제3조) ① 개인정보처리자는 개인정보의 처리 목적을 명확하게 하여야 하고 그 목적에 필요한 범위에서 최소한의 개인정보만을 적법하고 정당하게 수집하여야 한다. ② 개인정보처리자는 개인정보의 처리 목적에 필요한 범위에서 적합하게 개인정보를 처리하여야 하며, 그 목적 외의 용도로 활용하여서는 아니 된다. ③ 개인정보처리자는 개인정보의 처리 목적에 필요한 범위에서 개인정보의 정확성, 완전성 및 최신성이 보장되도록 하여야 한다. ④ 개인정보처리자는 개인정보의 처리 방법 및 종류 등에 따라 정보주체의 권리가 침해받을 가능성과 그 위험 정도를 고려하여 개인정보를 안전하게 관리하여야 한다. ⑤ 개인정보처리자는 제30조에 따른 개인정보 처리방침 등 개인정보의 처리에 관한 사항을 공개하여야 하며,.. 2024. 3. 15.
ML / DL 이란? ML (Machine Learning, 머신러닝) 기계학습법, 많은 데이터를 컴퓨터에 입력하고 비슷한 것끼리 분류하도록 하는 기술 인공지능 연구 분야 중 하나로, 인간의 학습 능력과 같은 기능을 컴퓨터에서 실현하는 기술 1990년대 중반 이후에 인터넷의 등장으로 방대한 데이터를 수집할 수 있게 되면서 수많은 빅데이터를 분석해 인공지능 시스템 스스로 학습하는 형태로 진화 빅데이터 핵심 기술로 각광 새로운 데이터가 입력됐을 때 과거의 학습 경험을 토대로 이를 이해하고 분석함으로써 다가올 변화를 예측 가능 데이터가 포함한 내용의 특징을 포함하는 데는 한계 ▶ 딥러닝이 고안되면서 문제 해결 과거에는 데이터를 처리할 수 있는 컴퓨팅 성능의 한계가 있었으나, 최근 기술 수준이 빠르게 발전하면서 머신 러닝을 구현하기.. 2024. 3. 5.
728x90