TOP
본문 바로가기
728x90

프로그래밍 및 기타143

정준상관분석 (Canonical Correlation Analysis)이란? 정준상관분석(CCA)이란? 두 개 이상의 변수로 구성되어 있는 종속 변수와 두 개 이상으로 구성되어 있는 독립 변수 사이의 관계를 보는 기법. 종속 변수와 독립 변수들의 선형식을 각각 구하고 이로부터 상관관계를 계산한다. 종속 변수들 사이에 상관성이 있어 별개의 변수로 분리하기 힘들 경우에 이용한다. 정준상관분석에서 두 변수 집단 사이의 상관성을 구하기 위해서 상관계수를 이용한다. 회귀분석에서는 두 집단의 변수들의 관계모형을 만들 때 한 집단에는 하나의 변수가 있고 다른 집단에는 몇 개의 변수가 있으나, 각 집단에 여러개의 변수들이 속해 있을 때 이 두 집단의 관계모형을 만들고자 하면 각 집단에서 변수들의 선형결합을 만들때 이 두 선형관계들의 상관계수가 최대가 되도록 하는 방법이다. 몇 개의 변수들이 집.. 2024. 4. 5.
[하둡 에코시스템] Hadoop Ecosystem 하둡 에코 시스템 (Hadoop Ecosystem)하둡 에코시스템: 대규모 데이터 처리를 위한 여러 오픈 소스 프로젝트의 모음 하둡 에코시스템에 대해 설명하기 전에, "하둡" 이라는 것에 대해 먼저 간단히 짚고 넘어갈 필요가 있다.하둡 (Hadoop) 하둡은 여러 개의 저렴한 컴퓨터를 마치 하나인 것처럼 묶어 대용량 데이터를 처리하는 기술이다. 하둡은 수천대의 분산된 x86 장비에 대용량 파일을 저장할 수 있는 기능을 제공하는 분산파일 시스템과, 저장된 파일 데이터를 분산된 서버의 CPU와 메모리 자원을 이용해 쉽고 빠르게 분석할 수 있는 컴퓨팅 플랫폼인 맵리듀스로 구성돼 있다.※ 출처: [네이버 지식백과] 하둡 [Hadoop] - 빅데이터가 '하둡'을 찾는 까닭 (용어로 보는 IT, 이지영)빅데이터 시.. 2024. 3. 15.
[개인정보보호법 주요 내용] ㄱ. 개인정보 보호 원칙(제3조) ① 개인정보처리자는 개인정보의 처리 목적을 명확하게 하여야 하고 그 목적에 필요한 범위에서 최소한의 개인정보만을 적법하고 정당하게 수집하여야 한다. ② 개인정보처리자는 개인정보의 처리 목적에 필요한 범위에서 적합하게 개인정보를 처리하여야 하며, 그 목적 외의 용도로 활용하여서는 아니 된다. ③ 개인정보처리자는 개인정보의 처리 목적에 필요한 범위에서 개인정보의 정확성, 완전성 및 최신성이 보장되도록 하여야 한다. ④ 개인정보처리자는 개인정보의 처리 방법 및 종류 등에 따라 정보주체의 권리가 침해받을 가능성과 그 위험 정도를 고려하여 개인정보를 안전하게 관리하여야 한다. ⑤ 개인정보처리자는 제30조에 따른 개인정보 처리방침 등 개인정보의 처리에 관한 사항을 공개하여야 하며,.. 2024. 3. 15.
메타인지(Metacognition) 란? 메타인지 (Metacognition) 란? 메타인지(Metacognition) 또는 상위인지는 자신의 인지 과정에 대해 한 차원 높은 시각에서 관찰 · 발견 · 통제 · 판단하는 정신 작용으로 '인식에 대한 인식', '생각에 대한 생각', '다른 사람의 의식에 대해 의식', 그리고 고차원의 생각하는 기술이다. 메타인지는 자신이 무엇을 알고 무엇을 모르는지 아는 것, 자신의 생각(인지)에 대해 판단하는 자기 인지 능력을 뜻한다. 우리 자신의 사고능력을 바라보는 또 하나의 눈, 메타인지 메타인지란, 자신의 인지적 활동에 대한 지식과 조절을 의미하는 것으로 내가 무엇을 알고 모르는지에 대해 아는 것에서부터 자신이 모르는 부분을 보완하기 위한 계획과 그 계획의 실행과정을 평가하는 것에 이르는 전반을 의미한다. .. 2024. 3. 6.
ML / DL 이란? ML (Machine Learning, 머신러닝)기계학습법, 많은 데이터를 컴퓨터에 입력하고 비슷한 것끼리 분류하도록 하는 기술인공지능 연구 분야 중 하나로, 인간의 학습 능력과 같은 기능을 컴퓨터에서 실현하는 기술1990년대 중반 이후에 인터넷의 등장으로 방대한 데이터를 수집할 수 있게 되면서 수많은 빅데이터를 분석해 인공지능 시스템 스스로 학습하는 형태로 진화빅데이터 핵심 기술로 각광새로운 데이터가 입력됐을 때 과거의 학습 경험을 토대로 이를 이해하고 분석함으로써 다가올 변화를 예측 가능데이터가 포함한 내용의 특징을 포함하는 데는 한계 ▶ 딥러닝이 고안되면서 문제 해결과거에는 데이터를 처리할 수 있는 컴퓨팅 성능의 한계가 있었으나, 최근 기술 수준이 빠르게 발전하면서 머신 러닝을 구현하기 위한 방대한.. 2024. 3. 5.
SEO(Search-Engine Optimization) 란? 업무 메일에 항상 'SEO' 관련 스팸메일이 쌓여 있어 지우다가 SEO에 대해 글을 남기면 좋을 거 같아 글을 남긴다. SEO (Search-Engine Optimization): 검색엔진 최적화 검색엔진으로부터 어떤 웹사이트에 도달하는 트래픽의 양과 질을 개선하는 작업. 흔히 어떤 사이트가 검색 결과에 빨리 나타날수록 (순위가 더 높을수록) 사용자들이 그 사이트를 클릭할 가능성이 커진다. 또한, SEO는 이미지 검색, 지역 검색, 구체적 업종에 대한 검색 등 여러 종류의 검색을 목표로 삼는다. 즉, 검색엔진 최적화는 검색엔진에서 내 글이 잘 발견될 수 있도록 조정하는 작업 을 말한다. 사람들이 잘 방문하지 않는다면, SEO부터 사람들이 자료나 제품을 검색할 때 주로 구글, 네이버 등의 검색엔진에서 검색.. 2024. 2. 27.
728x90