TOP
class="layout-aside-left paging-number">
본문 바로가기
프로그래밍 및 기타/통계학, 마케팅, 상식+

정준상관분석 (Canonical Correlation Analysis)이란?

by 기록자_Recordian 2024. 4. 5.
728x90
반응형
정준상관분석(CCA)이란?

 

두 개 이상의 변수로 구성되어 있는 종속 변수와 두 개 이상으로 구성되어 있는 독립 변수 사이의 관계를 보는 기법.

종속 변수와 독립 변수들의 선형식을 각각 구하고 이로부터 상관관계를 계산한다. 종속 변수들 사이에 상관성이 있어 별개의 변수로 분리하기 힘들 경우에 이용한다.

 

정준상관분석에서 두 변수 집단 사이의 상관성을 구하기 위해서 상관계수를 이용한다.

 

회귀분석에서는 두 집단의 변수들의 관계모형을 만들 때 한 집단에는 하나의 변수가 있고 다른 집단에는 몇 개의 변수가 있으나, 각 집단에 여러개의 변수들이 속해 있을 때 이 두 집단의 관계모형을 만들고자 하면 각 집단에서 변수들의 선형결합을 만들때 이 두 선형관계들의 상관계수가 최대가 되도록 하는 방법이다.

 

몇 개의 변수들이 집단으로 관측된 두 집단 사이의 연관성을 구하는 통계분석 방법

이를테면, 신체적 조건(키, 몸무게, 가슴둘레)과 운동력(달리기, 윗몸 일으키기, 턱걸이) 사이의 선형 상관 관계가 있는지, 있다면 어떤 관계가 있는지 분석하는 것을 정준상관분석의 예로 볼 수 있다.

 

특징
  • 정준상관분석은 먼저 변수 집단을 종속 변수 집단과 설명 변수 집단으로 나눈다. 그리고 두 변수 집단의 선형 결합을 고려하고 그 많은 선형 결합 중에서 두 변수 집단의 상관 구조를 잘 설명하는 선형 결합을 찾게 된다.
  • 상관구조는 각 변수 집단에서 만들어진 두 선형 결합 간 상관 계수를 의미하며 상관 구조를 잘 설명한다는 것은 상관 계수를 최대화 한다는 것을 의미한다
  • 다변량 회귀 분석 방법은 종속 변수 집단의 일반적인 선형 결합은 고려하지 않으나, 정준상관분석은 두 집단의 선형 결합을 고려한다.
  • 정준상관분석은 두 변수 집단의 상관 구조를 잘 설명하는 종속 변수의 선형 결합과 설명 변수의 선형 결합을 찾는 것을 목표로 한다.
  • 정준상관분석은 기존 변수의 상관성을 분석하여 기존 변수들의 의미 또는 영향력을 해석한다.

 

정준상관계수

 

상관 계수가 독립된 두 변량 x와 y의 변동 관계를 표현하는 것이라고 하면, 정준 상관 계수라는 것은 두 변량 집단 xi와 yi의 변동의 관계를 표현하는 것이라 할 수 있다.

 

 


출처: 네이버 지식백과, 부자 되고픈 꽁냥이 티스토리 블로그, 

728x90
반응형