TOP
본문 바로가기
728x90

[파이썬 Projects]/<파이썬 - 수학 | 통계학>43

[개발자를 위한 수학] 로지스틱 회귀와 분류 - 1 로지스틱 회귀(logistic regression) 하나 이상의 독립 변수가 주어졌을 때 결과의 확률을 예측하는 알고리즘. 로지스틱은 선형 회귀와 유사하게 선형 방정식을 기반으로 하지만, 선형 회귀와는 달리 실수가 아닌 범주를 예측하는 분류 알고리즘이다. (회귀는 예측 결과가 실수인지 범주인지를 기준으로 구분 되며, 회귀는 실수, 분류는 범주로 구분 된다.)로지스틱 회귀는 이산형 (이진수 1 또는 0) 또는 범주형(정수)인 출력 변수를 위해 훈련되며, 확률 형태의 연속형 값을 출력하지만 임곗값을 사용해 이산형 값으로 변환할 수 있다.로지스틱 회귀는 구현하기 쉽고 이상치와 기타 데이터 문제에 상당히 탄력적이기 때문에 로지스틱 회귀를 사용하면 많은 머신러닝 문제를 잘 해결할 수 있으며, 다른 유형의 지도 학.. 2024. 10. 18.
[파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.9)-2 ★ 시작에 앞서 ★ 해당 내용은 ', 다산출판사, 2024' 에 나와있는 챕터별 연습문제를 교재를 응용하여 풀이하고, 수학적인 문제에 대한 답변을 파이썬으로 구현해보기 위해 작성하는 글이다.해당 답변을 구현하는 방식은 답안지 없이 필자가 스스로 구현하는 것이므로, 정확한 (혹은 가장 효과적인) 답변이 아닐 수 있다. 이 글의 목적은 통계학 공부와 파이썬 프로그래밍 언어 공부를 동시에 하고자 함이며, 통계학을 공부하고 싶으신 분들은 해당 교재를 구매하는 것을 추천한다.또한, 연습문제 번호 및 문제 내용은 필자가 임의대로 작성하였으며, 교재와는 다를 수 있다. 잘못된 부분이 있다면 언제든 피드백 부탁 드립니다! 감사합니다이전 내용 [파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.9)-1★ 시작에 앞서.. 2024. 10. 18.
[파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.9)-1 ★ 시작에 앞서 ★ 해당 내용은 ', 다산출판사, 2024' 에 나와있는 챕터별 연습문제를 교재를 응용하여 풀이하고, 수학적인 문제에 대한 답변을 파이썬으로 구현해보기 위해 작성하는 글이다.해당 답변을 구현하는 방식은 답안지 없이 필자가 스스로 구현하는 것이므로, 정확한 (혹은 가장 효과적인) 답변이 아닐 수 있다. 이 글의 목적은 통계학 공부와 파이썬 프로그래밍 언어 공부를 동시에 하고자 함이며, 통계학을 공부하고 싶으신 분들은 해당 교재를 구매하는 것을 추천한다.또한, 연습문제 번호 및 문제 내용은 필자가 임의대로 작성하였으며, 교재와는 다를 수 있다. 잘못된 부분이 있다면 언제든 피드백 부탁 드립니다! 감사합니다챕터 9 주요 개념 [추론통계학]모집단 전체를 분석하는 것은 시간적, 경제적 제약 등으로.. 2024. 10. 17.
[개발자를 위한 수학] 선형 회귀 - 3 이전 내용 [개발자를 위한 수학] 선형 회귀 - 2이전 내용 [개발자를 위한 수학] 선형회귀 - 1선형 회귀(linear regression)  데이터 과학과 통계학의 핵심인 선형 회귀는 관측 데이터에 맞는 직선을 훈련하고, 이를 통해 변수 간의 선형 관계를 보puppy-foot-it.tistory.com추정 표준 오차 - 제곱 오차 합(Sum of squared error, SSE): 잔차를 제곱하고 합산하는 방식으로 선형 회귀의 전체 오차를 측정하는 방법. - 추정 평균 오차(Standard error of the estimate): 제곱한 값을 제곱근을 사용해 원래 단위로 다시 조정한 뒤, 이 값을 평균한 값.★ n - 2 를 사용하는 것은, 단순 선형 회귀에는 변수가 하나가 아니라 두 개 이기 때.. 2024. 10. 17.
[개발자를 위한 수학] 선형 회귀 - 2 이전 내용 [개발자를 위한 수학] 선형회귀 - 1선형 회귀(linear regression)  데이터 과학과 통계학의 핵심인 선형 회귀는 관측 데이터에 맞는 직선을 훈련하고, 이를 통해 변수 간의 선형 관계를 보여주고 새로운 데이터에 대한 예측을 만든다.puppy-foot-it.tistory.com과대적합 및 분산 선형 회귀 외에 제곱 합의 값이 0이 되도록 손실을 최소화하는 방법 중 하나는 단순히 모든 포인트를 지나는 곡선을 찾는 것이다. 포인트 사이를 연결하여 회귀를 수행하면 손실은 0이 된다.그러나 이런 포인트 연결 모델은 심하게 과대적합(overfitting) 되었는데, 즉 훈련 데이터에만 너무 정확하게 맞아서 새로운 데이터에 대해 제대로 예측하지 못한다.이 모델은 다른 데이터에서 멀리 떨어져 있.. 2024. 10. 16.
[개발자를 위한 수학] 선형회귀 - 1 선형 회귀(linear regression)  데이터 과학과 통계학의 핵심인 선형 회귀는 관측 데이터에 맞는 직선을 훈련하고, 이를 통해 변수 간의 선형 관계를 보여주고 새로운 데이터에 대한 예측을 만든다. 입력 변수가 하나일 경우 선형 회귀는 직선의 방정식을 훈련하고, 두 개면 평면의 방정식을, 세 개 이상이면 초평면의 방정식을 훈련한다.- 회귀: 관측 데이터에서 어떤 함수를 훈련한 다음 새로운 데이터에 대한 예측을 만드는 방법.기본 선형 회귀  간단한 데이터 셋으로 복잡한 기법을 이해할 수 있으면 복잡한 데이터 없이도 알고리즘의 강점과 한계를 파악할 수 있다. 선형 상관관계가 나타난다는 의미는,변수 중 하나가 증가 (또는 감소)하면 다른 변수도 대략 이에 비례해 증가 (또는 감소) 한다는 것이고, 이.. 2024. 10. 16.
728x90