TOP
class="layout-aside-left paging-number">
본문 바로가기
728x90

[파이썬 Projects]/<파이썬 - 수학 | 통계학>43

[개발자를 위한 수학] 기술 통계: z 점수(+파이썬) 기술 통계 이전 내용  [개발자를 위한 수학] 기술 통계: 평균, 분산, 정규 분포(+파이썬)기술 통계 평균, 중앙값, 모드, 차트, 종, 곡선을 계산하거나 데이터를 설명하기 위한 통계.측정이나 실험에서 수집한 자료(data)의 정리, 요약, 해석, 표현 등을 통해 자료의 특성을 규명puppy-foot-it.tistory.comz 점수 표준 정규 분포(standard normal distribution): 평균이 0이고 표준 편차가 1이 되도록 정규 분포의 크기를 재조정하는 것. 이렇게 하면 평균과 분산이 다른 경우에도 정규 분포 간의 퍼짐 정도를 쉽게 비교할 수 있다.표준 정규 분포에서 특히 중요한 것은 모든 x값을 표준 편차, 즉 z 점수로 표현한다는 점이며, 공식은 아래와 같다. 예를 들어, 서로 .. 2024. 10. 6.
[개발자를 위한 수학] 기술 통계: 평균, 분산, 정규 분포(+파이썬) 기술 통계 평균, 중앙값, 모드, 차트, 종, 곡선을 계산하거나 데이터를 설명하기 위한 통계.측정이나 실험에서 수집한 자료(data)의 정리, 요약, 해석, 표현 등을 통해 자료의 특성을 규명하는 통계적 방법 ◆ 평균과 가중 평균-  평균(mean): 어떤 값 집합을 평균한 값. 값을 모두 더한 다음, 값의 개수로 나누면 된다. [파이썬으로 평균 계산하기]# 파이썬으로 평균 계산하기sample = [1, 3, 2, 5, 7, 0, 2, 3]mean = sum(sample)/len(sample)print(mean) 평균의 두 가지 버전인 표본 평균과 모집단 평균은 다음과 같이 표현한다.※ ∑ (시그마) 는 모든 항목을 더한다는 의미이며, n과 N은 각각 표본과 모집단 크기를 나타내지만, 수학적으로 같은 의.. 2024. 10. 5.
[파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.2) - 3 ★ 시작에 앞서 ★ 해당 내용은 ', 다산출판사, 2024' 에 나와있는 챕터별 연습문제를 교재를 응용하여 풀이하고, 수학적인 문제에 대한 답변을 파이썬으로 구현해보기 위해 작성하는 글이다.해당 답변을 구현하는 방식은 답안지 없이 필자가 스스로 구현하는 것이므로, 정확한 (혹은 가장 효과적인) 답변이 아닐 수 있다. 이 글의 목적은 통계학 공부와 파이썬 프로그래밍 언어 공부를 동시에 하고자 함이며, 통계학을 공부하고 싶으신 분들은 해당 교재를 구매하는 것을 추천한다.또한, 연습문제 번호 및 문제 내용은 필자가 임의대로 작성하였으며, 교재와는 다를 수 있다.이전 내용 [파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.2) - 2★ 시작에 앞서 ★ 해당 내용은 ', 다산출판사, 2024' 에 나와있는 .. 2024. 10. 5.
[파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.2) - 2 ★ 시작에 앞서 ★ 해당 내용은 ', 다산출판사, 2024' 에 나와있는 챕터별 연습문제를 교재를 응용하여 풀이하고, 수학적인 문제에 대한 답변을 파이썬으로 구현해보기 위해 작성하는 글이다.해당 답변을 구현하는 방식은 답안지 없이 필자가 스스로 구현하는 것이므로, 정확한 (혹은 가장 효과적인) 답변이 아닐 수 있다. 이 글의 목적은 통계학 공부와 파이썬 프로그래밍 언어 공부를 동시에 하고자 함이며, 통계학을 공부하고 싶으신 분들은 해당 교재를 구매하는 것을 추천한다.또한, 연습문제 번호 및 문제 내용은 필자가 임의대로 작성하였으며, 교재와는 다를 수 있다.이전 내용 [파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.2) - 1★ 시작에 앞서 ★  해당 내용은 ', 다산출판사, 2024' 에 나와있는.. 2024. 10. 4.
[파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.2) - 1 ★ 시작에 앞서 ★  해당 내용은 ', 다산출판사, 2024' 에 나와있는 챕터별 연습문제를 교재를 응용하여 풀이하고, 수학적인 문제에 대한 답변을 파이썬으로 구현해보기 위해 작성하는 글이다.해당 답변을 구현하는 방식은 답안지 없이 필자가 스스로 구현하는 것이므로, 정확한 (혹은 가장 효과적인) 답변이 아닐 수 있다. 이 글의 목적은 통계학 공부와 파이썬 프로그래밍 언어 공부를 동시에 하고자 함이며, 통계학을 공부하고 싶으신 분들은 해당 교재를 구매하는 것을 추천한다.또한, 연습문제 번호 및 문제 내용은 필자가 임의대로 작성하였으며, 교재와는 다를 수 있다.챕터2 주요 개념: 도수분포표, 상대빈도수, 누적 빈도챕터2 연습문제 1 Q1. A 고등학교 36명의 영어 점수를 입력하고, 다음 물음에 답하는 코드.. 2024. 10. 4.
[개발자를 위한 수학] 확률 - 이항 분포, 베타 분포 (+파이썬) 이항 분포(binomial distribution) 파이썬에서 구현하기 이항 분포는 확률이 p일 때 n번의 시도 중 k 번이 성공할 가능성을 측정한다. 만약, 새로운 컴퓨터 비전 모델을 개발 중이고 10번의 테스트를 했으며, 그 결과로 8번의 성공과 2번의 실패가 있었다고 가정해본다. 그러나 어떤 머신러닝 엔지니어가 더 많은 테스트를 해야 한다고 주장하며, 테스트를 더 많이 하면 90% 이상의 성공률이 나올 수 있을 거라 했다. 그렇다면 '기본 확률이 90%라고 가정할 때 80% 성공에 대한 가능도를 어떻게 결정하는가'를 계산할 때 이항 분포를 사용할 수 있다. 이항 분포를 파이썬에서 사이파이의 binom.pmf() 함수를 사용해 0에서 10까지의 이항 분포에 대한 11가지 이항 분포 확률을 모두 출력한.. 2024. 10. 4.
[개발자를 위한 수학] 확률 (+파이썬) 확률 확률은 어떤 사건이 일어날 확실성을 측정하는 이론적 연구 분야이다. 어떤 사건이 일어날 것이라고 믿는 정도를 말하며, 종종 백분로 확률을 표현한다. 확률의 예동전을 10번 던져서 앞면이 7번 나올 확률선거에서 승리할 가능성비행기 스케줄이 지연될 확률제품에 결함이 있는지 얼마나 확신하는가위의 예 중 하나인, 동전을 10번 던져서 앞면이 7번 나올 확률이 만약 10% 라고 한다면, 여기서 확률은 P(X) 라고 하며, X는 관심 대상인 사건이다. 확률은 주로 0.0에서 1.0 사이의 소수로 값을 표시하는데, 이 경우에는 확률이 10% 라고 언급했기 때문에 이는 0.1이 된다.◆ 확률과 가능도의 차이 - 1- 확률: 아직 일어나지 않은 사건에 대학 예측을 정량화하는 것. (미래)- 가능도(likelihoo.. 2024. 10. 4.
[통계학] 자료 정리 - 2 이전 내용 [통계학] 자료 정리 - 1변수와 자료 ◆ 변수: 연구자의 관심 대상이 되는 성격 또는 속성. (변하는 수)'변수'란 키, 몸무게, 지능지수, 나이 등과 같이 연구대상들이 서로 다르게 나타나는 속성을 말한다.   ◆ 자료: puppy-foot-it.tistory.com등급의 수와 구간의 결정 질적 자료의 경우에는 도수분포표를 만들 때에는 등급의 수를 몇 개로 할 것인지, 등급의 구간을 어떻게 정할 것인지는 문제가 되지 않는다.그러나, 양적 자료에서는 분석자의 목적에 따라 등급의 수와 구간의 수를 무한히 다양한 방법으로 정할 수 있기 때문에, 등급의 수와 구간을 얼마로 설정할 것이냐의 문제가 언제나 제기된다.등급의 수: 자료의 성격을 정확하게 파악하기 위해서는 등급의 수가 많아야 하며, 개략적으.. 2024. 10. 3.
[통계학] 자료 정리 - 1 변수와 자료 ◆ 변수: 연구자의 관심 대상이 되는 성격 또는 속성. (변하는 수)'변수'란 키, 몸무게, 지능지수, 나이 등과 같이 연구대상들이 서로 다르게 나타나는 속성을 말한다.   ◆ 자료: 관찰이나 연구의 목적에 따라 변수를 관찰하여 기록한 결과자료 그 자체만으로는 의미 있는 정보를 제공해 주지 못하기 때문에, 수집된 자료를 의미 있는 방식으로 분류 및 정리하는 것이 중요하다. 단, 자료를 정리하는 방법이나 정리된 자료를 분석하는 방법은 자료의 종류에 따라 다르다.변수와 자료의 종류 - 양적 변수(quantitative variable): 수치로 나타낼 수 있는 것. (기업의 매출액, 시험 점수 등)- 질적 변수(qualitative variable): 수치로 나타낼 수 없는 것. (종교, 성별,.. 2024. 10. 2.
[개발자를 위한 수학] 미분, 적분 (+파이썬) 미분 미분(derivative)은 함수의 기울기를 나타내며 함수의 어느 지점에서의 변화율을 측정하는 데 유용하다. 또한 미분은 머신러닝과 수학 알고리즘, 특히 경사 하강법에 사용된다. 경사 하강법을 간단히 말하자면, 기울기가 0이면 출력 변수의 최솟값 또는 최댓값에 도달했음을 의미한다. [파이썬 머신러닝] 경사 하강법(GD, gradient descent)경사하강법 경사하강법(GD, gradient descent)은 여러 종류의 문제에서 최적의 해법을 찾을 수 있는 일반적인 최적화 알고리즘이다. 경사 하강법의 기본 아이디어는 비용 함수를 최소화하기 위해 반puppy-foot-it.tistory.com 이 개념은 선형 회귀, 로지스틱 회귀, 신경망 등을 배울 때 매우 유용하다.f(x) = x^2 함수의 그.. 2024. 10. 2.
[개발자를 위한 수학] 로그, 자연로그, 오일러 수 (+파이썬) 로그 로그(logarithm)는 특정 수와 밑이 있을 때 거듭제곱 횟수를 구하는 수학 함수이다. 로그는 실제로 지진 측정, 스트레오 음량 관리 등 다양하게 사용되며, 어디에나 존재한다. 로그는 머신러닝과 데이터 과학에도 많이 사용되며, 특히 로지스틱 회귀의 핵심이다. '2를 몇 번 제곱하면 8이 되는가?' 라는 질문을 수학적으로 표현하는 방법은 지수에 x를 사용하는 것이다. 이 수학 연산을 로그로 x를 구하는 식으로 표현한다면 아래와 같다.로그는 밑이 2일 때 8이 되는 거듭제곱 횟수를 찾는다. 일반적으로 지수 함수를 로그로 표현하는 공식은 다음과 같다. [파이썬에서 로그 계산하는 방식]# 파이썬에서 로그 계산하기 from math import log #2를 거듭제곱해 8이 되는 지수를 구하라 x = l.. 2024. 10. 2.
[개발자를 위한 수학] 기초수학 (+파이썬) 정수론 숫자를 특정 방식으로 설계한 이유와 숫자 자체에 대해 생각하는 수학의 영역 [숫자 체계] 1. 자연수 양수 - 예. 1, 2, 3, 4 2. 범자연수 자연수 + 0 9보다 큰 숫자에서 비어 있는 열의 자리를 표시하기 위해 개발 3. 정수 범자연수 + 음수의 자연수 음수(-, 마이너스) - 예. -1, -2, -3, -4 음수는 이익과 손실을 측정하는 재무 분야에서 유용 4. 유리수 분수로 표현할 수 있는 모든 숫자 + 유한소수 + 정수 유리수는 비율로 나타낼 수 있기 때문에 유비수 라고도 부름. 시간, 자원 등을 언제나 이산적인 단위로 측정할 수 없으므로 유리수가 필요 예 - 3/4, 6.5, 2/1=2 5. 무리수 분수로 표현할 수 없으며, 소수점 자릿수가 무한대로 늘어날 수 있다. 대표적인 무.. 2024. 10. 2.
[통계학] 통계학의 기초개념 ※해당 내용은 다산출판사의 내용을 토대로 작성하였음을 안내드립니다. 통계학이란? 의사결정에서 불확실성을 줄이기 위해 자료를 수집하고 수량화한 뒤, 그 자료를 분석하고 해석하기 위한 학문적 체계를 확립시킨 것.[통계학 개념을 이용한 예]야구 시합: 세이버매트릭스 (야구통계학) - 개인의 성적과 팀의 승패 예측대학수학능력시험 성적의 분포와 특정학과의 합격선 등을 체크▶ 미래의 불확실성을 줄이기 위함 통계학이란,불확실한 상황에서 현명한 의사결정을 하기 위한 이론과 방법의 체계이며, 통계학은 자료의 수집 · 분류 · 분석과 해석의 체계를 갖는다.  또한, 통계학은 불확실한 상황에서 발생하는 모든 자연현상이나 사회현상을 과학적으로 분석하고 예측하는 분석도구로서 광범위하게 이용되고 있으므로, 자연현상과 사회현상을.. 2024. 5. 2.
728x90