TOP
class="layout-aside-left paging-number">
본문 바로가기
728x90

전체 글623

[파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.4) -2 ★ 시작에 앞서 ★ 해당 내용은 ', 다산출판사, 2024' 에 나와있는 챕터별 연습문제를 교재를 응용하여 풀이하고, 수학적인 문제에 대한 답변을 파이썬으로 구현해보기 위해 작성하는 글이다.해당 답변을 구현하는 방식은 답안지 없이 필자가 스스로 구현하는 것이므로, 정확한 (혹은 가장 효과적인) 답변이 아닐 수 있다. 이 글의 목적은 통계학 공부와 파이썬 프로그래밍 언어 공부를 동시에 하고자 함이며, 통계학을 공부하고 싶으신 분들은 해당 교재를 구매하는 것을 추천한다.또한, 연습문제 번호 및 문제 내용은 필자가 임의대로 작성하였으며, 교재와는 다를 수 있다. 잘못된 부분이 있다면 언제든 피드백 부탁 드립니다! 감사합니다이전 내용 [파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.4)★ 시작에 앞서 ★.. 2024. 10. 8.
[파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.4) -1 ★ 시작에 앞서 ★ 해당 내용은 ', 다산출판사, 2024' 에 나와있는 챕터별 연습문제를 교재를 응용하여 풀이하고, 수학적인 문제에 대한 답변을 파이썬으로 구현해보기 위해 작성하는 글이다.해당 답변을 구현하는 방식은 답안지 없이 필자가 스스로 구현하는 것이므로, 정확한 (혹은 가장 효과적인) 답변이 아닐 수 있다. 이 글의 목적은 통계학 공부와 파이썬 프로그래밍 언어 공부를 동시에 하고자 함이며, 통계학을 공부하고 싶으신 분들은 해당 교재를 구매하는 것을 추천한다.또한, 연습문제 번호 및 문제 내용은 필자가 임의대로 작성하였으며, 교재와는 다를 수 있다. 잘못된 부분이 있다면 언제든 피드백 부탁 드립니다! 감사합니다챕터4 주요 개념: 확률, 집합이론, 독립사건과 종속사건, 베이즈정리 챕터4 연습문제1 .. 2024. 10. 8.
[개발자를 위한 수학] 선형대수학: 고유 벡터와 고윳값 이전 내용 [개발자를 위한 수학] 선형대수학: 연립 방정식과 역행렬이전 내용 [개발자를 위한 수학] 선형대수학: 행렬이전 내용  [개발자를 위한 수학] 선형대수학: 벡터, 선형변환선형대수학 선형대수학(linear algebra): 벡터 공간, 벡터, 선형 변환, 행렬, 연puppy-foot-it.tistory.com고유 벡터와 고윳값 ◆행렬 분해(matrix decomposition)인수 분해처럼 행렬을 기본 구성 요소로 분해하는 것. (인수 분해의 예. 10을 2 * 5로 인수 분해)행렬 분해는 선형 회귀, 역행렬 찾기, 행렬식 계산과 같은 작업에 유용하며, 행렬을 분해하는 방법은 작업에 따라 여러 가지가 있다.그 중 머신러닝과 주성분 분석(PCA, principal component analysis).. 2024. 10. 7.
[개발자를 위한 수학] 선형대수학: 연립 방정식과 역행렬 이전 내용 [개발자를 위한 수학] 선형대수학: 행렬이전 내용  [개발자를 위한 수학] 선형대수학: 벡터, 선형변환선형대수학 선형대수학(linear algebra): 벡터 공간, 벡터, 선형 변환, 행렬, 연립 선형 방정식 등을 연구하는 대수학의 한 분puppy-foot-it.tistory.com연립 방정식과 역행렬 선형대수학의 기본적인 사용 사례는 연립 방정식을 푸는 것이다.다음과 같은 방정식이 주어졌을 때 x, y, z의 해를 구해야 한다고 가정해보자. 4x + 2y + 4z = 445x + 3y + 7z = 569x + 3y + 6z = 72 세 개의 변수를 분리하기 위해 다양한 대수 연산을 직접 실험해 볼 수도 있지만, 컴퓨터로 이 문제를 풀려면 다음과 같이 행렬로 표현해야 한다.계수는 행렬 A로,.. 2024. 10. 7.
[개발자를 위한 수학] 선형대수학: 행렬 이전 내용  [개발자를 위한 수학] 선형대수학: 벡터, 선형변환선형대수학 선형대수학(linear algebra): 벡터 공간, 벡터, 선형 변환, 행렬, 연립 선형 방정식 등을 연구하는 대수학의 한 분야이다. 현대 선형대수학은 그중에서도 벡터 공간이 주 puppy-foot-it.tistory.com행렬(matrix) 행렬은 여러 개의 행과 열을 가질 수 있으며 데이터를 묶는 편리한 방법이다. 행렬은 2차원 이상의 숫자 격자로 표현된 벡터의 집합이다. ◆ 행렬 벡터 곱셈(matrix vector multiplication)기저벡터: 모든 벡터를 만들거나 변환하기 위한 구성 요소. 행렬에 담긴 기저 벡터 i(i햇)과 (j햇)이 있을 때 벡터 v를 변환하는 공식은 다음과 같다.i은 첫 번째 열 [a, c] 이.. 2024. 10. 7.
[개발자를 위한 수학] 선형대수학: 벡터, 선형변환 선형대수학 선형대수학(linear algebra): 벡터 공간, 벡터, 선형 변환, 행렬, 연립 선형 방정식 등을 연구하는 대수학의 한 분야이다. 현대 선형대수학은 그중에서도 벡터 공간이 주 연구 대상이다. 선형대수학은 수학, 통계, 운용 과학, 데이터 과학 및 머신러닝의 여러 응용 분야에 기초를 형성하는데, 머신러닝과 통계 라이브러리를 사용하면 선형대수학을 무조건 배워야 하는 것은 아니지만 이러한 라이브러리 이면의 작동 방식에 대한 직관을 기르고, 데이터를 더 효율적으로 다루려면 선형대수학의 기본을 아는 것이 좋다.벡터(vector)란 무엇인가? 벡터는 공간상에서 특정 방향과 길이를 가진 화살표이며 종종 데이터의 한 조각을 나타낸다. 벡터는 선형대수학의 핵심 구성요소로 여기에는 행렬과 선형 변환도 포함.. 2024. 10. 7.
[파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.3)-2 ★ 시작에 앞서 ★ 해당 내용은 ', 다산출판사, 2024' 에 나와있는 챕터별 연습문제를 교재를 응용하여 풀이하고, 수학적인 문제에 대한 답변을 파이썬으로 구현해보기 위해 작성하는 글이다.해당 답변을 구현하는 방식은 답안지 없이 필자가 스스로 구현하는 것이므로, 정확한 (혹은 가장 효과적인) 답변이 아닐 수 있다. 이 글의 목적은 통계학 공부와 파이썬 프로그래밍 언어 공부를 동시에 하고자 함이며, 통계학을 공부하고 싶으신 분들은 해당 교재를 구매하는 것을 추천한다.또한, 연습문제 번호 및 문제 내용은 필자가 임의대로 작성하였으며, 교재와는 다를 수 있다. 잘못된 부분이 있다면 언제든 피드백 부탁 드립니다! 감사합니다이전 내용 [파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.3)-1★ 시작에 앞서.. 2024. 10. 7.
[파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.3)-1 ★ 시작에 앞서 ★ 해당 내용은 ', 다산출판사, 2024' 에 나와있는 챕터별 연습문제를 교재를 응용하여 풀이하고, 수학적인 문제에 대한 답변을 파이썬으로 구현해보기 위해 작성하는 글이다.해당 답변을 구현하는 방식은 답안지 없이 필자가 스스로 구현하는 것이므로, 정확한 (혹은 가장 효과적인) 답변이 아닐 수 있다. 이 글의 목적은 통계학 공부와 파이썬 프로그래밍 언어 공부를 동시에 하고자 함이며, 통계학을 공부하고 싶으신 분들은 해당 교재를 구매하는 것을 추천한다.또한, 연습문제 번호 및 문제 내용은 필자가 임의대로 작성하였으며, 교재와는 다를 수 있다. 잘못된 부분이 있다면 언제든 피드백 부탁 드립니다! 감사합니다챕터3 주요 개념: 중심경향(최빈값, 중앙값, 산술평균), 분산도(분산, 표준편차), 비.. 2024. 10. 6.
[개발자를 위한 수학] 추론통계: 가설 검정 (+파이썬) 이전 내용 [개발자를 위한 수학] 추론 통계추론 통계 추론 통계는 모집단에 대한 어떤 미지의 양상을 알기 위해 통계학을 이용하여 추측하는 과정을 지칭한다. 추론 통계에서는 표본과 모집단 간의 추상적인 관계가 본격적으로 작동한puppy-foot-it.tistory.com가설 검정 병원 간호사회 자료(하단)에 따르면 코로나19의 회복기간은 평균 13~18일 (중앙값인 15.5)이고, 표준 편차는 1.5일인 정규 분포에 따른다. 이때 특정 기간(12.5일부터 18.5일) 사이에 회복될 확률을 계산해보자. [코로나19 12.5~18.5일 사이 회복될 확률 계산하기]#코로나 19 12.5~18.5일 사이 회복될 확률 계산하기from scipy.stats import norm# 코로나19 회복 기간은 평균 15.5.. 2024. 10. 6.
[개발자를 위한 수학] 추론 통계 추론 통계 추론 통계는 모집단에 대한 어떤 미지의 양상을 알기 위해 통계학을 이용하여 추측하는 과정을 지칭한다. 추론 통계에서는 표본과 모집단 간의 추상적인 관계가 본격적으로 작동한다.추론통계의 목적은 주어진 데이터(sample)을 이용하여 모집단의 특성(모수)를 추론하는 것이다. 주로 추론 통계는 가설검정을 이용하여, 모수를 판단한다.주로, 추론 통계는 1) 가설 설정 -> 2) 데이터 수집 -> 3) 귀무가설의 기각 여부를 결정하는 방법으로 이루어진다. ◆ 중심 극한 정리정규 분포가 유용한 이유 중 하나는 앞서 진행했던 중학생의 몸무게처럼 자연에서 많이 나타나는 현상이기 때문이다. 하지만 정규 분포는 자연 개체군 밖에서 더 흥미롭게 나타나는데, 모집단에서 충분히 많은 표본을 추출하면 해당 모집단이 정.. 2024. 10. 6.
[개발자를 위한 수학] 기술 통계: z 점수(+파이썬) 기술 통계 이전 내용  [개발자를 위한 수학] 기술 통계: 평균, 분산, 정규 분포(+파이썬)기술 통계 평균, 중앙값, 모드, 차트, 종, 곡선을 계산하거나 데이터를 설명하기 위한 통계.측정이나 실험에서 수집한 자료(data)의 정리, 요약, 해석, 표현 등을 통해 자료의 특성을 규명puppy-foot-it.tistory.comz 점수 표준 정규 분포(standard normal distribution): 평균이 0이고 표준 편차가 1이 되도록 정규 분포의 크기를 재조정하는 것. 이렇게 하면 평균과 분산이 다른 경우에도 정규 분포 간의 퍼짐 정도를 쉽게 비교할 수 있다.표준 정규 분포에서 특히 중요한 것은 모든 x값을 표준 편차, 즉 z 점수로 표현한다는 점이며, 공식은 아래와 같다. 예를 들어, 서로 .. 2024. 10. 6.
[개발자를 위한 수학] 기술 통계: 평균, 분산, 정규 분포(+파이썬) 기술 통계 평균, 중앙값, 모드, 차트, 종, 곡선을 계산하거나 데이터를 설명하기 위한 통계.측정이나 실험에서 수집한 자료(data)의 정리, 요약, 해석, 표현 등을 통해 자료의 특성을 규명하는 통계적 방법 ◆ 평균과 가중 평균-  평균(mean): 어떤 값 집합을 평균한 값. 값을 모두 더한 다음, 값의 개수로 나누면 된다. [파이썬으로 평균 계산하기]# 파이썬으로 평균 계산하기sample = [1, 3, 2, 5, 7, 0, 2, 3]mean = sum(sample)/len(sample)print(mean) 평균의 두 가지 버전인 표본 평균과 모집단 평균은 다음과 같이 표현한다.※ ∑ (시그마) 는 모든 항목을 더한다는 의미이며, n과 N은 각각 표본과 모집단 크기를 나타내지만, 수학적으로 같은 의.. 2024. 10. 5.
[파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.2) - 3 ★ 시작에 앞서 ★ 해당 내용은 ', 다산출판사, 2024' 에 나와있는 챕터별 연습문제를 교재를 응용하여 풀이하고, 수학적인 문제에 대한 답변을 파이썬으로 구현해보기 위해 작성하는 글이다.해당 답변을 구현하는 방식은 답안지 없이 필자가 스스로 구현하는 것이므로, 정확한 (혹은 가장 효과적인) 답변이 아닐 수 있다. 이 글의 목적은 통계학 공부와 파이썬 프로그래밍 언어 공부를 동시에 하고자 함이며, 통계학을 공부하고 싶으신 분들은 해당 교재를 구매하는 것을 추천한다.또한, 연습문제 번호 및 문제 내용은 필자가 임의대로 작성하였으며, 교재와는 다를 수 있다.이전 내용 [파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.2) - 2★ 시작에 앞서 ★ 해당 내용은 ', 다산출판사, 2024' 에 나와있는 .. 2024. 10. 5.
[파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.2) - 2 ★ 시작에 앞서 ★ 해당 내용은 ', 다산출판사, 2024' 에 나와있는 챕터별 연습문제를 교재를 응용하여 풀이하고, 수학적인 문제에 대한 답변을 파이썬으로 구현해보기 위해 작성하는 글이다.해당 답변을 구현하는 방식은 답안지 없이 필자가 스스로 구현하는 것이므로, 정확한 (혹은 가장 효과적인) 답변이 아닐 수 있다. 이 글의 목적은 통계학 공부와 파이썬 프로그래밍 언어 공부를 동시에 하고자 함이며, 통계학을 공부하고 싶으신 분들은 해당 교재를 구매하는 것을 추천한다.또한, 연습문제 번호 및 문제 내용은 필자가 임의대로 작성하였으며, 교재와는 다를 수 있다.이전 내용 [파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.2) - 1★ 시작에 앞서 ★  해당 내용은 ', 다산출판사, 2024' 에 나와있는.. 2024. 10. 4.
[파이썬+통계학] 현대통계학 연습문제 파이썬 구현(ch.2) - 1 ★ 시작에 앞서 ★  해당 내용은 ', 다산출판사, 2024' 에 나와있는 챕터별 연습문제를 교재를 응용하여 풀이하고, 수학적인 문제에 대한 답변을 파이썬으로 구현해보기 위해 작성하는 글이다.해당 답변을 구현하는 방식은 답안지 없이 필자가 스스로 구현하는 것이므로, 정확한 (혹은 가장 효과적인) 답변이 아닐 수 있다. 이 글의 목적은 통계학 공부와 파이썬 프로그래밍 언어 공부를 동시에 하고자 함이며, 통계학을 공부하고 싶으신 분들은 해당 교재를 구매하는 것을 추천한다.또한, 연습문제 번호 및 문제 내용은 필자가 임의대로 작성하였으며, 교재와는 다를 수 있다.챕터2 주요 개념: 도수분포표, 상대빈도수, 누적 빈도챕터2 연습문제 1 Q1. A 고등학교 36명의 영어 점수를 입력하고, 다음 물음에 답하는 코드.. 2024. 10. 4.
[개발자를 위한 수학] 확률 - 이항 분포, 베타 분포 (+파이썬) 이항 분포(binomial distribution) 파이썬에서 구현하기 이항 분포는 확률이 p일 때 n번의 시도 중 k 번이 성공할 가능성을 측정한다. 만약, 새로운 컴퓨터 비전 모델을 개발 중이고 10번의 테스트를 했으며, 그 결과로 8번의 성공과 2번의 실패가 있었다고 가정해본다. 그러나 어떤 머신러닝 엔지니어가 더 많은 테스트를 해야 한다고 주장하며, 테스트를 더 많이 하면 90% 이상의 성공률이 나올 수 있을 거라 했다. 그렇다면 '기본 확률이 90%라고 가정할 때 80% 성공에 대한 가능도를 어떻게 결정하는가'를 계산할 때 이항 분포를 사용할 수 있다. 이항 분포를 파이썬에서 사이파이의 binom.pmf() 함수를 사용해 0에서 10까지의 이항 분포에 대한 11가지 이항 분포 확률을 모두 출력한.. 2024. 10. 4.
[개발자를 위한 수학] 확률 (+파이썬) 확률 확률은 어떤 사건이 일어날 확실성을 측정하는 이론적 연구 분야이다. 어떤 사건이 일어날 것이라고 믿는 정도를 말하며, 종종 백분로 확률을 표현한다. 확률의 예동전을 10번 던져서 앞면이 7번 나올 확률선거에서 승리할 가능성비행기 스케줄이 지연될 확률제품에 결함이 있는지 얼마나 확신하는가위의 예 중 하나인, 동전을 10번 던져서 앞면이 7번 나올 확률이 만약 10% 라고 한다면, 여기서 확률은 P(X) 라고 하며, X는 관심 대상인 사건이다. 확률은 주로 0.0에서 1.0 사이의 소수로 값을 표시하는데, 이 경우에는 확률이 10% 라고 언급했기 때문에 이는 0.1이 된다.◆ 확률과 가능도의 차이 - 1- 확률: 아직 일어나지 않은 사건에 대학 예측을 정량화하는 것. (미래)- 가능도(likelihoo.. 2024. 10. 4.
[통계학] 자료 정리 - 2 이전 내용 [통계학] 자료 정리 - 1변수와 자료 ◆ 변수: 연구자의 관심 대상이 되는 성격 또는 속성. (변하는 수)'변수'란 키, 몸무게, 지능지수, 나이 등과 같이 연구대상들이 서로 다르게 나타나는 속성을 말한다.   ◆ 자료: puppy-foot-it.tistory.com등급의 수와 구간의 결정 질적 자료의 경우에는 도수분포표를 만들 때에는 등급의 수를 몇 개로 할 것인지, 등급의 구간을 어떻게 정할 것인지는 문제가 되지 않는다.그러나, 양적 자료에서는 분석자의 목적에 따라 등급의 수와 구간의 수를 무한히 다양한 방법으로 정할 수 있기 때문에, 등급의 수와 구간을 얼마로 설정할 것이냐의 문제가 언제나 제기된다.등급의 수: 자료의 성격을 정확하게 파악하기 위해서는 등급의 수가 많아야 하며, 개략적으.. 2024. 10. 3.
[통계학] 자료 정리 - 1 변수와 자료 ◆ 변수: 연구자의 관심 대상이 되는 성격 또는 속성. (변하는 수)'변수'란 키, 몸무게, 지능지수, 나이 등과 같이 연구대상들이 서로 다르게 나타나는 속성을 말한다.   ◆ 자료: 관찰이나 연구의 목적에 따라 변수를 관찰하여 기록한 결과자료 그 자체만으로는 의미 있는 정보를 제공해 주지 못하기 때문에, 수집된 자료를 의미 있는 방식으로 분류 및 정리하는 것이 중요하다. 단, 자료를 정리하는 방법이나 정리된 자료를 분석하는 방법은 자료의 종류에 따라 다르다.변수와 자료의 종류 - 양적 변수(quantitative variable): 수치로 나타낼 수 있는 것. (기업의 매출액, 시험 점수 등)- 질적 변수(qualitative variable): 수치로 나타낼 수 없는 것. (종교, 성별,.. 2024. 10. 2.
[개발자를 위한 수학] 미분, 적분 (+파이썬) 미분 미분(derivative)은 함수의 기울기를 나타내며 함수의 어느 지점에서의 변화율을 측정하는 데 유용하다. 또한 미분은 머신러닝과 수학 알고리즘, 특히 경사 하강법에 사용된다. 경사 하강법을 간단히 말하자면, 기울기가 0이면 출력 변수의 최솟값 또는 최댓값에 도달했음을 의미한다. [파이썬 머신러닝] 경사 하강법(GD, gradient descent)경사하강법 경사하강법(GD, gradient descent)은 여러 종류의 문제에서 최적의 해법을 찾을 수 있는 일반적인 최적화 알고리즘이다. 경사 하강법의 기본 아이디어는 비용 함수를 최소화하기 위해 반puppy-foot-it.tistory.com 이 개념은 선형 회귀, 로지스틱 회귀, 신경망 등을 배울 때 매우 유용하다.f(x) = x^2 함수의 그.. 2024. 10. 2.
[개발자를 위한 수학] 로그, 자연로그, 오일러 수 (+파이썬) 로그 로그(logarithm)는 특정 수와 밑이 있을 때 거듭제곱 횟수를 구하는 수학 함수이다. 로그는 실제로 지진 측정, 스트레오 음량 관리 등 다양하게 사용되며, 어디에나 존재한다. 로그는 머신러닝과 데이터 과학에도 많이 사용되며, 특히 로지스틱 회귀의 핵심이다. '2를 몇 번 제곱하면 8이 되는가?' 라는 질문을 수학적으로 표현하는 방법은 지수에 x를 사용하는 것이다. 이 수학 연산을 로그로 x를 구하는 식으로 표현한다면 아래와 같다.로그는 밑이 2일 때 8이 되는 거듭제곱 횟수를 찾는다. 일반적으로 지수 함수를 로그로 표현하는 공식은 다음과 같다. [파이썬에서 로그 계산하는 방식]# 파이썬에서 로그 계산하기 from math import log #2를 거듭제곱해 8이 되는 지수를 구하라 x = l.. 2024. 10. 2.
728x90