TOP
class="layout-aside-left paging-number">
본문 바로가기
728x90

[파이썬 Projects]188

[파이썬] 성능 평가 지표 - 1 (정확도, 정밀도, 재현율, 오차 행렬) 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 평가 머신러닝은 데이터 가공/변환, 모델 학습/예측, 평가의 프로세스로 구성된다. 머신러닝 모델은 여러 가지 방법으로 예측 성능을 평가할 수 있다. [성능 평가 지표(Evaluation Metric)] - 회귀: 실제값과 예측값의 오차 평균값에 기반. 예측 오차를 가지고 정규화 수준을 재가공하는 방법 - 분류: 일반적으로는 실제 결과 데이터와 예측 결과 데이터가 얼마나 정확하고 오류가 적게 발생하는가에 기반하나, 단순히 이러한 정확도만 가지고 판단하면 잘못된 평가 결과에 빠질 수 있다. 또한, 분류는 이진 분류와 멀티 분류로 나뉠 수 있다. - .. 2024. 6. 9.
[파이썬] 사이킷런 - 타이타닉 생존자 예측 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 사이킷런으로 수행하는 타이타닉 생존자 예측 1. 분석에 필요한 라이브러리, 시각화 패키지, 파일 불러오기 2. 데이터 칼럼 타입 확인하기Range Index: DataFrame 인덱스의 범위 (전체 로우 수)Data Columns: 전체 칼럼 수dtypes: 데이터 타입판다스의 object 타입 = string 타입판다스는 넘파이 기반으로 만들어졌고 넘파이의 String 타입이 길이 제한이 있어서 이에 대한 구분을 위해 object 타입으로 명기전체 891개 데이터 중 Null 값이 있는 칼럼은 'Age', 'Cabin', 'Embarked'3... 2024. 6. 9.
[파이썬] 데이터 전처리 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 네이버 도서책으로 만나는 새로운 세상search.shopping.naver.com 데이터 전처리(Data Preprocessing) ML 알고리즘은 데이터에 기반하고 있어 어떤 데이터를 입력으로 가지느냐에 따라 결과도 크게 달라질 수 있기 때문에 데이터 전처리가 매우 중요하다. [데이터 전처리 기본 사항]결손값(Null, NaN)은 허용되지 않는다. : 결손값은 고정된 다른 값으로 변환되어야 한다.사이킷런의 머신러닝 알고리즘은 문자열 값을 입력값으로 허용하지 않는다.: 모든 문자열은 인코딩돼서 숫자 형으로 변환해야 한다.데이터 인코딩 레이블 인코.. 2024. 6. 9.
[파이썬] 사이킷런의 model_selection 모듈 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 네이버 도서책으로 만나는 새로운 세상search.shopping.naver.com Model Selection 모듈 소개 사이킷런의 model_selection 모듈은 학습 데이터와 테스트 데이터 세트를 분리하거나 교차 검증 분할 및 평가, 그리고 Estimator의 하이퍼 파라미터 (초매개변수)를 튜닝하기 위한 다양한 함수와 클래스를 제공한다. model_selection 모듈은 머신러닝 모델을 만들 때, 데이터를 효율적으로 나누고 평가하기 위해 사용되는 Python의 scikit-learn 라이브러리의 일부이며, 이 모듈은 다음과 같은 주요 .. 2024. 6. 7.
[파이썬] 사이킷런에 내장된 예제 데이터 세트 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 네이버 도서책으로 만나는 새로운 세상search.shopping.naver.com 이전 내용 [파이썬] 사이킷런 주요 모듈시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 네이버 도서책으로 만나는puppy-foot-it.tistory.com내장된 예제 데이터 세트 사이킷런에는 별도의 예제로 활용할 수 있는 간단하면서도 좋은 데이터 세트가 내장되어 있다.이 데이터는 datasets 모듈에 있는 여러 API를 호출해 만들 수 있다.사이킷런에.. 2024. 5. 30.
[파이썬] 사이킷런 주요 모듈 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 네이버 도서책으로 만나는 새로운 세상search.shopping.naver.com Estimator 이해 및 fit( ), predict( ) 메서드 사이킷런은 ML 모델 학습을 위해 fit( ), 학습된 모델의 예측을 위해 predict( ) 메서드 제공.' ◆ 지도학습에서의 사이킷런 클래스(분류, 회귀, Estimator)지도학습의 주요 두 축인 분류와 회귀의 다양한 알고리즘을 구현한 모든 사이킷런 클래스는 위의 두 메서드만을 이용해 간단하게 학습과 예측 결과를 반환한다.Classifier: 분류 알고리즘을 구현한 클래스Regressor: 회.. 2024. 5. 30.
[파이썬] 사이킷런으로 시작하는 ML 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 네이버 도서책으로 만나는 새로운 세상search.shopping.naver.com사이킷런(sickit-learn) 이란? 사이킷런은 파이썬 머신러닝 라이브러리 중 가장 많이 사용되는 라이브러리이다.그러나 최근에는 텐서플로, 케라스 등 딥러닝 전문 라이브러리의 강세로 인해 대중적인 관심이 줄어들고 있으나 여전히 대표적인 파이썬 머신러닝 라이브러리이다.Anaconda를 설치하면 기본으로 사이킷런까지 설치가 완료된다. [사이킷런 특징]쉽고 가장 파이썬스러운 API 제공(파이썬 기반의 다른 머신러닝 패키지도 사이킷런 스타일의 API 지향)머신러닝을 위한.. 2024. 5. 30.
[파이썬] 판다스 (Pandas) - 5 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 네이버 도서책으로 만나는 새로운 세상search.shopping.naver.com 이전 내용 [파이썬] 판다스 (Pandas) - 4시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 네이버 도서책으로 만나는puppy-foot-it.tistory.com결손 데이터 처리하기(feat. isna / fillna) 결손 데이터는 칼럼에 값이 없는 Null을 의미하며, 이를 넘파이의 NaN으로 표시한다.머신러닝 알고리즘은 이 NaN 값을 처리하지.. 2024. 5. 29.
[파이썬] 판다스 (Pandas) - 4 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 네이버 도서책으로 만나는 새로운 세상search.shopping.naver.com이전 내용 [파이썬] 판다스 (Pandas) - 3시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 네이버 도서책으로 만나는puppy-foot-it.tistory.comsort_values( ): DataFrame, Series 정렬 sort_values( ): DataFrame, Series 정렬을 위해서 사용하는 메서드. RDBMS SQL의 order b.. 2024. 5. 28.
[파이썬] 판다스 (Pandas) - 3 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 네이버 도서책으로 만나는 새로운 세상search.shopping.naver.com이전 내용  [파이썬] 판다스 (Pandas) - 2시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 네이버 도서책으로 만나는puppy-foot-it.tistory.com데이터 셀렉션 및 필터링  넘파이의 데이터 핸들링은 데이터 분석용으로 사용하기에는 편의성이 떨어지기 때문에 판다스는 이를 개선하는 과정에서 넘파이의 기능을 일부 계승하기도 하고, 넘파이와는 .. 2024. 5. 27.
[파이썬] 판다스 (Pandas) - 2 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 네이버 도서책으로 만나는 새로운 세상search.shopping.naver.com이전 내용 [파이썬] 판다스 (Pandas) - 1시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적을 참고해 주시기 바랍니다. 네이버 도서책으로 만나는 새로운 세상search.shopping.naverpuppy-foot-it.tistory.comDataFrame과 리스트, 딕셔너리, 넘파이 ndarray 상호 변환 기본적으로 DataFrame은 파이썬의 리스트, 딕셔너리 그리고 넘파이 ndarray 등으로 변.. 2024. 5. 25.
[파이썬] 판다스 (Pandas) - 1 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적을 참고해 주시기 바랍니다. 네이버 도서책으로 만나는 새로운 세상search.shopping.naver.com데이터 핸들링 - 판다스 판다스(Pandas)는 파이썬에서 데이터 처리를 위해 존재하는 가장 인기 있는 라이브러리이다. 일반적으로 대부분의 데이터 세트는 행(Row)과 열(Column)으로 구성되어 있는 2차원 데이터이다. 행과 열의 2차원 데이터가 인기 있는 이유는 바로 인간이 가장 이해하기 쉬운 데이터 구조이면서도 효과적으로 데이터를 담을 수 있는 구조이기 때문이다. 판다스는 행과 열로 이뤄진 2차원 데이터를 효율적으로 가공/처리할 수 있는 다양하고 훌륭한 기능을 제공한다. ◆ 판다스 v.. 2024. 5. 25.
[파이썬] 넘파이(NumPy) - 3 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적을 참고해 주시기 바랍니다. 네이버 도서책으로 만나는 새로운 세상search.shopping.naver.com기존 내용 [파이썬] 넘파이(NumPy) - 2시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적을 참고해 주시기 바랍니다.기존 내용 [파이썬] 넘파이(NumPy) - 1시작에 앞서해당 내puppy-foot-it.tistory.comsort( ), argsort( ): 행렬의 정렬 넘파이에서 행렬을 정렬하는 대표적인 방법 - np.sort( ) / ndarray.sort( )정렬된 행렬의 인덱스를 반환 - argsort( ) [행렬 정.. 2024. 5. 25.
[파이썬] 넘파이(NumPy) - 2 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적을 참고해 주시기 바랍니다.  네이버 도서책으로 만나는 새로운 세상search.shopping.naver.com기존 내용 [파이썬] 넘파이(NumPy) - 1시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적을 참고해 주시기 바랍니다.넘파이 (NumPy)  머신러닝의 주요 알고리즘은 선형대수와puppy-foot-it.tistory.com인덱싱(Indexing): 넘파이의 ndarray의 데이터 세트 선택하기 인덱싱: 넘파이에서 ndarray 내의 일부 데이터 세트나 특정 데이터만을 선택할 수 있도록 한다.특정한 데이터만 추출: 원하는 위치의 .. 2024. 5. 25.
[파이썬] 넘파이(NumPy) - 1 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적을 참고해 주시기 바랍니다.  네이버 도서책으로 만나는 새로운 세상search.shopping.naver.com넘파이 (NumPy)  머신러닝의 주요 알고리즘은 선형대수와 통계 등에 기반하며, 특히 선형대수는 수학 뿐만 아니라 다른 영역의 자연과학, 공학에서 널리 사용되고 있다. Numerical Python을 의미하는 넘파이는 파이썬에서 선형대수 기반의 프로그램을 쉽게 만들 수 있도록 지원하는 대표적인 패키지이다. 루프를 사용하지 않고 대량 데이터의 배열 연산을 가능하게 하므로 빠른 배열 연산 속도를 보장한다.넘파이는 또한 C/C++과 같은 저수준 언어 기반의 호환 API를 제공한다. 기존 C/C.. 2024. 5. 25.
728x90