728x90 데이터 전처리4 [머신러닝] 캘리포니아 주택 가격 프로젝트-2 ◆ 프로젝트: 캘리포니아 주택 가격 데이터셋을 이용한 머신러닝 프로젝트이 데이터셋은 1990년 캘리포니아 인구 조사 데이터를 기반으로 하며, 진행할 주요 단계는 아래와 같다.데이터 준비데이터로부터 인사이트를 얻기 위해 탐색하고 시각화모델 선택하고 훈련모델 미세 튜닝솔루션 제시시스템 론칭, 모니터링, 유지보수이전 내용 [머신러닝] 캘리포니아 주택 가격 프로젝트◆ 프로젝트: 캘리포니아 주택 가격 데이터셋을 이용한 머신러닝 프로젝트이 데이터셋은 1990년 캘리포니아 인구 조사 데이터를 기반으로 하며, 진행할 주요 단계는 아래와 같다.데이터 준비데puppy-foot-it.tistory.com특성 스케일과 변환 데이터에 적용할 변환 한 가지는 특성 스케일링으로, 머신러닝 알고리즘은 입력된 숫자 특성들의 스케일이 .. 2024. 11. 8. [머신러닝] 텍스트 분석 실습 - 캐글 Mercari 텍스트 분석이란? [머신러닝] 텍스트 분석이전 내용 [머신러닝] 군집화 (Clustering)군집화(Clustering) [군집]군집은 비슷한 샘플을 클러스터 또는 비슷한 샘플의 그룹으로 할당하는 작업으로, 데이터 분석, 고객 분류, 추천 시스템, 검색 엔puppy-foot-it.tistory.com이전 내용 [머신러닝] 텍스트 분석: 한글 텍스트 처리텍스트 분석이란? [머신러닝] 텍스트 분석이전 내용 [머신러닝] 군집화 (Clustering)군집화(Clustering) [군집]군집은 비슷한 샘플을 클러스터 또는 비슷한 샘플의 그룹으로 할당하는 작업으로, 데이puppy-foot-it.tistory.com실습 - 캐글 Mercari Price Suggestion Challenge ◆ Mercari Pric.. 2024. 11. 1. [이미지 전처리] OpenCV를 통한 이미지 Resize 작업 수집된 이미지들을 머신 러닝 모델 학습에 사용하거나 YOLO와 같은 객체 감지 모델에서 실행하기 전에 크기를 통합하거나 기타 작업을 수행하여 이미지를 전처리 하는 것이 중요하다. 이미지 크기 통일이 중요한 이유 1. 모델 입력의 일관성: YOLO를 포함한 많은 모델은 입력 이미지가 특정 크기(예: YOLO의 경우 416x416 또는 640x640)를 가질 것으로 예상. 크기가 다른 이미지를 공급하면 오류가 발생하거나 성능이 저하될 수 있다.2. 효율적인 학습: 균일한 크기의 이미지가 있으면 모델이 다양한 이미지 크기를 처리할 필요가 없으므로 학습 프로세스가 단순화되고 수렴이 향상된다.3. 왜곡 방지: 신중하게 크기를 조정하면 이미지 내의 객체가 모델 성능에 영향을 줄 수 있는 왜곡되지 않도록 할 수 있다.. 2024. 9. 6. [머신러닝] 데이터 전처리 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 네이버 도서책으로 만나는 새로운 세상search.shopping.naver.com 데이터 전처리(Data Preprocessing) ML 알고리즘은 데이터에 기반하고 있어 어떤 데이터를 입력으로 가지느냐에 따라 결과도 크게 달라질 수 있기 때문에 데이터 전처리가 매우 중요하다. [데이터 전처리 기본 사항]결손값(Null, NaN)은 허용되지 않는다. : 결손값은 고정된 다른 값으로 변환되어야 한다.사이킷런의 머신러닝 알고리즘은 문자열 값을 입력값으로 허용하지 않는다.: 모든 문자열은 인코딩돼서 숫자 형으로 변환해야 한다.데이터 인코딩 레이블 인코.. 2024. 6. 9. 이전 1 다음 728x90