TOP
class="layout-aside-left paging-number">
본문 바로가기
728x90

[파이썬 Projects]188

[파이썬] 분류 > 앙상블 - 3 : GBM 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다.앙상블 학습(Ensemble Learning) [파이썬] 분류: 앙상블 학습(Ensemble Learning) - 1시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다.앙상블 학습(Ensemble Learning) puppy-foot-it.tistory.com부스팅 알고리즘 부스팅 알고리즘: 여러 개의 약한 학습기를 순차적으로 학습-예측 하면서 잘못 예측한 데이터에 가중치 부여를 통해 오류를 개선해 나가면서 학습하는 방식. [부스팅의 대표적인.. 2024. 6. 30.
[파이썬] 네이버 뉴스 댓글 추첨 (feat.임영웅) - 2 수행 내용 및 목표 파이썬을 이용하여 네이버 뉴스의 댓글 작성자 데이터를 모아1. 댓글을 분석하여 워드 클라우드를 생성2. 작성자 중 한 명 (또는 그 이상)을 추첨하는 프로그램을 만든다. 이전 내용 [파이썬] 네이버 뉴스 댓글 분석(feat.임영웅) - 1수행 내용 및 목표 파이썬을 이용하여 네이버 뉴스의 댓글 작성자 데이터를 모아 1. 댓글을 분석하여 워드 클라우드를 생성 2. 작성자 중 한 명 (또는 그 이상)을 추첨하는 프로그램을 만든다. 뉴puppy-foot-it.tistory.com 가수 임영웅님이 '삼시세끼'에 출연한다는 기사에 달린 댓글을 이용하여 자연어 처리 과정을 거친 후워드 클라우드를 생성하였다. 관련 기사 임영웅, 차승원·유해진과 '삼시세끼' 짓는다.. 나영석이 꾸린 '깜짝 밥상'가.. 2024. 6. 29.
[파이썬] 네이버 뉴스 댓글 분석(feat.임영웅) - 1 수행 내용 및 목표 파이썬을 이용하여 네이버 뉴스의 댓글 작성자 데이터를 모아1. 댓글을 분석하여 워드 클라우드를 생성2. 작성자 중 한 명 (또는 그 이상)을 추첨하는 프로그램을 만든다. 뉴스 선정 뉴스는 현재 기준 네이버 뉴스 상 댓글이 가장 많은 뉴스(수집하는 데이터 - 댓글 가 많을수록 유용하므로) 중 아무거나 하나를 고른다. (특정 단체, 정치 색 등과 아무 관련이 없음을 말씀 드립니다.)네이버 뉴스 - 랭킹 - 댓글 많은 뉴스 중 정치색이 담겨있지 않고, 최대한 자극적이지 않은 기사를 선정하도록 한다. 그렇게 선정된 기사 임영웅, 차승원·유해진과 '삼시세끼' 짓는다.. 나영석이 꾸린 '깜짝 밥상'가수 임영웅이 올 하반기 방송 예정인 tvN 새 예능프로그램 '삼시세끼' 새 시즌에 출연한다. 지난.. 2024. 6. 28.
[파이썬] 분류 > 앙상블 - 2 : 랜덤 포레스트 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다.앙상블 학습(Ensemble Learning) [파이썬] 분류: 앙상블 학습(Ensemble Learning) - 1시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다.앙상블 학습(Ensemble Learning) puppy-foot-it.tistory.com랜덤 포레스트 랜덤 포레스트는 배깅의 대표적인 알고리즘인데, 배깅은 같은 알고리즘으로 여러 개의 분류기를 만들어서 보팅으로 최종 결정하는 알고리즘이다. 랜덤 포레스트는 앙상블 알고리즘 중.. 2024. 6. 27.
[파이썬] 분류: 앙상블 학습(Ensemble Learning) - 1 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다.앙상블 학습(Ensemble Learning) 앙상블 학습을 통한 분류는,여러 개의 분류기를 생성하고 그 예측을 결합함으로써 보다 정확한 최종 예측을 도출하는 기법을 말한다. 앙상블 학습의 목표는,다양한 분류기의 예측 결과를 결합함으로써 단일 분류기보다 신뢰성이 높은 예측값을 얻는 것이다. [앙상블 유형의 알고리즘]랜덤 포레스트그래디언트 부스팅XG BoostLightGBM스태킹[앙상블 학습의 유형]부스팅: 여러 개의 분류기가 순차적으로 학습을 수행하되, 예측이 틀린 데이터에 대해서는 올바르게 예측할 수 있도록 다음 분류기에게는 가중치를 부여하면서 .. 2024. 6. 27.
[파이썬] 지도시각화: 한남동, 이태원 맛집 분석 - 4 프로젝트 수행 내용 및 목표 웹스크래핑으로 이태원과 한남동에 위치한 맛집 리스트를 받아와 DataFrame 으로 만들고, 그 중 'Hashtag' 컬럼 내용을 텍스트 파일로 저장하여 불용어 처리 등의 자연어 처리 작업을 거쳐워드 클라우드를 통해 해당 지역 맛집의 특징을 전달한다.지도 정보를 받아 folium을 통해 시각화 하는 것을 목표로 한다. 맛집 리스트는 '디너의 여왕' 사이트에서 가져오도록 한다.이전 내용 [파이썬] 자연어처리(NLP): 한남동, 이태원 맛집 분석 - 3프로젝트 수행 내용 및 목표 웹스크래핑으로 이태원과 한남동에 위치한 맛집 리스트를 받아와 DataFrame 으로 만들고, 그 중 'Hashtag' 컬럼 내용을 텍스트 파일로 저장하여 불용어 처리 등의 자연puppy-foot-it.t.. 2024. 6. 26.
[파이썬] 자연어처리(NLP): 한남동, 이태원 맛집 분석 - 3 프로젝트 수행 내용 및 목표 웹스크래핑으로 이태원과 한남동에 위치한 맛집 리스트를 받아와 DataFrame 으로 만들고, 그 중 'Hashtag' 컬럼 내용을 텍스트 파일로 저장하여 불용어 처리 등의 자연어 처리 작업을 거쳐워드 클라우드를 통해 해당 지역 맛집의 특징을 전달한다.지도 정보를 받아 folium을 통해 시각화 하는 것을 목표로 한다. 맛집 리스트는 '디너의 여왕' 사이트에서 가져오도록 한다.이전 내용 [파이썬] 데이터분석: 한남동, 이태원 맛집 분석 - 2프로젝트 수행 내용 및 목표 웹스크래핑으로 이태원과 한남동에 위치한 맛집 리스트를 받아와 DataFrame 으로 만들고,지도 정보를 받아 folium을 통해 시각화 하는 것을 목표로 한다. 맛집 리스트puppy-foot-it.tistory... 2024. 6. 25.
[파이썬] 데이터 전처리: 한남동, 이태원 맛집 분석 - 2 프로젝트 수행 내용 및 목표 웹스크래핑으로 이태원과 한남동에 위치한 맛집 리스트를 받아와 데이터 전처리를 수행하여 DataFrame 으로 만들고,지도 정보를 받아 folium을 통해 시각화 하는 것을 목표로 한다. 맛집 리스트는 '디너의 여왕' 사이트에서 가져오도록 한다.이전 내용 [파이썬] 웹 스크래핑: 한남동, 이태원 맛집 분석 - 1프로젝트 수행 내용 및 목표 웹스크래핑으로 이태원과 한남동에 위치한 맛집 리스트를 받아와 DataFrame 으로 만들고, 지도 정보를 받아 folium을 통해 시각화 하는 것을 목표로 한다. 맛집 리스트는puppy-foot-it.tistory.comcsv 파일 불러오기 지난 시간에 저장했던 csv 파일을 불러오고, 필요한 모듈들을 importfrom selenium im.. 2024. 6. 25.
[파이썬] 웹 스크래핑: 한남동, 이태원 맛집 분석 - 1 프로젝트 수행 내용 및 목표 웹스크래핑으로 이태원과 한남동에 위치한 맛집 리스트를 받아와 DataFrame 으로 만들고,지도 정보를 받아 folium을 통해 시각화 하는 것을 목표로 한다. 맛집 리스트는 '디너의 여왕' 사이트에서 가져오도록 한다.'디너의 여왕' 사이트에서 맛집 리스트 얻기 https://dinnerqueen.net/restaurant/area/4. 디너의여왕 - 이태원&한남동 맛집랭킹오늘 뭐 먹을지 고민된다면, 디너의여왕만의 빅데이터 맛집 랭킹을 찾아주세요.dinnerqueen.net리스트로 저장된 맛집 리스트 문자열로 바꾸기 (실패)다른 방식으로의 접근 위의 과정을 거쳐 texts라는 변수에 식당 이름, 주소, 리뷰 등의 정보가 잘 저장되었으나,문제는 해당 값이 리스트 형으로 저장되어.. 2024. 6. 24.
[파이썬] 웹 스크래핑: 한남동, 이태원 맛집 분석(실패) 해당 프로젝트는 실패하여 중간에 중단하였으므로, 어떻게 실패했는지 궁금하고,만약에 이렇게 했으면 성공했을텐데 라는 조언을 주실 분이 읽어주셨으면 합니다. 참고로, 아래는 성공한 글입니다. [파이썬] 웹 스크래핑: 한남동, 이태원 맛집 분석 - 1프로젝트 수행 내용 및 목표 웹스크래핑으로 이태원과 한남동에 위치한 맛집 리스트를 받아와 DataFrame 으로 만들고,지도 정보를 받아 folium을 통해 시각화 하는 것을 목표로 한다. 맛집 리스트puppy-foot-it.tistory.com프로젝트 수행 내용 및 목표 웹스크래핑으로 이태원과 한남동에 위치한 맛집 리스트를 받아와 DataFrame 으로 만들고,지도 정보를 받아 folium을 통해 시각화 하는 것을 목표로 한다. 맛집 리스트는 '디너의 여왕' 사.. 2024. 6. 24.
[파이썬 머신러닝] 결정트리 - 사용자 행동 인식 데이터 세트 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다.사용자 행동 인식 데이터 세트 [실습 내용]결정 트리를 이용해 UCI 머신러닝 리포지토리(Machine Learning Repository)에서 제공하는 사용자 행동 인식(Human Activity Recognition) 데이터 세트에 대한 예측 분류 수행 해당 데이터는 30명에게 스마트폰 센서를 장착한 뒤 사람의 동작과 관련된 여러 가지 피처를 수집한 데이터이며,수집된 피처 세트를 기반으로 결정 트리를 이용해 어떠한 동작인지 예측해 보는 것이 수행 목표이다. 우선, 하단의 링크로 접속하여 데이터 세트를 다운 받는다.https://archive.i.. 2024. 6. 23.
[파이썬] 머신러닝 알고리즘: 결정 트리 - 3 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 이전 내용 [파이썬] 머신러닝 알고리즘: 결정 트리 - 2시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 이전 내용 [파이썬] 머신러puppy-foot-it.tistory.comfeature_importances_ 결정 트리는 균일도에 기반해 어떠한 속성을 규칙 조건으로 선택하느냐가 중요한 요건이다.중요한 몇 개의 피처가 명확한 규칙 트리를 만드는 데 크게 기여하며, 모델을 좀 더 간결하고 이상치(Outlier)에 강한 모델을 만들 수.. 2024. 6. 23.
[파이썬] 머신러닝 알고리즘: 결정 트리 - 2 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 이전 내용 [파이썬] 머신러닝 알고리즘: 결정 트리 (+시각화)시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 결정 트리(Decision Tree) ◆ 결puppy-foot-it.tistory.com시각회된 결정 트리 분석 앞서 시각화했던 결정 트리에 대해 상세히 설명하면, [노드 내에 기술된 지표의 의미]- petal length(cm) (이 조건이 없으면 자식 노드이다.)- gini는 다음의 value=[]로 주어진 데이터 분포에서.. 2024. 6. 23.
[파이썬] 머신러닝 알고리즘: 결정 트리 (+시각화) 시작에 앞서해당 내용은 ' 권철민 지음. 위키북스' 를 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다. 결정 트리(Decision Tree) ◆ 결정 트리 알고리즘: 데이터 있는 규칙을 학습을 통해 자동으로 찾아내 트리(Tree) 기반의 분류 규칙을 만드는 것.일반적으로 룰 기반의 프로그램에 적용되는 if, else 를 자동으로 찾아내 예측을 위한 규칙을 만드는 알고리즘이다.▶ 데이터의 어떤 기준을 바탕으로 규칙을 만들어야 가장 효율적인 분류가 될 것인가가 알고리즘의 성능을 크게 좌우 [결정 트리의 구조]- 규칙 노드(Decision Node): 규칙 조건- 리프 노드(Leaf Node): 결정된 클래스 값- 서브 트리(Sub Tree): 새로운 .. 2024. 6. 23.
[파이썬] 파이썬기초: 정규 표현식(Regular Expressions) - 4 시작에 앞서해당 내용은 ' 박응용 지음. 이지스 퍼블리싱' 을 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다.이전 내용 [파이썬] 파이썬기초: 정규 표현식(Regular Expressions) - 3시작에 앞서해당 내용은 ' 박응용 지음. 이지스 퍼블리싱' 을 토대로 작성되었습니다. 보다 자세한 내용은 해당 서적에 상세히 나와있으니 서적을 참고해 주시기 바랍니다.이전 내용 [파이썬]puppy-foot-it.tistory.com정규 표현식 - 전방 탐색 (Lookahead Assertions) 전방탐색이란 일치 항목을 찾을 때 특정 패턴 앞에 오는 다른 패턴을 확인하기 위해 사용되는 고급 정규 표현식 기법이다.전방탐색 확장구문을 사용하면 암호문처럼 .. 2024. 6. 22.
728x90