시작에 앞서
해당 내용은 <파이썬으로 데이터 주무르기> -민형기 저, BJPUBLIC 출판사 의 내용을 토대로 작성되었습니다.
보다 자세한 내용은 해당 교재를 확인하여 주시기 바랍니다.
CCTV 현황과 인구 현황 데이터 구하기
서울시의 CCTV 현황 및 서울시 인구 통계 내용과 형식이 저자가 해당 내용을 작성한 시점과 다르기 때문에, 저자가 Git hub 에 올려둔 자료로 대체한다.
※ 참고로, 실제 서울시의 CCTV 현황과 서울시 인구 통계 데이터들은 아래의 링크를 통해 다운 받을 수 있다.
먼저 서울시의 CCTV 데이터(CSV 파일) 를 파이썬으로 불러온다.
파일이 한글로 되어 있는 경우에는 인코딩에 신경써야 하는데, 현재 이 데이터는 UTF-8로 인코딩 되어 있어 read_csv 명령을 쓸 때 옵션에 UTF-8 이라고 지정해야 함.
head() 명령은 pandas 데이터의 첫 5행만 보여달라는 뜻
※ 'Imports pandas as pd' 와 같은 구문을 왜 사용하는지는 아래 링크를 통해 확인
컬럼명 변경하기
먼저 컬럼명을 조회해본다.
컬럼의 순은 0, 1, 2, 3, 4, ..... 로 0부터 시작하고, '기관명' 컬럼은 제일 앞에 있으므로 '0'이 된다.
컬럼명 중 '기관명' 을 '구별' 로 변경한다. (rename 명령 사용)
여기에서 사용된 'inplace' 관련 자세한 사항은 하단 링크를 통해 확인
서울시 인구(엑셀 파일) 불러오기
엑셀 파일을 열어보면, 아래와 같은 형식으로 되어 있다.
따라서, read_excel 명령어를 사용하는데, CSV 와 달리 옵션을 좀 더 적용하여야 한다.
※ 엑셀 파일을 불러올 때 'encoding=utf-8' 구문으로 오류가 나는 경우.,
'pip install xlrd' 구문을 입력 후에 'encoding=utf-8' 을 제외한 나머지 내용을 입력하면
엑셀 데이터가 이상없이 로딩 된다. (구글링을 한참 해서 겨우 찾아냈다...)
※ usecols: 파이썬에서 row(행) 기준 데이터를 선택할 때 사용하는 명령
불러온 엑셀 데이터의 컬럼명 변경하기
usecols를 통해 특정 칼럼을 불러왔으나, 칼럼명이 계, 계.1, 계.2 등으로 어떤 데이터의 합계인지 파악하기가 어렵다.
따라서, rename 명령을 사용하여 컬럼명 변경
이렇게 함으로써 CCTV_Seoul 변수에는 '구별 CCTV 현황'을, pop_Seoul 변수에는 '구별 인구 현황'을 저장했다.
이후 내용은 다음 파트에서 계속.
다음글
'[파이썬 Projects] > <파이썬 데이터 분석>' 카테고리의 다른 글
[파이썬] 서울시 범죄 현황 분석 - 2 (0) | 2024.04.15 |
---|---|
[파이썬] 서울시 범죄 현황 분석 - 1 (0) | 2024.04.14 |
[파이썬] 서울시 구별 CCTV 현황 분석-4 (0) | 2024.04.14 |
[파이썬] 서울시 구별 CCTV 현황 분석-3 (0) | 2024.04.13 |
[파이썬] 서울시 구별 CCTV 현황 분석-2 (0) | 2024.04.13 |