TOP
class="layout-aside-left paging-number">
본문 바로가기
[파이썬 Projects]/<파이썬 데이터 분석>

[파이썬] 서울시 구별 CCTV 현황 분석-2

by 기록자_Recordian 2024. 4. 13.
728x90
반응형
시작에 앞서
해당 내용은 <파이썬으로 데이터 주무르기> -민형기 저, BJPUBLIC 출판사 의 내용을 토대로 작성되었습니다.
보다 자세한 내용은 해당 교재를 확인하여 주시기 바랍니다.

지난 번 분석 이어서 하기
 

[파이썬 기초] 서울시 구별 CCTV 현황 분석

시작에 앞서 해당 내용은 -민형기 저, BJPUBLIC 출판사 의 내용을 토대로 작성되었습니다. 보다 자세한 내용은 해당 교재를 확인하여 주시기 바랍니다. CCTV 현황과 인구 현황 데이터 구하기 서울시

puppy-foot-it.tistory.com


※ 만약, 나같은 경우처럼 작업을 하는 중간에 종료시킨 후, 다시 하려는 경우에는 먼저 기존 데이터를 불러와야 한다.

CCTV_Seoul = pd.read_csv('../data/01. CCTV_in_Seoul.csv', encoding='utf-8')
CCTV_Seoul.head()

파이썬으로 기존 작업 내역 불러오기

 
마찬가지로, 서울시 인구도 데이터를 불러와야 한다.

CCTV_Seoul = pd.read_csv('../data/01. CCTV_in_Seoul.csv', encoding='utf-8')
CCTV_Seoul.head()


데이터가 잘 불러온 것을 확인 후에 진행하면 된다.

파이썬으로 기존 작업 내역 불러오기

 


CCTV 소계를 기준으로 데이터 정렬하기

 

  • 데이터 정렬 명령: 변수명.sort_values(by='컬럼명'
  • ascending=True / False 로 오름차순 또는 내림차순 정렬 지정
  • head(5): 5번째 행까지만 표시
오름차순: CCTV_Seoul.sort_values(by='소계', ascending=True).head(5)
내림차순: CCTV_Seoul.sort_values(by='소계', ascending=False).head(5)

파이썬으로 데이터 정렬하기

데이터 기준으로, 서울시에서 CCTV가 가장 적은 세 구는 도봉구, 마포구, 송파구 이며
가장 많은 세 구는 강남구, 양천구, 서초구 임을 알 수 있다.


CCTV 증가율 계산하기

 
2014년부터 2016년까지 3년간 CCTV 수를 더하고 2013년 이전 CCTV 수로 나눠서 3년간 CCTV 증가율 계산

CCTV_Seoul['최근증가율'] = (CCTV_Seoul['2016년'] + CCTV_Seoul['2015년'] + CCTV_Seoul['2014년']) / CCTV_Seoul['2013년도 이전'] * 100

CCTV_Seoul.sort_values(by='최근증가율', ascending=False).head(5)

파이썬으로 서울시 cctv 증가율 계산하기

 
결과를 보면 3년간 CCTV가 많이 증가한 구로 종로구, 도봉구, 마포구.. 순임을 알 수 있다.


서울시 인구에서 합계 내역 삭제하기 

 

파이썬으로 서울시 인구 내역 합계 컬럼 삭제하기

 
서울시 인구 변수(pop_Seoul)  0번 행에 있는 합계를 지우고자 할 때는 drop 함수 이용

변수명.drop([행번호], inplace=true)

pop_Seoul.drop([0], inplace=True)
pop_Seoul.head()

※ inplace=True 에서 True 대소문자 유의 (true 안 됨)

합계 내역 삭제된 후의 데이터


unique 명령 사용하여 구 데이터 추출하기

 
unique 조사는 반복된 데이터는 하나로 나타내서 한 번 이상 나타난 데이터 확인
pop_Seoul 데이터의 '구별' 컬럼의 unique 를 조사.
 

파이썬으로 unique 명령어 사용하기

 


유니크 조사를 통해 나타난 'NaN' 값 조회하고 처리 하기

 
isnull 명령으로 NaN 데이터 추출

파이썬으로 null 값 찾기

추출 결과, 해당 데이터에 없어도 될 거 같으므로, drop 명령을 사용하여 해당 행 삭제

pop_Seoul.drop([26], inplace=True)
pop_Seoul.head()

파이썬으로 null 값 찾아 삭제하기


각 구별 전체 인구를 이용해서 '구별 외국인비율'과 '고령자비율' 계산

 

파이썬으로 서울시 구별 외국인, 고령자비율 계산


다양한 조건으로 정렬하여 순서 확인

 
인구수로 정렬하여 인구 많은 순 확인 (sort_values 명령 사용 / 내림차순)

인구순으로 정렬하기

외국인 수로 정렬하여 외국인 숫자 많은 순 확인

외국인 순으로 정렬하기

외국인 비율 내림차순으로 정렬하여 외국인 비율 높은 순 확인

외국인 비율 내림차순 정렬하기

고령자 수로 정렬하여 고령인구 많은 순 확인

고령인구 순으로 정렬하기

고령자비율 순으로 정렬하여 고령자 비율 높은 순 확인

고령자비율 순으로 정렬하기


다음글

[파이썬 기초] 서울시 구별 CCTV 현황 분석-3

 

728x90
반응형