Python 2

8. 데이터 시각화 (Visualization)

seaborn 라이브러리이전에 간단히 소개한 대로, seaborn 라이브러리는 시각화를 위한 다양한 그래프를 제공하는 도구입니다. seaborn은 일반적으로 x,y, data에 대한 정보를 지정해야 함.장점: 고급 통계 기능을 그래프 내부적으로 제공하고 있습니다.단점: 데이터 크기가 클수록 속도가 느려집니다.그래프 그려보기표시해야 할 데이터가 많아질수록 가독성은 낮아진다. 다양한 설정을 통해 가독성을 향상시킬 수 있다. 위경도 데이터 scatterplot으로 시각화하기df_seoul["시군구명"].value_counts()우선 서울 각각의 시군구에 얼마나 많은 병원이 있는지 출력해봤습니다.df_seoul["시군구명"].value_counts().plot.bar(figsize=(10,4), rot=30)이..

7. 데이터 요약하기

기초 통계값* 데이터의 타입은 dtypes를 통해 확인 가능.df["위도"].dtypes 기존에 불러온 상가업소정보 데이터를 기반으로 실습을 해보자.df["위도"] 를 출력하면 위도라는 column의 데이터만 확인할 수 있다.위 사진에서 보다싶이, Google Colab에서는 굳이 .dtypes 함수를 사용하지 않더라도 하단에 타입이 같이 출력되긴 한다.1. 평균값mean()을 사용하면 해당 값들의 평균값을 확인할 수 있다.2. 중앙값median()을 사용하면 전체 데이터의 중앙값을 확인할 수 있다. (가운데 데이터의 값)3. 최대값max()를 사용하면 해당 데이터 중 가장 큰 값을 확인할 수 있다.4. 최소값min()을 사용하면 가장 작은 값을 확인할 수 있다.5. 데이터 개수count()를 사용하면 ..