코칭스터디 2

6. 결측치 다루기

결측치란?결측치란 값이 없거나, NaN으로 나타나는 데이터를 의미합니다.데이터에 따라 다르지만, 여기서는 따로 데이터가 없는 값으로 보기에 해당 column은 제외하는 방식으로 데이터 전처리 과정을 갖는다. df.isnull() 을 통해 결측치가 존재하는 컬럼을 구한다. 이때 isnull은 해당 데이터가 결측치라면 True를 반환한다.null_count = df.isnull().sum() 을 통해 True로 추출된 결측치 데이터들의 총 합을 구하고 변수에 저장한다. (boolean indexing을 통해 True는 1과 동일함)이제 null_count 변수를 출력해보면,이와 같이 결측치가 없는 데이터는 0으로 출력되고 결측치가 있는 데이터는 결측치의 개수가 출력된다.결측치 시각화하기결측치를 저장한 nul..

1. 환경설정

본 카테고리는 네이버 부스트코스의 DataScience 코칭 스터디를 참여하며 학습하고 배운 내용을 바탕으로 작성했습니다. 1. 무엇을 분석할 것인가?데이터 분석이 왜 필요한지 고민하고 배워볼 것을 추천.https://www.data.go.kr/ 공공데이터 포털국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datasewww.data.go.kr추후 본 학습 내용 외에도 공공데이터 포털에 있는 데이터를 바탕으로 분석을 해보면 좋음.2. 아나콘다 및 주피터 노트북파이썬과 관련된 생태계를 많이 차지하는 프로그램.https://www.anaconda.com/download/suc..