본 카테고리는 네이버 부스트코스의 DataScience 코칭 스터디를 참여하며 학습하고 배운 내용을 바탕으로 작성했습니다.
1. 무엇을 분석할 것인가?
데이터 분석이 왜 필요한지 고민하고 배워볼 것을 추천.
공공데이터 포털
국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase
www.data.go.kr
추후 본 학습 내용 외에도 공공데이터 포털에 있는 데이터를 바탕으로 분석을 해보면 좋음.
2. 아나콘다 및 주피터 노트북
파이썬과 관련된 생태계를 많이 차지하는 프로그램.
https://www.anaconda.com/download/success
Download Now | Anaconda
Anaconda is the birthplace of Python data science. We are a movement of data scientists, data-driven enterprises, and open source communities.
www.anaconda.com
해당 링크를 통해 사용할 운영체제에 맞는 아나콘다 버전을 다운받는다.
아나콘다를 설치할 경우 자동적으로 주피터 노트북이 설치된다. (next만 눌러서 진행)
아나콘다가 설치된 후 주피터 노트북을 실행시켜보면 브라우저에서 정상적으로 주피터 노트북이 실행되는 것을 확인할 수 있다.
이후 앞으로 진행할 프로젝트를 쉽게 구분하기 위해 새로운 폴더를 만들어준다.
만든 폴더로 들어가서 New 버튼을 클릭하면 새로운 파일을 만들 수 있는데, 강의에서는 바로 Python3 옵션이 존재하지만, 해당 글을 작성하는 현재 최신 버전에서는 해당 옵션이 없기에 notebook을 선택하면 이후 python3 선택이 가능하다.
이후 만든 파일에서 상단에 Untitled를 클릭하면 파일의 이름을 변경할 수 있다.
이제 간단한 print문을 작성하고 실행해보면 정상적으로 파이썬 코드 실행 결과를 바로 볼 수 있다.
기존에 print문을 작성했던 셀을 선택한 후 A 키를 누르면 해당 셀 위에 새로운 셀이 생성된다.
코드를 작성하다보면 길이가 길어질 수 있는데, 오류가 발생할 경우 해당 줄을 찾아가기 어렵다, 미리 줄 보임 설정을 해주면 편하다
위 사진의 커널 옵션을 통해 실행된 결과 커널 출력물을 초기화하여 노트를 재실행할 수 있다.
Google Colab
별도의 프로그램을 설치하기 번거롭거나 구글 드라이브를 통해 어디서든 작업을 하고 싶은 경우 사용하기 편리한 플랫폼
코랩 홈페이지에 들어가면 바로 보이는 New Notebook을 클릭하면 바로 활용 가능한 파이썬 환경을 실행해준다.
기능적으로는 주피터 노트북과 유사함
'Data Science(w. naver boostcourse)' 카테고리의 다른 글
6. 결측치 다루기 (8) | 2024.10.04 |
---|---|
5. 데이터 미리보기 및 요약하기 (3) | 2024.10.03 |
4. 파일 경로 설정 및 불러오기 (0) | 2024.08.26 |
3. Pandas Cheat-Sheet (0) | 2024.08.12 |
2. 데이터 분석을 위한 파이썬 기초 (0) | 2024.08.02 |