Data Science(w. naver boostcourse)

1. 환경설정

테크MANIA 2024. 8. 1. 01:17
반응형

본 카테고리는 네이버 부스트코스의 DataScience 코칭 스터디를 참여하며 학습하고 배운 내용을 바탕으로 작성했습니다.

 

1. 무엇을 분석할 것인가?

데이터 분석이 왜 필요한지 고민하고 배워볼 것을 추천.

https://www.data.go.kr/

 

공공데이터 포털

국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase

www.data.go.kr

추후 본 학습 내용 외에도 공공데이터 포털에 있는 데이터를 바탕으로 분석을 해보면 좋음.

2. 아나콘다 및 주피터 노트북

파이썬과 관련된 생태계를 많이 차지하는 프로그램.

https://www.anaconda.com/download/success

 

Download Now | Anaconda

Anaconda is the birthplace of Python data science. We are a movement of data scientists, data-driven enterprises, and open source communities.

www.anaconda.com

해당 링크를 통해 사용할 운영체제에 맞는 아나콘다 버전을 다운받는다. 

아나콘다를 설치할 경우 자동적으로 주피터 노트북이 설치된다. (next만 눌러서 진행)

 

아나콘다가 설치된 후 주피터 노트북을 실행시켜보면 브라우저에서 정상적으로 주피터 노트북이 실행되는 것을 확인할 수 있다.

이후 앞으로 진행할 프로젝트를 쉽게 구분하기 위해 새로운 폴더를 만들어준다. 

만든 폴더로 들어가서 New 버튼을 클릭하면 새로운 파일을 만들 수 있는데, 강의에서는 바로 Python3 옵션이 존재하지만, 해당 글을 작성하는 현재 최신 버전에서는 해당 옵션이 없기에 notebook을 선택하면 이후 python3 선택이 가능하다.

이후 만든 파일에서 상단에 Untitled를 클릭하면 파일의 이름을 변경할 수 있다.

이제 간단한 print문을 작성하고 실행해보면 정상적으로 파이썬 코드 실행 결과를 바로 볼 수 있다.

 

기존에 print문을 작성했던 셀을 선택한 후 A 키를 누르면 해당 셀 위에 새로운 셀이 생성된다.

 

코드를 작성하다보면 길이가 길어질 수 있는데, 오류가 발생할 경우 해당 줄을 찾아가기 어렵다, 미리 줄 보임 설정을 해주면 편하다 

 

위 사진의 커널 옵션을 통해 실행된 결과 커널 출력물을 초기화하여 노트를 재실행할 수 있다.

Google Colab


별도의 프로그램을 설치하기 번거롭거나 구글 드라이브를 통해 어디서든 작업을 하고 싶은 경우 사용하기 편리한 플랫폼

https://colab.google/

코랩 홈페이지에 들어가면 바로 보이는 New Notebook을 클릭하면 바로 활용 가능한 파이썬 환경을 실행해준다.

기능적으로는 주피터 노트북과 유사함

반응형