본문 바로가기

코딩(coding)/파이썬 데이터 분석

파이썬 데이터셋 불러오기 - csv파일, 엑셀파일 (Danuri coding/다누리 코딩)

코딩을 실행하기 위해서는

원본의 파일이 필요한 경우들이 있습니다!

 

이때, 파일 대부분은 CSV 파일로 되어있고, 몇몇의 파일은 엑셀 (Excel) 파일로 되어있습니다.

 

이들을 불러오는 코드는 다음과 같습니다.

## CSV 파일 불러오기
import pandas

csv_file = pandas.read_csv('x.csv') 
#이고,
csv_file = pd.read_csv('x.csv') 
#형태도 가능. - import pandas as pd 사용시.

이 코드는 컴퓨터에 저장된 csv파일을 pandas library를 통해서 불러오는 방법입니다.

pandas.read_csv을 기입한 후 괄호 안에 파일명을 넣어주시면 됩니다.

 

만약 URL 에서 csv 파일을 가져온다고 하면, 

다음과 같이 코딩을 하시면 됩니다.

#만약
url = 'https://data.csv'
#이렇게 설정시에는
df = pd.read_csv(url) 

df.head() #데이터 불러오기, 앞의 일부분만!

 

csv 파일이 아니라, 엑셀파일이 필요한 경우에는 다음과 같이 코딩을 하시면 됩니다.

csv 파일을 불러올때와 마찬가지로, 두 가지 방법으로 사용할 수 있습니다.

## 엑셀파일 불러오기
data_url = "https://data.xlsx"
df1 = pd.read_excel (data_url)#이렇게 불러오면 DataFrame 화 된다.

혹은
df1 = pd.read_excel("data.xlsx")

 

지금까지 대표적인 csv, 엑셀 파일 가져오기 방법이었습니다. 사이트에서 파일을 가져오는 것은 상관없지만, 사용자 개발환경 (IDLE, 주피터, 구글 코랩)에 따라서 컴퓨터에 저장되어 있는 파일 가져오기는 상이할 수 있습니다. 이 부분들을 유의하시면서 코딩하면 좋은 결과가 나올 것이라 생각합니다 :)