코딩(coding)/파이썬 데이터 분석
파이썬 데이터셋 불러오기 - csv파일, 엑셀파일 (Danuri coding/다누리 코딩)
다누리_Danuri JUN
2021. 10. 7. 11:54
코딩을 실행하기 위해서는
원본의 파일이 필요한 경우들이 있습니다!
이때, 파일 대부분은 CSV 파일로 되어있고, 몇몇의 파일은 엑셀 (Excel) 파일로 되어있습니다.
이들을 불러오는 코드는 다음과 같습니다.
## CSV 파일 불러오기
import pandas
csv_file = pandas.read_csv('x.csv')
#이고,
csv_file = pd.read_csv('x.csv')
#형태도 가능. - import pandas as pd 사용시.
이 코드는 컴퓨터에 저장된 csv파일을 pandas library를 통해서 불러오는 방법입니다.
pandas.read_csv을 기입한 후 괄호 안에 파일명을 넣어주시면 됩니다.
만약 URL 에서 csv 파일을 가져온다고 하면,
다음과 같이 코딩을 하시면 됩니다.
#만약
url = 'https://data.csv'
#이렇게 설정시에는
df = pd.read_csv(url)
df.head() #데이터 불러오기, 앞의 일부분만!
csv 파일이 아니라, 엑셀파일이 필요한 경우에는 다음과 같이 코딩을 하시면 됩니다.
csv 파일을 불러올때와 마찬가지로, 두 가지 방법으로 사용할 수 있습니다.
## 엑셀파일 불러오기
data_url = "https://data.xlsx"
df1 = pd.read_excel (data_url)#이렇게 불러오면 DataFrame 화 된다.
혹은
df1 = pd.read_excel("data.xlsx")

지금까지 대표적인 csv, 엑셀 파일 가져오기 방법이었습니다. 사이트에서 파일을 가져오는 것은 상관없지만, 사용자 개발환경 (IDLE, 주피터, 구글 코랩)에 따라서 컴퓨터에 저장되어 있는 파일 가져오기는 상이할 수 있습니다. 이 부분들을 유의하시면서 코딩하면 좋은 결과가 나올 것이라 생각합니다 :)