다누리 지속가능한세상

이전 포스팅을 통해서 데이터셋을 어떻게 불러오는지를 알아봤다면, 이번엔 불러온 데이터를 살펴보도록 하겠습니다!

혹시, 데이터셋을 어떻게 불러오는지 헷갈리신다면, 이전 포스팅을 참고해주세요!

데이터셋 불러오기 - csv파일, 엑셀파일 (Danuri coding/다누리 코딩)

코딩을 실행하기 위해서는 원본의 파일이 필요한 경우들이 있습니다! 이때, 파일 대부분은 CSV 파일로 되어있고, 몇몇의 파일은 엑셀 (Excel) 파일로 되어있습니다. 이들을 불러오는 코드는 다음과

danuri.tistory.com

데이터를 가져오면,

칼럼의 헤더가 설정되어 있지 않은 경우가 생깁니다.

가령 다음과 같은 데이터프레임을 가져왔다고 하면,

데이터는 있지만, 각 데이터가 무엇을 의미하는지를 알기 힘듭니다.

이러한 경우에는 칼럼의 헤더를 지정해주어야 합니다.

칼럼의 헤더를 지정하는 방법에는 여러 가지가 있는데,

그중에 많이 쓰이는 방법이

#column(열) 헤더 설정하기.

column_headers = ['분기', '매출액']

df = pd.read_csv(url, names = column_headers) #헤더를 함께 설정하여 csv 파일을 읽어온다.

print(df.head())

이러한 방식으로 칼럼 헤더를 먼저 설정하고,

이를 csv 파일을 불러올 때 칼럼 헤더까지 같이 불러오는 것입니다.

이후, 데이터프레임의 전체가 아닌, 일부만 보여주는 함수를 통해서 출력을 하면

다음과 같이 칼럼 헤더가 함께 출력되게 됩니다.

이외에도

칼럼 헤더로 지정하고 싶은 내용들이

첫 번째 행(row)에 있을 경우에는, 0번째(파이썬에는 0부터 시작!) row를 column으로 지정해주면 됩니다.

# 칼럼 정보 저장 -> 0번째 row에 정보가 있음
df1_columns = df1.iloc[0] #즉, 첫번째 row 를 column 으로 사용한다.
# 칼럼 재 지정
df1.columns=df1_columns

칼럼 헤더 설정을 통해서 잘 불러온 데이터의 이름을 붙여줌으로써 데이터 분석이 원활히 잘 이루어졌으면 좋겠습니다.

파이썬 필요 없는 행 제외하기/ 데이터 자리 변경하기 (Danuri coding/다누리 코딩) (0)	2021.10.09
파이썬 데이터셋 불러오기 - csv파일, 엑셀파일 (Danuri coding/다누리 코딩) (0)	2021.10.07

다누리