파이썬 필요 없는 행 제외하기/ 데이터 자리 변경하기 (Danuri coding/다누리 코딩)

다누리_Danuri JUN 2021. 10. 9. 19:20

파이썬에서 데이터셋을 불러오면, 필요 없는 행은 제외해야 하는 경우가 생깁니다.

이때 사용하는 코드들은 다음과 같습니다.

# 필요없는 행(row) 제외
df1 = df1[1:]  
#첫번째 행을 지워버린다. 
#이는 가령, 첫번째 행을 컬럼으로 설정하였을때 해당된다.

먼저 다음과 같이,

데이터 프레임을 두 번째 행부터 - 끝까지로 설정하여 다시 저장하는 방법입니다.

이외에도

df.drop 을 활용할 수도 있습니다.

df.drop(df.columns[0], axis=1) #이렇게 첫번째 컬럼을 삭제할 수도 있다.
df = df.drop(6) #이렇게 하면, 인덱스 6번째를 드랍한다.

다음은 데이터 자리를 변경하는 방법입니다.

np.transpose #이렇게 하면 자리가 바꿔진다. 
df1 = df1.T # 이런식으로도 활용할 수 있다. 

#transpose 할 경우에는, 인덱스 번호가 위로 갈 수가 있다. 이를 고치려면
new_header = df.iloc[0] # 1번째 row를 해더로 설정해준다.
df = df[1:] # 1번째 row를 제외하여 데이터를 저장한다.
df.columns = new_header # 지정한 헤더를 설정한다.

다음과 같이 transpose 를 활용하면 됩니다!

여기서 +

여러개의 파일을 불러올 때는 해당 코드를 여러 번 써주어야 하는데요.

이를 간편하기 위해서 함수를 만들 수 있습니다.

#이를 함수로 구현하면
def get_df(url):
    df = pd.read_csv(url).transpose() #데이터를 불러오고, 이를 뒤집는다.
    new_header = df.iloc[0] #첫번째 로우를 설정하고, 이를 저장한다.
    df = df[1:] #그리고 첫번째 row를 지운다.
    df.columns = new_header  #저장한 로우를 해더로 설정한다.
    return df

참고해주시면 되겠습니다 :)