본문 바로가기
프로그래밍/Python

[파이썬] UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb1 in position 0: invalid start byte

by 아임코딩 2024. 1. 11.
728x90
반응형

소개

안녕하세요 아임코딩입니다.

이번에는 파이썬 pandas 를 이용하여 csv 파일을 읽으려고 할 때 발생할 수 있는 오류에 대해서 다루도록 하겠습니다.

 

 

pandas 를 이용한 csv 파일 읽기

import pandas as pd
data = pd.read_csv('train_data.csv')

 

pandas 라이브러리를 추가하고 read_csv 함수를 통해 csv 파일을 읽기를 시도했습니다.

 

인코딩 오류

 

하지만 다음과 같은 오류가 발생했습니다.

 

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb1 in position 0: invalid start byte

 

utf-8 코덱이 디코드될 수 없다는 내용의 오류인데요,

 

csv 파일을 읽을 때 인코딩 방식이 달라서 오류가 나는 것입니다.

 

해결방법

 

이를 해결하기 위해서는 csv 파일을 읽을 때 인코딩 방식을 수정해줘야 합니다.

 

 

 

pd.read_csv() 함수에 encoding = "cp949" 코드를 추가하니 인코딩 방식이 맞아서 문제가 해결되는 것을 확인할 수 있습니다.

 

정리

pandas 를 이용하여 csv 파일을 읽을 때 발생할 수 있는 오류인 UnicodeDecodeError 는

encoding 방식을 설정해서 해결할 수 있습니다.

 

728x90
반응형