728x90
반응형
소개
안녕하세요 아임코딩입니다.
이번에는 파이썬 pandas 를 이용하여 csv 파일을 읽으려고 할 때 발생할 수 있는 오류에 대해서 다루도록 하겠습니다.
pandas 를 이용한 csv 파일 읽기
import pandas as pd
data = pd.read_csv('train_data.csv')
pandas 라이브러리를 추가하고 read_csv 함수를 통해 csv 파일을 읽기를 시도했습니다.
인코딩 오류
하지만 다음과 같은 오류가 발생했습니다.
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb1 in position 0: invalid start byte
utf-8 코덱이 디코드될 수 없다는 내용의 오류인데요,
csv 파일을 읽을 때 인코딩 방식이 달라서 오류가 나는 것입니다.
해결방법
이를 해결하기 위해서는 csv 파일을 읽을 때 인코딩 방식을 수정해줘야 합니다.
pd.read_csv() 함수에 encoding = "cp949" 코드를 추가하니 인코딩 방식이 맞아서 문제가 해결되는 것을 확인할 수 있습니다.
정리
pandas 를 이용하여 csv 파일을 읽을 때 발생할 수 있는 오류인 UnicodeDecodeError 는
encoding 방식을 설정해서 해결할 수 있습니다.
728x90
반응형
'프로그래밍 > Python' 카테고리의 다른 글
[파이썬 기초] 리스트 list (1) | 2024.01.11 |
---|---|
[파이썬] csv 파일 읽기 ( pandas vs csv 모듈 ) (0) | 2024.01.11 |
[파이썬] if - else 조건문 (1) | 2024.01.10 |
[파이썬 기초] if 조건문 (분기문) (1) | 2024.01.10 |
[파이썬 기초] 불 (bool) 자료형 (0) | 2024.01.10 |