소개
안녕하세요 아임코딩입니다.
이번에는 파이썬을 이용하여 csv 파일을 읽어 파이썬 변수에 저장하는 방법에 대해서 알아보겠습니다.
공공데이터 가져오기
우선 csv 데이터 파일이 필요한데, 공공데이터 포털에서 사용하고 싶은 데이터를 골라서 사용하면 되겠습니다.
데이터는 공공데이터포털에서
한국철도공사_철도통계 용어정의
데이터를 csv 형식으로 다운받아 사용했습니다.
csv 모듈로 파일 읽기
import csv
f = open('train_data.csv', 'r')
read = csv.reader(f)
read
csv 파일을 저장한 후
파이썬 파일과 같은 폴더에 train_data.csv 파일을 저장했습니다.
만약 다른 경로에 데이터 파일이 있다면 open('파일경로', 'r') 로 설정하면 되겠습니다.
csv 모듈을 이용하여 데이터를 읽는 방법은 csv 파일을 먼저 open 함수를 통해 열고
csv.reader() 함수를 통해 _csv.reader 객체를 반환합니다.
csv.reader 객체 반복문 출력
_csv.reader 객체는 반복문을 통해서
csv 파일 한 줄씩 읽을 수 있습니다.
이렇게 반복문을 이용하여 데이터를 알맞게 처리하면 되겠습니다.
pandas 모듈 설치
pandas 는 데이터 분석을 위한 라이브러리입니다.
pandas 가 없다면 설치를 해줘야 합니다.
저는 주피터 노트북 기준으로 설치했습니다.
pip install pandas
저는 이미 설치가 되어있기 때문에 이미 설치되었다는 내용이 화면에 출력됩니다.
pandas 모듈로 읽기
import pandas as pd
data = pd.read_csv('train_data.csv', encoding = "cp949")
data
read_csv 함수를 이용하여 csv 파일을 읽을 수 있습니다.
read_csv(파일경로, 인코딩방식) 입니다.
오류가 난다면 파일경로나 인코딩 방식을 잘 변경해보시기 바랍니다.
이렇게 pandas 를 이용하면 csv 파일 형식의 데이터를 읽을 수 있습니다.
이 데이터를 다루는 방법은 추후에 다루도록 하겠습니다.
정리
csv 파일을 읽는 방법 : csv 모듈 vs pandas 모듈
'프로그래밍 > Python' 카테고리의 다른 글
[파이썬 기초] for 반복문 과 range() (0) | 2024.01.11 |
---|---|
[파이썬 기초] 리스트 list (1) | 2024.01.11 |
[파이썬] UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb1 in position 0: invalid start byte (0) | 2024.01.11 |
[파이썬] if - else 조건문 (1) | 2024.01.10 |
[파이썬 기초] if 조건문 (분기문) (1) | 2024.01.10 |