※강의를 듣고 이해한 내용을 바탕으로 정리한 것이라서 오류가 있을 수 있습니다.

1. CSV 파일 읽기

이것은 파이썬으로 읽어올 CSV 파일의 내용이다.

 

코드

import csv # csv 파일을 사용하기 위해선 파이썬에서 기본적으로 만들어 놓은 csv패키지를 import 시켜줘야 한다.
with open('./resource/sample1.csv', 'r') as f:
# with문으로 읽을 csv파일의 경로를 지정해주고 읽기 모드인 'r'을 써주고 as를 사용하여 f로 이름을 지정하였다.
    reader = csv.reader(f) # 변수에 reader 클래스를 선언해서 csv 파일 읽음
    # next(reader) Header 스킵 (맨위 행)

    # 데이터 타입 확인
    print(type(reader))
    print()# 개행 하기 위한 print문

    for c in reader: # csv파일에 있는 내용 끝날때 까지 반복
        print(c)

실행 결과

reader함수가 클래스 타입이라서 반복문으로 읽어 올 수 있다.

 

 

 

2. 엑셀 파일 읽기(XSL, XLSX)

이것은 파이썬으로 읽어올 엑셀 파일의 내용이다.

 

 

① 패키지 설치

엑셀 파일을 읽어 오려면 아래의 패키지 3개가 필요하다.

● xlrd 설치

● openpyxl 설치

● pandas 설치

※ pandas를 주로 사용 (왜나하면 내부적으로 xlrd, openpyxl이 내부적으로 작동 하기 때문)

이 3가지 패키지가 상호작용해서 작동하기에 3가지를 다 설치해주어야한다.

 

1) xlrd 설치

cmd창을 열어서 pip install xlrd 명령어를 써주면 설치가 된다.

 

2) openpyxl 설치

 

cmd창을 열어서 pip install openpyxl 명령어를 써주면 설치가 된다.

 

 

3) pandas 설치

 

cmd창을 열어서 pip install pandas 명령어를 써주면 설치가 된다.

 

 

 

② 상위 1~5번째 데이터 읽기

import pandas as pd 
# pandas를 쓸때는 import로 불러와줘야한다. as로 이름을 간단하게 pd로 해주었다.

xlsx = pd.read_excel('./resource/sample.xlsx')
# 변수에 위와 같이 pandas의 read_excel 함수를 이용해서 읽어올 엑셀 파일의 경로를 지정해주면 된다.

# 상위 데이터 확인
print(xlsx.head()) # 상위 1~5번째까지 보여줌

실행 결과

0번~4번까지 상위 5번째까지의 데이터를 출력해주는 것을 볼수있다.

 

 

③ 하위 1~5번째 데이터 읽기

import pandas as pd
# pandas를 쓸때는 import로 불러와줘야한다. as로 이름을 간단하게 pd로 해주었다.

xlsx = pd.read_excel('./resource/sample.xlsx')
# 변수에 위와 같이 pandas의 read_excel 함수를 이용해서 읽어올 엑셀 파일의 경로를 지정해주면 된다.

# 하위 데이터 확인
print(xlsx.tail()) # 하위 1~5번째까지 보여줌

실행 결과

15~19번까지 하위 5번째까지의 데이터를 출력해주는 것을 볼수있다.

 

 

 

 

 

'개발 공부한 내용 정리 > python' 카테고리의 다른 글

python DB- 조회  (0) 2020.07.24
python DB- SQLite 연동, 테이블 생성, 데이터 삽입  (0) 2020.07.23
python- 파일 읽기, 쓰기  (0) 2020.07.20
python- 모듈과 패키지  (0) 2020.07.19
python- 클래스  (0) 2020.07.15

+ Recent posts