|파이썬 엑셀 파일 읽기 함수|
Show 이번 스테이지에서는 데이터를 엑셀로 저장할 수 있는 OpenPyXL패키지 사용법에 대해 배우고, 수집한 데이터를 엑셀파일(.xlsx)에 저장합니다.
pip 명령어를 사용하거나, 파이참에서 OpenPyXL패키지를 설치합니다. 외부 패키지 설치방법 다시보기 >> 3주차 Stage1.
# 워크북(엑셀파일)을 원하는 이름으로 저장합니다. 기본적으로 OpenPyXL은 엑셀의 작업순서 그대로 활용하기 때문에 # A1셀에 hello world!를 입력합니다. sheet['A1'] ='hello world!' # 워크북(엑셀파일)을 원하는 이름으로 저장합니다.
sheet.cell(row=3, column=3).value ="BYE!!" 셀번호를 통해 데이터를 입력하는 방식은 정확한 셀번호를 알지 못하면 입력하기 어렵고 반복작업을 하기 쉽지 않기 때문에 subject = ["Python", "Java", "HTML", "JavaScript"]
데이터를 가장 쉽게
저장할 수 있는 방법 중 하나이기 때문에 앞으로 가장 많이 사용하게 될 *추가: 알면 좋은 시트 관련 OpenPyXL 함수sheet1.title = "1st sheet" sheet2 = wb.create_sheet("2nd sheet") # sheet1과 sheet2에 동시에 데이터 쓰기 sheet1.cell(row=i, column=1).value = i sheet2.cell(row=1, column=i).value = i
시트 관련 함수를 사용하면 한 번에 여러개의 시트에 동시에 작업을 할 수 있기 때문에 여러가지 데이터를 동시에 수집할 수 있습니다. 네이버 TV 데이터 수집 결과 엑셀파일로 저장하기#0. 지난 코드 불러오기(3주차 Challenge1.)from bs4 import BeautifulSoup raw = requests.get("https://tv.naver.com/r") html = BeautifulSoup(raw.text, "html.parser") # 1위 - 100위 컨테이너 선택자: dl.cds_info clips = html.select("dl.cds_info") title = cl.select_one("dt.title").text.strip() chn = cl.select_one("dd.chn").text.strip() hit = cl.select_one("span.hit").text.strip() like = cl.select_one("span.like").text.strip() from bs4 import BeautifulSoup sheet.append(["제목", "채널","재생 수","좋아요 수"]) raw = requests.get("https://tv.naver.com/r") html = BeautifulSoup(raw.text, "html.parser") 엑셀 파일에 데이터를 저장하기 위해서 #2. 수집한 데이터 쓰기 / 엑셀파일 저장하기title = cl.select_one("dt.title").text.strip() chn = cl.select_one("dd.chn").text.strip() hit = cl.select_one("span.hit").text.strip() like = cl.select_one("span.like").text.strip() # append함수에는 리스트 형식으로 데이터를 넣어줍니다. sheet.append([title, chn, hit, like]) 수집된 데이터의 파일 저장 방법은 csv파일과 엑셀파일이 크게 다르지 않습니다. 다만 아래 몇가지 차이점이 있기 때문에 상황에 맞게 수집한 데이터를 저장하는 것이 가장 좋습니다.
|