190224> Python-M.NET 차트 순위 crawling

엠넷 차트 순위를 크롤링 하여 목록화 / 이미지를 다운받자.

import bs4
import requests

def save_image(img_url, date, rank, title, artist):
    response = requests.get(img_url)
    content = response.content
    filename = "{}\\{:03}_{}_{}.jpeg".format(date, rank, title, artist)
    file = open(filename,"wb")
    file.write(content)

date = input("검색할 날짜[YYYYmmdd]를 입력하세요 : ")
pages = int(input("총 몇 페이지를[50/page]를 크롤링할까요 : "))

charts = []
for page in range(1, pages + 1):
    url = "http://www.mnet.com/chart/TOP100/{}?pNum={}".format(date, page)
    response = requests.get(url)
    text = response.text
    html = bs4.BeautifulSoup(text, "html.parser")

    tr_list = html.find("table").find("tbody").find_all("tr")
    for tr in tr_list:
        rank = int(tr.find("span", {"class": "MMLI_RankNum"}).text.rstrip("위"))
        img_url = tr.find("img")["src"]
        title = tr.find("a", {"class": "MMLI_Song"}).text
        try:
            artist = tr.find("a", {"class": "MMLIInfo_Artist"}).text
            album = tr.find("a", {"class": "MMLIInfo_Album"}).text
        except:
            artist_album = tr.find("div", {"class": "MMLITitle_Info"}).text
            artist = artist_album.split("/")[0].strip("\n\t\r ")
            album = artist_album.split("/")[1].strip("\n\t\r ")

        charts.append([rank, title, artist, album, img_url])

import csv
import os
command = "md {}".format(date)
os.system(command)
filename = "{}\\charts-{}.csv".format(date, date)
file = open(filename, "w", newline="", encoding="utf-8-sig")
csvfile = csv.writer(file)

for song in charts:
    rank = song[0]
    title = song[1]
    artist = song[2]
    img_url = song[-1]
    save_image(img_url, date, rank, title, artist)
    csvfile.writerow(song[:-1])

file.close()

검색할 날짜[YYYYmmdd]를 입력하세요 : 20190101

총 몇 페이지를[50/page]를 크롤링할까요 : 1

Process finished with exit code 0

< CSV 출력물 >

< 이미지 추출 >

저작자표시 (새창열림)

'Python_Crawling > Crawling' 카테고리의 다른 글

190302>Python - Naver 증권 일일 시세 크롤링 (0)	2019.03.02
190224> Python-NaverNews 사용자 입력 받아 크롤링 (0)	2019.02.24
190224> Python-NaverNews 사진 + 뉴스 제목 + 요약 + 제공자 크롤링 (0)	2019.02.24
190224> Python-Naver News 크롤링 (0)	2019.02.24
190224> Python-Naver Menu 크롤링 (0)	2019.02.24

오늘 코딩 내일 디버깅

190224> Python-M.NET 차트 순위 crawling

'Python_Crawling > Crawling' 카테고리의 다른 글

티스토리툴바

190224> Python-M.NET 차트 순위 crawling

'Python_Crawling > Crawling' 카테고리의 다른 글

'Python_Crawling/Crawling' Related Articles

티스토리툴바