1. Import Module
from Crawler import crawler
from print_df import print_df
from pandas import DataFrame
2. Code
from Crawler import crawler
from print_df import print_df
from pandas import DataFrame
dom = crawler.select("https://www.naver.com",
selector=".ah_roll_area > .ah_l > .ah_item > .ah_a > .ah_k")
rank_list = []
keyword_list = []
for i, item in enumerate(dom):
rank_list.append( "%02d위" % (i+1) )
keyword_list.append(item.text.strip())
df = DataFrame(keyword_list, index=rank_list, columns=['검색어'])
print_df(df)
3. Code 풀이
- 데이터 수집 후 리스트로 반환
dom = crawler.select("https://www.naver.com",
selector=".ah_roll_area > .ah_l > .ah_item > .ah_a > .ah_k")
print_df(dom)
[<span class="ah_k">남태현</span>, <span class="ah_k">장재인</span>, <span class="ah_k">케세라세라</span>, <span class="ah_k">차명진</span>, <span class="ah_k">대한민국 호주</span>, <span class="ah_k">한국 호주</span>, <span class="ah_k">김원봉</span>, <span class="ah_k">외장하드</span>, <span class="ah_k">청춘주유프리패스</span>, <span class="ah_k">구혜선</span>, <span class="ah_k">부산 아시아드 주경기장</span>, <span class="ah_k">천명훈 전여친</span>, <span class="ah_k">엑스맨 아포칼립스</span>, <span class="ah_k">sk오일로패스</span>, <span class="ah_k">나이키 언더커버 데이브레이크</span>, <span class="ah_k">샘코</span>, <span class="ah_k">검색어를 입력하세요 www</span>, <span class="ah_k">킴 카다시안</span>, <span class="ah_k">작업실</span>, <span class="ah_k">약산 김원봉</span>]
rank_list = []
- 검색어 저장 리스트 생성
keyword_list = []
- 순위와 검색어를 리스트에 분류 작업
for i, item in enumerate(dom):
rank_list.append( "%02d위" % (i+1) )
keyword_list.append(item.text.strip())
- 데이터프레임 생성
df = DataFrame(keyword_list, index=rank_list, columns=['검색어'])
print_df(df)
<class 'pandas.core.frame.DataFrame'>
(20, 1)
+------+------------------------------+
| | 검색어 |
+------+------------------------------+
| 01위 | 남태현 |
| 02위 | 장재인 |
| 03위 | 케세라세라 |
| 04위 | 차명진 |
| 05위 | 대한민국 호주 |
| 06위 | 한국 호주 |
| 07위 | 김원봉 |
| 08위 | 외장하드 |
| 09위 | 청춘주유프리패스 |
| 10위 | 구혜선 |
| 11위 | 부산 아시아드 주경기장 |
| 12위 | 천명훈 전여친 |
| 13위 | 엑스맨 아포칼립스 |
| 14위 | sk오일로패스 |
| 15위 | 나이키 언더커버 데이브레이크 |
| 16위 | 샘코 |
| 17위 | 검색어를 입력하세요 www |
| 18위 | 킴 카다시안 |
| 19위 | 작업실 |
| 20위 | 약산 김원봉 |
+------+------------------------------+
Process finished with exit code 0
'Python_Intermediate > Pandas' 카테고리의 다른 글
[Pandas]Python Study - PPT Presentation Material - DataFrame (0) | 2020.01.12 |
---|---|
[Pandas]Python Study - PPT Presentation Material (0) | 2019.12.23 |
190607 16:42> Naver 실시간 검색어 20위 (0) | 2019.06.07 |
Python Pandas 박스오피스 190606 순위 분석 (0) | 2019.06.07 |
Python Pandas 박스오피스 190604 순위 분석 (0) | 2019.06.05 |