본문 바로가기

python

(197)
Pandas - Gapminder Data 분석(TSV File) 2 1. Import Moduleimport pandas as pd from print_df import print_df import matplotlib.pyplot as plt 2. Data 분석- DataFrame 여러 행을 추출 1(df.loc[인덱스 번호])print_df(df.loc[[0, 1, 2]])+---+-------------+-----------+------+--------------------+----------+-------------------+| | country | continent | year | lifeExp | pop | gdpPercap |+---+-------------+-----------+------+--------------------+----------+-----..
Pandas - Gapminder Data 분석(TSV File) 1 1. Sample Data 2. Import Moduleimport pandas as pd from print_df import print_df import matplotlib.pyplot as plt 3. Data 분석- TSV(tab separated values) : Data들이 tap 으로 구분된 파일. - TSV File Load(sep = 구분형식)df = pd.read_csv('data\gapminder.tsv', sep='\t') - Data의 행(row) / 열(column) 갯수 확인print('shape:', df.shape)shape: (1704, 6) Process finished with exit code 0 - Data 행의 머리말 부분 확인print_df(df.head())+..
Pandas - 연비 TEST Data 분석 2 1. 평균 연비- 평균 연비 : (고속도로 연비 + 도시 연비) / 2- 평균 연비 20 이상 합격 2. 평균 연비 구하기df['연비테스트'] = numpy.where((df['cty'] + df['hwy']) / 2 >= 20, '합격', '불합격') print_df(df.head(10))+---+------------+--------------+------------+-------+------+-----+------------+-----+-----+-----+----+---------+------------+| | Unnamed: 0 | manufacturer | model | displ | year | cyl | trans | drv | cty | hwy | fl | class | 연비테스트 |+-..
Pandas - 연비 TEST Data 분석 1 1. Sample Data 파일 manufacturer model displ year cyl trans drv cty hwy fl class 1 audi a4 1.8 1999 4 auto(l5) f 18 29 p compact 2 audi a4 1.8 1999 4 manual(m5) f 21 29 p compact 3 audi a4 2 2008 4 manual(m6) f 20 31 p compact 4 audi a4 2 2008 4 auto(av) f 21 30 p compact 5 audi a4 2.8 1999 6 auto(l5) f 16 26 p compact 6 audi a4 2.8 1999 6 manual(m5) f 18 26 p compact 7 audi a4 3.1 2008 6 auto(av)..
190517 21:42> Naver 실시간 검색어 20위 - Naver 실시간 검색어 분석 - Import Modulefrom Crawler import crawler from print_df import print_df from pandas import DataFrame - Data 분석 순서데이터 수집 -> 크롤링 수행 -> 데이터 전처리 -> 검색어를 리스트로 분류 -> 데이터 프레임 생성 - Data Frame+------+-----------------+| | 검색어 |+------+-----------------+| 01위 | 조은정 || 02위 | 소지섭 || 03위 | 허경영 || 04위 | 현아 || 05위 | 원더풀 고스트 || 06위 | 군산 소고기무국 || 07위 | 권역외상센터 || 08위 | 박미경 || 09위 | 편승엽 || 10위 ..
190517>Korea News keyword wordcloud - Import Modulefrom Crawler import crawler from wordcloud import WordCloud from matplotlib import pyplot from collections import Counter from konlpy.tag import Okt import datetime as dt - Korea News Keyword Wordcloud현재 뉴스에서 많이 사용중인 키워드 분석 시각화 모듈WordCloud를 활용하여 시각화190517 키워드 분석 시각화 - 현재 키워드 : 갯수'기자': 56, '정부': 50, '대표': 47, '한국': 44, '미국': 42, '중국': 37, '우리': 36, '업체': 35, '뉴스': 32, '비틀스': 30, '갤..
Python Pandas 박스오피스 180516 순위 분석 - Import Moduleimport datetime as dt import requests import json import pandas from pandas import DataFrame from matplotlib import pyplot from print_df import print_df - Parsing Data+---+----------+------------+---------+-----------+----------+--------------------+------------+------+-----------+---------------+------+--------------+------------+-------------+------------+------------+---------+..
JSON - Data Frame Conversion(Pandas 분석) 1. Sample JSON Site : https://api.androidhive.info/contacts/ 2. Import Moduleimport requests import json from pandas import DataFrame from print_df import print_df 3. Sample Codeimport requests import json from pandas import DataFrame from print_df import print_df url = 'https://api.androidhive.info/contacts' response = requests.get(url) if response.status_code != 200: print("[%d Error] %s" % (r..