본문 바로가기

pandas

(24)
Python - 한국기상청 도시별 현재 날씨 Data 분석 시각화 1. Import Moduleimport pandas as pd from print_df import print_df import matplotlib.pyplot as plt 2. Sample Data : https://developer-ankiwoong.tistory.com/259 3. Codeimport pandas as pd from print_df import print_df import matplotlib.pyplot as plt df = pd.read_csv('weather.csv', encoding='utf=8') df_list = list(df['지역']) index_dict = {} for i, v in enumerate(df_list): index_dict[i] = v df.drop('..
Pandas - Scientists Data 분석 1. Sample Data 2. Import Moduleimport pandas as pd from print_df import print_df 3. Data 분석- CSV(comma separated values) : Data들이 comma(,)로 구분된 파일. - CSV File Load(CSV는 ,로 구분 되어있으므로 sep를 안줘도 무방)df = pd.read_csv('data\scientists.csv') - Data의 행(row) / 열(column) 갯수 확인df = pd.read_csv('data\scientists.csv') print('shape:', df.shape)shape: (8, 5) Process finished with exit code 0 - Data의 양이 적으므로 CSV..
Pandas - Gapminder Data 분석(그래프 분석) 3 1 Sample Data 2. import moduleimport pandas as pd import matplotlib.pyplot as plt 3. 그래프 분석import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('data\gapminder.tsv', sep='\t') year_lifeExp_mean = df.groupby('year')['lifeExp'].mean() year = df.loc[0: , 'year'] year_drop = year.drop_duplicates() year_x = [] for i in year_drop: year_x.append(i) plt.rcParams["font.family"] = 'NanumGo..
Pandas - Gapminder Data 분석(TSV File) 2 1. Import Moduleimport pandas as pd from print_df import print_df import matplotlib.pyplot as plt 2. Data 분석- DataFrame 여러 행을 추출 1(df.loc[인덱스 번호])print_df(df.loc[[0, 1, 2]])+---+-------------+-----------+------+--------------------+----------+-------------------+| | country | continent | year | lifeExp | pop | gdpPercap |+---+-------------+-----------+------+--------------------+----------+-----..
Pandas - Gapminder Data 분석(TSV File) 1 1. Sample Data 2. Import Moduleimport pandas as pd from print_df import print_df import matplotlib.pyplot as plt 3. Data 분석- TSV(tab separated values) : Data들이 tap 으로 구분된 파일. - TSV File Load(sep = 구분형식)df = pd.read_csv('data\gapminder.tsv', sep='\t') - Data의 행(row) / 열(column) 갯수 확인print('shape:', df.shape)shape: (1704, 6) Process finished with exit code 0 - Data 행의 머리말 부분 확인print_df(df.head())+..
Pandas - 연비 TEST Data 분석 2 1. 평균 연비- 평균 연비 : (고속도로 연비 + 도시 연비) / 2- 평균 연비 20 이상 합격 2. 평균 연비 구하기df['연비테스트'] = numpy.where((df['cty'] + df['hwy']) / 2 >= 20, '합격', '불합격') print_df(df.head(10))+---+------------+--------------+------------+-------+------+-----+------------+-----+-----+-----+----+---------+------------+| | Unnamed: 0 | manufacturer | model | displ | year | cyl | trans | drv | cty | hwy | fl | class | 연비테스트 |+-..
Pandas - 연비 TEST Data 분석 1 1. Sample Data 파일 manufacturer model displ year cyl trans drv cty hwy fl class 1 audi a4 1.8 1999 4 auto(l5) f 18 29 p compact 2 audi a4 1.8 1999 4 manual(m5) f 21 29 p compact 3 audi a4 2 2008 4 manual(m6) f 20 31 p compact 4 audi a4 2 2008 4 auto(av) f 21 30 p compact 5 audi a4 2.8 1999 6 auto(l5) f 16 26 p compact 6 audi a4 2.8 1999 6 manual(m5) f 18 26 p compact 7 audi a4 3.1 2008 6 auto(av)..
190517 21:42> Naver 실시간 검색어 20위 - Naver 실시간 검색어 분석 - Import Modulefrom Crawler import crawler from print_df import print_df from pandas import DataFrame - Data 분석 순서데이터 수집 -> 크롤링 수행 -> 데이터 전처리 -> 검색어를 리스트로 분류 -> 데이터 프레임 생성 - Data Frame+------+-----------------+| | 검색어 |+------+-----------------+| 01위 | 조은정 || 02위 | 소지섭 || 03위 | 허경영 || 04위 | 현아 || 05위 | 원더풀 고스트 || 06위 | 군산 소고기무국 || 07위 | 권역외상센터 || 08위 | 박미경 || 09위 | 편승엽 || 10위 ..