본문 바로가기

판다스

(29)
Pandas - 190529모니터 제품 비교 분석 1. Import Modulefrom Crawler import crawler from pandas import DataFrame from pandas import concat 2. Parsing Data검색할 내용을 입력하세요 : 모니터 제품명 ... 호스트0 삼성전자 S27R750 SPACE ... NaN0 삼성전자 S32R750 SPACE ... NaN0 삼성전자 C32F397 ... NaN0 삼성전자 S24F350 ... NaN0 삼성전자 S24D300 ... NaN0 삼성전자 C27F391 ... NaN0 삼성전자 S24F350 ... NaN0 LG전자 24MK400H ... NaN0 삼성전자 C27F390 ... NaN0 한성컴퓨터 Ultron 2457C 커브드 144 ... NaN0 한성컴퓨..
Pandas - Json Data 분석 4(Data 시각화) 1. Data Codeimport json from pandas import DataFrame, Series import pandas as pd import numpy as np import matplotlib.pyplot as plt from print_df import print_df path = 'data\example.txt' data = open(path, encoding='utf-8').read() records = [json.loads(line) for line in open(path, encoding='utf-8')] time_zone = [rec['tz'] for rec in records if 'tz' in rec] def get_count(sequence): counts = {} # ..
Pandas - 데이터프레임 병합(merge) 1. 데이터프레임 병합(merge)Data Table 중에 여러개의 csv로 되어있으나 파일은 서로 연관성이 있는 경우도 있다.이를 병합하는 과정이 필요하다. 2. SampleData 3. Import Moduleimport pandas as pd from print_df import print_df 4. Data Code- person DataFrameperson = pd.read_csv('data\survey_person.csv') +---+----------+-----------+----------+| | ident | personal | family |+---+----------+-----------+----------+| 0 | dyer | William | Dyer || 1 | pb | Fra..
Pandas - 1880 ~ 2010 년까지 출생 자료 분석 2 1. Sample Data1880 ~ 2010 년까지 태어난 아이의 이름 / 성별 / 출생수https://developer-ankiwoong.tistory.com/268 2. Import Moduleimport pandas as pd import matplotlib.pyplot as plt from print_df import print_df 3. Pandas Data Code- TXT 파일 읽어서 DataBase화years = range(1880, 2011) df_pieces = [] # 1880 ~ 2010년 까지의 데이터 프레임을 젖아할 리스트 for year in years: # 1880 ~ 2010 path = 'data\yob%d.txt' % year # 파일 이름 df = pd.read_cs..
Pandas - 1880 ~ 2010 년까지 출생 자료 분석 1 1. Sample Data1880 ~ 2010 년까지 태어난 아이의 이름 / 성별 / 출생수 2. Import Moduleimport pandas as pd import matplotlib.pyplot as plt from print_df import print_df 3. Pandas Data Code- 일부 파일에 DataFrame 작업(파일에 컬럼명이 없으므로 header=None / 필요한 컬럼명 지정)names1880 = pd.read_csv('data\yob1880.txt', header=None, names=['name', 'gender', 'born'], encoding='utf-8') - DataFrame 정보 확인print(names1880.info()) RangeIndex: 2000 e..
Python - 한국기상청 도시별 현재 날씨 Data 분석 시각화 1. Import Moduleimport pandas as pd from print_df import print_df import matplotlib.pyplot as plt 2. Sample Data : https://developer-ankiwoong.tistory.com/259 3. Codeimport pandas as pd from print_df import print_df import matplotlib.pyplot as plt df = pd.read_csv('weather.csv', encoding='utf=8') df_list = list(df['지역']) index_dict = {} for i, v in enumerate(df_list): index_dict[i] = v df.drop('..
Pandas - Scientists Data 분석 1. Sample Data 2. Import Moduleimport pandas as pd from print_df import print_df 3. Data 분석- CSV(comma separated values) : Data들이 comma(,)로 구분된 파일. - CSV File Load(CSV는 ,로 구분 되어있으므로 sep를 안줘도 무방)df = pd.read_csv('data\scientists.csv') - Data의 행(row) / 열(column) 갯수 확인df = pd.read_csv('data\scientists.csv') print('shape:', df.shape)shape: (8, 5) Process finished with exit code 0 - Data의 양이 적으므로 CSV..
Pandas - Gapminder Data 분석(그래프 분석) 3 1 Sample Data 2. import moduleimport pandas as pd import matplotlib.pyplot as plt 3. 그래프 분석import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('data\gapminder.tsv', sep='\t') year_lifeExp_mean = df.groupby('year')['lifeExp'].mean() year = df.loc[0: , 'year'] year_drop = year.drop_duplicates() year_x = [] for i in year_drop: year_x.append(i) plt.rcParams["font.family"] = 'NanumGo..