본문 바로가기

Ankiwoong

(1836)
[EXCEL]Excel File Data Analysis(엑셀 파일 Pandas 분석) 1. Sample Data 2. 데이터 작업 절차 3. 사용 모듈 from print_df import print_df from pandas import ExcelFile from pandas import DataFrame from matplotlib import pyplot as plt import numpy as np 4. 데이터 수집 # 엑셀파일 읽기 xls_file = ExcelFile('C:\\python_StudyGroup\\200215\\data\\mpg.xlsx') # 엑셀의 sheet 이름들 중에서 0번째 sheet를 dataframe으로 변환 df = xls_file.parse(xls_file.sheet_names[0], index_col=0) print_df(df.head()) > 결..
[API]영화진흥원 박스오피스 순위 분위 1. API 발급 Site - http://www.kobis.or.kr/kobisopenapi/homepg/main/main.do 영화진흥위원회 오픈API www.kobis.or.kr 2. 데이터 작업 절차 - 수집(Data Collection) > 전처리(Data pretreatment) > 정제(Data refining) > 시각화(Data Visualization) 3. 사용 패키지 import datetime as dt import requests import json import pandas as pd from pandas import DataFrame from matplotlib import pyplot as plt from print_df import print_df 4. 데이터 수집 # 영..
[Python]Data Preparation Basic(데이터 전처리 기초) 5 Live Codeing 1. Sample Data # 딕셔너리 성적 리스트 grade_dic = { '국어': [98, 88, 68, 64, 120], '영어': [None, 90, 60, 20, 50], '수학': [90, 70, None, 31, None], '과학': [120, 50, None, 60, 88] } 2. 상자 수염 그림으로 이상치 확인하기 from pandas import DataFrame from Data import grade_dic from print_df import print_df from matplotlib import pyplot from sklearn.impute import SimpleImputer import numpy df = DataFrame(grade_dic, ..
[Python]Data Preparation Basic(데이터 전처리 기초) 4 Live Codeing 1. Sample Data # 딕셔너리 성적 리스트 grade_dic = { '국어': [98, 88, 68, 64, 120], '영어': [None, 90, 60, 20, 50], '수학': [90, 70, None, 31, None], '과학': [120, 50, None, 60, 88] } 2. 결측치 여부 확인 from pandas import DataFrame from Data import grade_dic from print_df import print_df df = DataFrame(grade_dic, index=['노진구', '이슬이', '비실이', '퉁퉁이', '도라에몽']) # print_df(df) # 결측치 확인 null_data = df.isnull() nu..
[Python]Data Preparation Basic(데이터 전처리 기초) 3 Live Codeing 1. Sample Data # 딕셔너리 성적 리스트 grade_dic = { '국어': [98, 88, 68, 64, 120], '영어': [None, 90, 60, 20, 50], '수학': [90, 70, None, 31, None], '과학': [120, 50, None, 60, 88] } 2. 신규 열 추가 from pandas import DataFrame from Data import grade_dic from print_df import print_df df = DataFrame(grade_dic, index=['노진구', '이슬이', '비실이', '퉁퉁이', '도라에몽']) # print_df(df) # 새로운 열 추가 df['프로그래밍'] = [92, 49, 21,..
[Python]Data Preparation Basic(데이터 전처리 기초) 2 Live Codeing 1. Sample Data # 딕셔너리 성적 리스트 grade_dic = { '국어': [98, 88, 68, 64, 120], '영어': [None, 90, 60, 20, 50], '수학': [90, 70, None, 31, None], '과학': [120, 50, None, 60, 88] } 2. 리스트 사용 행 추가 from pandas import DataFrame from Data import grade_dic from print_df import print_df df = DataFrame(grade_dic, index=['노진구', '이슬이', '비실이', '퉁퉁이', '도라에몽']) # print_df(df) # 리스트 행 추가 df.loc['짱구'] = [90, 80..
[Python]Data Preparation Basic(데이터 전처리 기초) 1 Live Coding 1. Sample Data # 딕셔너리 성적 리스트 grade_dic = { '국어': [98, 88, 68, 64, 120], '영어': [None, 90, 60, 20, 50], '수학': [90, 70, None, 31, None], '과학': [120, 50, None, 60, 88] } 2. prettytable pip install prettytable 3. 열 순서 변경 from pandas import DataFrame from Data import grade_dic from print_df import print_df # 데이터 프레임 df = DataFrame(grade_dic, index=['노진구', '이슬이', '비실이', '퉁퉁이', '도라에몽']) # 열 ..
[Python]Matplotlib box-and-whisker plot Basic(상자 수염 그림) Live Coding 1. Sample Data # 딕셔너리 성적 리스트 grade_dic = { '국어': [98, 88, 68, 64, 120], '영어': [None, 90, 60, 20, 50], '수학': [90, 70, None, 31, None], '과학': [120, 50, None, 60, 88] } 2. 일부 데이터에 한해서 상자 수염 그림 만들기 from pandas import DataFrame from matplotlib import pyplot from Data import grade_dic df = DataFrame(grade_dic, index=['노진구', '이슬이', '비실이', '퉁퉁이', '도라에몽']) # 한글폰트, 그래픽 크기 설정 pyplot.rcParams['f..