본문 바로가기

판다스

(29)
Data Preprocessing(데이터 전처리) - 열 추가, 삭제 1. DataFrame Sourceimport pandas from pandas import DataFrame from pandas import Series from prettytable import PrettyTable df = DataFrame(grade_dic, index=['코난', '뭉치', '아름', '세모', '장미']) if isinstance(df, pandas.core.frame.DataFrame): table = PrettyTable([''] + list(df.columns)) for row in df.itertuples(): table.add_row(row) print(str(table)) else: print(df)+------+------+------+------+------+|..
Data Preprocessing(데이터 전처리) - 행 추가, 삭제 1. DataFrame Sourcegrade_dic = { '국어': [98, 88, 92, 63, None], '영어': [None, 90, 70, 60, 50], '수학': [88, 62, None, 31, None], '과학': [64, 72, None, 70, 88] } import pandas from pandas import DataFrame from prettytable import PrettyTable df = DataFrame(grade_dic, index=['코난', '뭉치', '아름', '세모', '장미']) if isinstance(df, pandas.core.frame.DataFrame): table = PrettyTable([''] + list(df.columns)) for ro..
Data Preprocessing(데이터 전처리) - 기초 1. 데이터 전처리분석에 적합하게 데이터를 가공하는 작업.데이터 분석에서 가장 많은 시간이 걸리는 작업.Data Manipulation(데이터 가공) / Data Handling(데이터 핸들링) / Data Cleanging(데이터 클리닝)이라 불린다. 2. Prettytablepip install prettytable 3. DataFrame Sourcegrade_dic = { '국어': [98, 88, 92, 63, None], '영어': [None, 90, 70, 60, 50], '수학': [88, 62, None, 31, None], '과학': [64, 72, None, 70, 88] } import pandas from pandas import DataFrame from prettytable im..
Pandas Aggregate Function(Pandas 집계 함수) 1. DataFrame Sourcefrom pandas import DataFrame grade_dic = { '국어': [98, 88, 92, 63, None], '영어': [None, 90, 70, 60, 50], '수학': [88, 62, None, 31, None], '과학': [64, 72, None, 70, 88] } df = DataFrame(grade_dic, index=['코난', '뭉치', '아름', '세모', '장미']) print(df) 2. 출력물 국어 영어 수학 과학코난 98.0 NaN 88.0 64.0뭉치 88.0 90.0 62.0 72.0아름 92.0 70.0 NaN NaN세모 63.0 60.0 31.0 70.0장미 NaN 50.0 NaN 88.0 Process finishe..
Pandas Basic(Pandas 기초) 1. Pandas- 데이터 분석 / 데이터 처리 / 대용량 데이터를 보다 안정적이고 쉽게 처리하게 만들어진 python package. 2. Pandas 설치pip install pandas 3. 자료 구조- Series : value와 index의 형태를 지니는 1열로 구성된 자료 구조- DataFrame : 여러 개의 딕셔너리를 처리하는데 있어 Series 보다 보기 편한 자료 구조 4. Series- 기본 생성from pandas import Series items = [10,20,30,40,50] column = Series(items) print(column)- 출력물0 101 202 303 404 50dtype: int64 Process finished with exit code 0 - Ind..