본문 바로가기

파이썬

(201)
Data Preprocessing(데이터 전처리) - 행 추가, 삭제 1. DataFrame Sourcegrade_dic = { '국어': [98, 88, 92, 63, None], '영어': [None, 90, 70, 60, 50], '수학': [88, 62, None, 31, None], '과학': [64, 72, None, 70, 88] } import pandas from pandas import DataFrame from prettytable import PrettyTable df = DataFrame(grade_dic, index=['코난', '뭉치', '아름', '세모', '장미']) if isinstance(df, pandas.core.frame.DataFrame): table = PrettyTable([''] + list(df.columns)) for ro..
Data Preprocessing(데이터 전처리) - 기초 1. 데이터 전처리분석에 적합하게 데이터를 가공하는 작업.데이터 분석에서 가장 많은 시간이 걸리는 작업.Data Manipulation(데이터 가공) / Data Handling(데이터 핸들링) / Data Cleanging(데이터 클리닝)이라 불린다. 2. Prettytablepip install prettytable 3. DataFrame Sourcegrade_dic = { '국어': [98, 88, 92, 63, None], '영어': [None, 90, 70, 60, 50], '수학': [88, 62, None, 31, None], '과학': [64, 72, None, 70, 88] } import pandas from pandas import DataFrame from prettytable im..
Pandas Aggregate Function(Pandas 집계 함수) 1. DataFrame Sourcefrom pandas import DataFrame grade_dic = { '국어': [98, 88, 92, 63, None], '영어': [None, 90, 70, 60, 50], '수학': [88, 62, None, 31, None], '과학': [64, 72, None, 70, 88] } df = DataFrame(grade_dic, index=['코난', '뭉치', '아름', '세모', '장미']) print(df) 2. 출력물 국어 영어 수학 과학코난 98.0 NaN 88.0 64.0뭉치 88.0 90.0 62.0 72.0아름 92.0 70.0 NaN NaN세모 63.0 60.0 31.0 70.0장미 NaN 50.0 NaN 88.0 Process finishe..
Pandas Basic(Pandas 기초) 1. Pandas- 데이터 분석 / 데이터 처리 / 대용량 데이터를 보다 안정적이고 쉽게 처리하게 만들어진 python package. 2. Pandas 설치pip install pandas 3. 자료 구조- Series : value와 index의 형태를 지니는 1열로 구성된 자료 구조- DataFrame : 여러 개의 딕셔너리를 처리하는데 있어 Series 보다 보기 편한 자료 구조 4. Series- 기본 생성from pandas import Series items = [10,20,30,40,50] column = Series(items) print(column)- 출력물0 101 202 303 404 50dtype: int64 Process finished with exit code 0 - Ind..
190504>Korea News keyword wordcloud 현재 뉴스에서 많이 사용중인 키워드 분석 시각화 모듈WordCloud를 활용하여 시각화190504 키워드 분석 시각화 현재 키워드>'한국': 82, '기자': 62, '어린이': 53, '대통령': 47, '대해': 42, '입장': 42, '옐로': 41, '카펫': 40, '설치': 39, '기업': 37, '경우': 36, '검찰': 34, '대한': 34, '미국': 34, '총장': 34, '때문': 33, '대표': 32, '조정': 32, '수사권': 32, '특허': 32, '사업': 31, '위해': 30, '가격': 30, '인수': 30, '문제': 30, '서울': 29, '국민': 29, '생각': 29, '관련': 29, '한화': 29, '차량': 29, '금지': 28, '우..
190504 09:25> Naver 실시간 검색어 20위 190504> Naver 실시간 검색어 20위 +------+-------------------+| | 검색어 |+------+-------------------+| 01위 | 고속도로교통상황 || 02위 | 프로듀스 x101 || 03위 | 시서스 || 04위 | 장범준 || 05위 | 박선호 || 06위 | 롯데타워 불꽃축제 || 07위 | 강식당2 || 08위 | 나성범 || 09위 | 김민규 || 10위 | 어린이날 행사 || 11위 | 실시간 교통정보 || 12위 | 나혼자산다 재방송 || 13위 | 송유빈 || 14위 | 문무일 || 15위 | 황민현 || 16위 | 복면가왕 비숑 || 17위 | 이훈 || 18위 | 블루보틀 || 19위 | 박상기 || 20위 | 헤마토코쿠스 |+------..
Python Pandas 박스오피스 180503 순위 분석 +---+---------+------------+---------+-----------+----------+-----------------------------+------------+------+-----------+---------------+------+-------------+------------+-------------+------------+------------+---------+---------+| | audiAcc | audiChange | audiCnt | audiInten | movieCd | movieNm | openDt | rank | rankInten | rankOldAndNew | rnum | salesAcc | salesAmt | salesChange | salesInte..
Pandas - 190503 노트북 제품 비교 분석 제품명 가격 화면크기 넥스트북 NB133LTN40 248,900 13.3인치(33.78cm) 디클 클릭북 D14 273,600 14.1인치(35.8cm) 포유디지탈 아이뮤즈 스톰북14S 279,000 14.1인치(35.8cm) 레노버 V130-15IKB 81HNA00CKR 339,000 15.6인치(39.62cm) 삼성전자 노트북5 NT550EBZ-AD1A 398,000 15.6인치(39.62cm) ASUS 비보북 X505ZA-BQ473 419,000 15.6인치(39.62cm) 삼성전자 노트북5 NT550EBZ-AD2A 460,790 15.6인치(39.62cm) 삼성전자 노트북5 METAL NT560XBV-AD2A 498,000 15.6인치(39.62cm) 삼성전자 노트북5 NT550E..