Python_Intermediate/Pandas
[Pandas]Python Study - PPT Presentation Material
AnKiWoong
2019. 12. 23. 20:16
반응형
• Pandas?
데이터 분석, 처리 등을 쉽게 하도록 만들어진 Python Package. 대용량 데이터를 보다 쉽고 안정적으로 처리할 수 있다고 알려져 있다.
pip install pandas
pip3 install pandas
종류 |
설명 |
Series |
Value와 index의 형태를 지니는 1열로 구성된 자료 구조 |
DataFrame |
여러 개의 Dictionary를 처리하는데 있어 Series보다 보기 편한 형태의 자료 구조 |
# pandas 모듈에서 series 클래스 가져오기
from pandas import Series
# 기본 시리즈 만들기
# 리스트를 통해 만들 수 있다.
# 즉, 리스트 자료형을 가공하여 생성된 데이터 구조
items = [10, 30, 50, 70, 90]
column = Series(items)
# 전체 확인
print(column)
# pandas 모듈에서 series 클래스 가져오기
from pandas import Series
# 기본 시리즈 만들기
# 리스트를 통해 만들 수 있다.
# 즉, 리스트 자료형을 가공하여 생성된 데이터 구조
items = [10, 30, 50, 70, 90]
column = Series(items)
# 전체 확인
print(column[0])
print(column[2])
print(column[4])
# pandas 모듈에서 series 클래스 가져오기
from pandas import Series
# 기본 시리즈 만들기
# 리스트를 통해 만들 수 있다.
# 즉, 리스트 자료형을 가공하여 생성된 데이터 구조
items = [10, 30, 50, 70, 90]
column = Series(items)
# 시리즈의 값들만 추출
print(column.values)
# pandas 모듈에서 series 클래스 가져오기
from pandas import Series
# 기본 시리즈 만들기
# 리스트를 통해 만들 수 있다.
# 즉, 리스트 자료형을 가공하여 생성된 데이터 구조
items = [10, 30, 50, 70, 90]
column = Series(items)
# 타입을 확인
print(type(column))
print(type(column.values))
# pandas 모듈에서 series 클래스 가져오기
from pandas import Series
# 기본 시리즈 만들기
# 리스트를 통해 만들 수 있다.
# 즉, 리스트 자료형을 가공하여 생성된 데이터 구조
items = [10, 30, 50, 70, 90]
column = Series(items)
# 시리지의 값들을 저장하고 있는 numpy 배열을 list로 변환
value_list = list(column.values)
print(value_list)
# pandas 모듈에서 series 클래스 가져오기
from pandas import Series
# 기본 시리즈 만들기
# 리스트를 통해 만들 수 있다.
# 즉, 리스트 자료형을 가공하여 생성된 데이터 구조
items = [10, 30, 50, 70, 90]
column = Series(items)
# 시리즈의 색인(index)을 list로 변환
print(list(column.index))
# pandas 모듈에서 series 클래스 가져오기
from pandas import Series
# 기본 시리즈 만들기
# 리스트를 통해 만들 수 있다.
# 즉, 리스트 자료형을 가공하여 생성된 데이터 구조
items = [10, 30, 50, 70, 90]
column = Series(items)
# 색인들의 타입 확인
print(type(column.index))
# pandas 모듈에서 series 클래스 가져오기
from pandas import Series
# 기본 시리즈 만들기
# 리스트를 통해 만들 수 있다.
# 즉, 리스트 자료형을 가공하여 생성된 데이터 구조
items = [10, 30, 50, 70, 90]
column = Series(items)
# 시리즈의 색인(index)을 list로 변환
print(list(column.index))
# pandas 모듈에서 series 클래스 가져오기
from pandas import Series
# 기본 시리즈 만들기
# 리스트를 통해 만들 수 있다.
# 즉, 리스트 자료형을 가공하여 생성된 데이터 구조
items = [10, 30, 50, 70, 90]
column = Series(items)
# 특정 조건에 맞는 항목들만 추출
# 이름[이름에 대한 조건식]
# 30 초과인 항목들만 추출
data_serach1 = column[column > 30]
print(type(data_serach1))
print(data_serach1)
print()
# 70 이하 and 10 초과인 항목들만 추출
data_serach2 = column[column <= 70][column > 10]
print(type(data_serach2))
print(data_serach2)
print()
# 10 이하 or 70 이상인 항목들만 추출
data_serach3 = column[(column <= 10) | (column >= 70)]
print(type(data_serach3))
print(data_serach3)
# pandas 모듈에서 series 클래스 가져오기
from pandas import Series
# 인덱스를 직접 지정하면서 시리즈 만들기
# 지난주 주말 매출
last_week = Series([240000, 140000], index=['sat', 'sun'])
# 이번주 주말 매출
this_week = Series([124000, 400200], index=['sun', 'sat'])
print(type(last_week))
print(last_week)
print()
print(type(this_week))
print(this_week)
# pandas 모듈에서 series 클래스 가져오기
from pandas import Series
# 인덱스를 직접 지정하면서 시리즈 만들기
# 지난주 주말 매출
last_week = Series([240000, 140000], index=['sat', 'sun'])
# 이번주 주말 매출
this_week = Series([124000, 400200], index=['sun', 'sat'])
# 객체의 사칙 연산
# index가 동일한 항목끼리 연산이 수행된다.
merge = last_week + this_week
print(type(merge))
print(merge)
반응형