Python_Intermediate/Pandas

[Pandas]Python Study - PPT Presentation Material

AnKiWoong 2019. 12. 23. 20:16
반응형

 Pandas?

데이터 분석, 처리 등을 쉽게 하도록 만들어진 Python Package. 대용량 데이터를 보다 쉽고 안정적으로 처리할 수 있다고 알려져 있다.

pip install pandas
pip3 install pandas

종류

설명

Series

Valueindex의 형태를 지니는 1열로 구성된 자료 구조

DataFrame

여러 개의 Dictionary를 처리하는데 있어 Series보다 보기 편한

형태의 자료 구조

# pandas 모듈에서 series 클래스 가져오기
from pandas import Series

# 기본 시리즈 만들기
# 리스트를 통해 만들 수 있다.
# 즉, 리스트 자료형을 가공하여 생성된 데이터 구조
items = [10, 30, 50, 70, 90]
column = Series(items)

# 전체 확인
print(column)

# pandas 모듈에서 series 클래스 가져오기
from pandas import Series

# 기본 시리즈 만들기
# 리스트를 통해 만들 수 있다.
# 즉, 리스트 자료형을 가공하여 생성된 데이터 구조
items = [10, 30, 50, 70, 90]
column = Series(items)

# 전체 확인
print(column[0])
print(column[2])
print(column[4])

# pandas 모듈에서 series 클래스 가져오기
from pandas import Series

# 기본 시리즈 만들기
# 리스트를 통해 만들 수 있다.
# 즉, 리스트 자료형을 가공하여 생성된 데이터 구조
items = [10, 30, 50, 70, 90]
column = Series(items)

# 시리즈의 값들만 추출
print(column.values)

# pandas 모듈에서 series 클래스 가져오기
from pandas import Series

# 기본 시리즈 만들기
# 리스트를 통해 만들 수 있다.
# 즉, 리스트 자료형을 가공하여 생성된 데이터 구조
items = [10, 30, 50, 70, 90]
column = Series(items)

# 타입을 확인
print(type(column))
print(type(column.values))

# pandas 모듈에서 series 클래스 가져오기
from pandas import Series

# 기본 시리즈 만들기
# 리스트를 통해 만들 수 있다.
# 즉, 리스트 자료형을 가공하여 생성된 데이터 구조
items = [10, 30, 50, 70, 90]
column = Series(items)

# 시리지의 값들을 저장하고 있는 numpy 배열을 list로 변환
value_list = list(column.values)
print(value_list)

# pandas 모듈에서 series 클래스 가져오기
from pandas import Series

# 기본 시리즈 만들기
# 리스트를 통해 만들 수 있다.
# 즉, 리스트 자료형을 가공하여 생성된 데이터 구조
items = [10, 30, 50, 70, 90]
column = Series(items)

# 시리즈의 색인(index)을 list로 변환
print(list(column.index))

# pandas 모듈에서 series 클래스 가져오기
from pandas import Series

# 기본 시리즈 만들기
# 리스트를 통해 만들 수 있다.
# 즉, 리스트 자료형을 가공하여 생성된 데이터 구조
items = [10, 30, 50, 70, 90]
column = Series(items)

# 색인들의 타입 확인
print(type(column.index))

# pandas 모듈에서 series 클래스 가져오기
from pandas import Series

# 기본 시리즈 만들기
# 리스트를 통해 만들 수 있다.
# 즉, 리스트 자료형을 가공하여 생성된 데이터 구조
items = [10, 30, 50, 70, 90]
column = Series(items)

# 시리즈의 색인(index)을 list로 변환
print(list(column.index))

# pandas 모듈에서 series 클래스 가져오기
from pandas import Series

# 기본 시리즈 만들기
# 리스트를 통해 만들 수 있다.
# 즉, 리스트 자료형을 가공하여 생성된 데이터 구조
items = [10, 30, 50, 70, 90]
column = Series(items)

# 특정 조건에 맞는 항목들만 추출
# 이름[이름에 대한 조건식]
# 30 초과인 항목들만 추출
data_serach1 = column[column > 30]
print(type(data_serach1))
print(data_serach1)
print()

# 70 이하 and 10 초과인 항목들만 추출
data_serach2 = column[column <= 70][column > 10]
print(type(data_serach2))
print(data_serach2)
print()

# 10 이하 or 70 이상인 항목들만 추출
data_serach3 = column[(column <= 10) | (column >= 70)]
print(type(data_serach3))
print(data_serach3)

# pandas 모듈에서 series 클래스 가져오기
from pandas import Series

# 인덱스를 직접 지정하면서 시리즈 만들기
# 지난주 주말 매출
last_week = Series([240000, 140000], index=['sat', 'sun'])
# 이번주 주말 매출
this_week = Series([124000, 400200], index=['sun', 'sat'])

print(type(last_week))
print(last_week)
print()
print(type(this_week))
print(this_week)

# pandas 모듈에서 series 클래스 가져오기
from pandas import Series

# 인덱스를 직접 지정하면서 시리즈 만들기
# 지난주 주말 매출
last_week = Series([240000, 140000], index=['sat', 'sun'])
# 이번주 주말 매출
this_week = Series([124000, 400200], index=['sun', 'sat'])

# 객체의 사칙 연산
# index가 동일한 항목끼리 연산이 수행된다.
merge = last_week + this_week
print(type(merge))
print(merge)
반응형