본문 바로가기

분석

(53)
Pandas - 190529모니터 제품 비교 분석 1. Import Modulefrom Crawler import crawler from pandas import DataFrame from pandas import concat 2. Parsing Data검색할 내용을 입력하세요 : 모니터 제품명 ... 호스트0 삼성전자 S27R750 SPACE ... NaN0 삼성전자 S32R750 SPACE ... NaN0 삼성전자 C32F397 ... NaN0 삼성전자 S24F350 ... NaN0 삼성전자 S24D300 ... NaN0 삼성전자 C27F391 ... NaN0 삼성전자 S24F350 ... NaN0 LG전자 24MK400H ... NaN0 삼성전자 C27F390 ... NaN0 한성컴퓨터 Ultron 2457C 커브드 144 ... NaN0 한성컴퓨..
Pandas - 1880 ~ 2010 년까지 출생 자료 분석 2 1. Sample Data1880 ~ 2010 년까지 태어난 아이의 이름 / 성별 / 출생수https://developer-ankiwoong.tistory.com/268 2. Import Moduleimport pandas as pd import matplotlib.pyplot as plt from print_df import print_df 3. Pandas Data Code- TXT 파일 읽어서 DataBase화years = range(1880, 2011) df_pieces = [] # 1880 ~ 2010년 까지의 데이터 프레임을 젖아할 리스트 for year in years: # 1880 ~ 2010 path = 'data\yob%d.txt' % year # 파일 이름 df = pd.read_cs..
Pandas - 1880 ~ 2010 년까지 출생 자료 분석 1 1. Sample Data1880 ~ 2010 년까지 태어난 아이의 이름 / 성별 / 출생수 2. Import Moduleimport pandas as pd import matplotlib.pyplot as plt from print_df import print_df 3. Pandas Data Code- 일부 파일에 DataFrame 작업(파일에 컬럼명이 없으므로 header=None / 필요한 컬럼명 지정)names1880 = pd.read_csv('data\yob1880.txt', header=None, names=['name', 'gender', 'born'], encoding='utf-8') - DataFrame 정보 확인print(names1880.info()) RangeIndex: 2000 e..
Pandas - Json File Data 분석 3(Data 시각화) 1. Sample Datausa.gov 사이트를 방문한 데이터들을 JSON 형식으로 작성한 데이터JSON(Javascript Object Notation) : 자바스크립트 객체 표현 방법JSON은 Python의 dict 데이터 타입과 비슷(동일){key1 : value1, key2 : value2 ...} 2. import Moduleimport json import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from print_df import print_df 3. 시각화 Codeplt.rcParams["font.family"] = 'NanumGothic' plt.rcParams["font.size"] = 8 plt.rcPar..
Pandas - Json File Data 분석 2(Pandas 사용) 1. Sample Datausa.gov 사이트를 방문한 데이터들을 JSON 형식으로 작성한 데이터JSON(Javascript Object Notation) : 자바스크립트 객체 표현 방법JSON은 Python의 dict 데이터 타입과 비슷(동일){key1 : value1, key2 : value2 ...} 2. import Moduleimport json import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from print_df import print_df 3. Pandas Code- Data File 경로 지정path = 'data\example.txt' - 데이터 파일 생성records = [json.loads(line..
Pandas - Json File Data 분석 1(기본 문법 사용) 1. Sample Datausa.gov 사이트를 방문한 데이터들을 JSON 형식으로 작성한 데이터JSON(Javascript Object Notation) : 자바스크립트 객체 표현 방법JSON은 Python의 dict 데이터 타입과 비슷(동일){key1 : value1, key2 : value2 ...} 2. import Moduleimport json import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from print_df import print_df 3. Python Basic Code- Data File 경로 지정path = 'data\example.txt' - File 확인print(open(path, encod..
빅데이터 가설 설정 - HRD 온라인 교육 수강 노트 < 빅데이터 가설 설정 >1. 빅데이터 분석- 대량의 정형, 비정형 데이터로부터 정보를 추출- 데이터속에 숨겨진 패턴 데이터 간의 관계를 발견해 정보를 추출 분석하는 과정- 통계 및 데이터 마이닝- 수집된 데이터로 특정 변ㅅ의 미래값 예측- 인자에 대한 값을 추정해 모델 도출- 모델의 유의성 검을 위한 가설을 세우고 가설 검정 시행2. 통계 분석- 객관적인 근거에 기반을 둔 의사결정을 위해 데이터를 수집, 처리, 분류, 분석, 해석하는 프로세스- 분석 목적에 부합 선택- 다양한 통계 툴 사용 3. 데이터 마이닝 기분 분석- 통계 및 수학적 기술들을 화용해 빅데이터를 순석- 새로운 상관관계 / 추세 / 예측 / 분류 등을 찾아내고 수행- 기계학습 / 패턴인식과 관련해 빅데이터 분석에 가장 기본 4. 통계적..
빅데이터 프로젝트 계획 수립- HRD 온라인 교육 수강 노트 1. 프로젝트 자원분배- 소요기간별 투입 인원 역활 검토 후 구분㉠ 인건비 배분 기준 인원 외 비상주 인원까지 고려하여 역활 구분 - 프로젝트 필수 산출물을 정의 지정㉠ 단계별 필수 산출물을 명시하여 단계별 평가와 종료평가 시 활용할 수 있도록 지정 2. 프로젝트 투입 인원 업무 분장- 데이터 분석과제 계획서㉠ 데이터 분석 목표 정의서 포함 기재㉡ 프로젝트 일정계획, 자원배분 계획, 의사소통 계획 포함 - 데이터 탐색 보고서㉠ 데이터 수지버대상 내용 포함 기재㉡ 데이터 후보 변수 도출과정 및 최종 후보 변수 목록 포함㉢ 데이터 분석 가설별 유의성 검증 내용 포함 - 데이터 모델링 및 검증 보고서㉠ 데이터 모델링 방안 및 실험계획 포함 기재㉡ 데이터 분석 모델 유지보수 위한 산출물㉢ 데이터 모형 비교검증 ..