본문 바로가기

전체 글

(1053)
Pandas - 1880 ~ 2010 년까지 출생 자료 분석 2 1. Sample Data1880 ~ 2010 년까지 태어난 아이의 이름 / 성별 / 출생수https://developer-ankiwoong.tistory.com/268 2. Import Moduleimport pandas as pd import matplotlib.pyplot as plt from print_df import print_df 3. Pandas Data Code- TXT 파일 읽어서 DataBase화years = range(1880, 2011) df_pieces = [] # 1880 ~ 2010년 까지의 데이터 프레임을 젖아할 리스트 for year in years: # 1880 ~ 2010 path = 'data\yob%d.txt' % year # 파일 이름 df = pd.read_cs..
Pandas - 1880 ~ 2010 년까지 출생 자료 분석 1 1. Sample Data1880 ~ 2010 년까지 태어난 아이의 이름 / 성별 / 출생수 2. Import Moduleimport pandas as pd import matplotlib.pyplot as plt from print_df import print_df 3. Pandas Data Code- 일부 파일에 DataFrame 작업(파일에 컬럼명이 없으므로 header=None / 필요한 컬럼명 지정)names1880 = pd.read_csv('data\yob1880.txt', header=None, names=['name', 'gender', 'born'], encoding='utf-8') - DataFrame 정보 확인print(names1880.info()) RangeIndex: 2000 e..
Pandas - Json File Data 분석 3(Data 시각화) 1. Sample Datausa.gov 사이트를 방문한 데이터들을 JSON 형식으로 작성한 데이터JSON(Javascript Object Notation) : 자바스크립트 객체 표현 방법JSON은 Python의 dict 데이터 타입과 비슷(동일){key1 : value1, key2 : value2 ...} 2. import Moduleimport json import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from print_df import print_df 3. 시각화 Codeplt.rcParams["font.family"] = 'NanumGothic' plt.rcParams["font.size"] = 8 plt.rcPar..
Pandas - Json File Data 분석 2(Pandas 사용) 1. Sample Datausa.gov 사이트를 방문한 데이터들을 JSON 형식으로 작성한 데이터JSON(Javascript Object Notation) : 자바스크립트 객체 표현 방법JSON은 Python의 dict 데이터 타입과 비슷(동일){key1 : value1, key2 : value2 ...} 2. import Moduleimport json import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from print_df import print_df 3. Pandas Code- Data File 경로 지정path = 'data\example.txt' - 데이터 파일 생성records = [json.loads(line..
Pandas - Json File Data 분석 1(기본 문법 사용) 1. Sample Datausa.gov 사이트를 방문한 데이터들을 JSON 형식으로 작성한 데이터JSON(Javascript Object Notation) : 자바스크립트 객체 표현 방법JSON은 Python의 dict 데이터 타입과 비슷(동일){key1 : value1, key2 : value2 ...} 2. import Moduleimport json import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from print_df import print_df 3. Python Basic Code- Data File 경로 지정path = 'data\example.txt' - File 확인print(open(path, encod..
Python Learn the basics Quiz 35 Q>(2017년)KAKAO BLIND RECRUITMENT네오는 평소 프로도가 비상금을 숨겨놓는 장소를 알려줄 비밀지도를 손에 넣었다.그런데 이 비밀지도는 숫자로 암호화되어 있어 위치를 확인하기 위해서는 암호를 해독해야 한다.다행히 지도 암호를 해독할 방법을 적어놓은 메모도 함께 발견했다.지도는 한 변의 길이가 n인 정사각형 배열 형태로, 각 칸은 공백(" ) 또는벽(#") 두 종류로 이루어져 있다.전체 지도는 두 장의 지도를 겹쳐서 얻을 수 있다. 각각 지도 1과 지도 2라고 하자.지도 1 또는 지도 2 중 어느 하나라도 벽인 부분은 전체 지도에서도 벽이다.지도 1과 지도 2에서 모두 공백인 부분은 전체 지도에서도 공백이다.지도 1과 지도 2는 각각 정수 배열로 암호화되어 있다.암호화된 배열은 지도의 ..
빅데이터 가설 설정 - HRD 온라인 교육 수강 노트 < 빅데이터 가설 설정 >1. 빅데이터 분석- 대량의 정형, 비정형 데이터로부터 정보를 추출- 데이터속에 숨겨진 패턴 데이터 간의 관계를 발견해 정보를 추출 분석하는 과정- 통계 및 데이터 마이닝- 수집된 데이터로 특정 변ㅅ의 미래값 예측- 인자에 대한 값을 추정해 모델 도출- 모델의 유의성 검을 위한 가설을 세우고 가설 검정 시행2. 통계 분석- 객관적인 근거에 기반을 둔 의사결정을 위해 데이터를 수집, 처리, 분류, 분석, 해석하는 프로세스- 분석 목적에 부합 선택- 다양한 통계 툴 사용 3. 데이터 마이닝 기분 분석- 통계 및 수학적 기술들을 화용해 빅데이터를 순석- 새로운 상관관계 / 추세 / 예측 / 분류 등을 찾아내고 수행- 기계학습 / 패턴인식과 관련해 빅데이터 분석에 가장 기본 4. 통계적..
빅데이터 프로젝트 계획 수립- HRD 온라인 교육 수강 노트 1. 프로젝트 자원분배- 소요기간별 투입 인원 역활 검토 후 구분㉠ 인건비 배분 기준 인원 외 비상주 인원까지 고려하여 역활 구분 - 프로젝트 필수 산출물을 정의 지정㉠ 단계별 필수 산출물을 명시하여 단계별 평가와 종료평가 시 활용할 수 있도록 지정 2. 프로젝트 투입 인원 업무 분장- 데이터 분석과제 계획서㉠ 데이터 분석 목표 정의서 포함 기재㉡ 프로젝트 일정계획, 자원배분 계획, 의사소통 계획 포함 - 데이터 탐색 보고서㉠ 데이터 수지버대상 내용 포함 기재㉡ 데이터 후보 변수 도출과정 및 최종 후보 변수 목록 포함㉢ 데이터 분석 가설별 유의성 검증 내용 포함 - 데이터 모델링 및 검증 보고서㉠ 데이터 모델링 방안 및 실험계획 포함 기재㉡ 데이터 분석 모델 유지보수 위한 산출물㉢ 데이터 모형 비교검증 ..