• 참고 : https://javaplant.tistory.com/18
• GET
• Body 없이 Header만 전송
• 링크 / 북마크 가능
• 요청 길이 제한 존재
• 쿼리 문자열 가능
• 쿼리 문자열은 key와 value로 구분
• 쿼리는 & 로 구분
• POST
• Body 안에 쿼리 데이터가 가능
• 링크 / 북마크 불가능
• 요청 길이 제한 없음
• 중요한 데이터에 사
• PUT
• DELETE
• 참고 : https://ooz.co.kr/260
• 참고 : https://gmlwjd9405.github.io/2019/01/28/http-header-types.html
• 저장되거나 전송되는 데이터 블록의 맨앞에 위치한 보충 데이터
• 요청 헤더
• Host
• User-Agent
• Accept
• Authorization
• Origin
• 응답 헤더
• Server
• Access-Control-Allow-Origin
• Allow
• Content-Disposition
• Location
•Content-Security-Policy
• 일반 헤더
• Date
• Connection
• Cache-Control
• Paragma
• Trailer
• 엔티티 헤더
• Content-Type
• Content-Language
• Content-Encoding
• Content-Length
• Content-Location
• Content-Disposition
• Content-Security-Policy
• Location
• Last-Modified
• Transfer-Encoding
• 참고 : https://victorydntmd.tistory.com/287
• 프로토콜://주소 또는 IP:포트번호/리소스경로?쿼리스트링
• 프로토콜 : 리소스에 어떻게 요청, 접근할 것인지를 명시
• 주소 또는 IP : 연결할 파일이 위치한 서버
• 포트번호 : 8080 / 보통 생략
• 리소스경로 : 연결할 파일이 들어있는 폴더 / '/'로 구분
• 쿼리스트링 : 파일 이름 뒤와 쿼리사이에는 '?'로 구분 / 쿼리 세그먼트로 구성 / 쿼리 세그먼트는 &
• 변수=데이터=&변수=데이터&변수=데이터
• HTML : 뼈대
• JavaScript : 동적인 요소 구현
• CSS : 디자인 / 배치
• 기본 구조(3.1.html)
• <!DOCTYPE html> : HTML5 DTD(문서형식) 선언
• <html lang="ko"> : HTML utf-8 문자셋
• <html> </html> : 모든 웹 페이지의 콘텐츠 선언 / 웹 페이지의 시작과 끝
• <head> </head> : 머리 부문 / 문서의 일반적인 정보와 Title를 선언
• <body> </body> : 몸통 부문 / 본문 / 웹 브라우저 화면에 나타나는 모든 콘텐츠 선언
• 기본 구조(3.2.html)
• 본문 글자 태그
• 문단
• <p> </p>
• 참고 : https://devdocs.io/html/element/p
• 기본 구조(3.3.html)
• 제목 글꼴
• 가장 많은 비중을 차지
'Python_Crawling > Crawling' 카테고리의 다른 글
[Crawling]Python Study - PPT Presentation Material - 4 (0) | 2019.12.16 |
---|---|
[Crawling]Python Study - PPT Presentation Material - 3 (0) | 2019.12.16 |
[Crawling]Python Study - PPT Presentation Material - 1 (0) | 2019.12.16 |
[Study Group]Title + Price 가져오기(Crawling 후 CSV File 저장) (0) | 2019.11.25 |
[Study Group]명언 + 위인 가져오기(selenium) (0) | 2019.10.26 |