인터넷 네트워크
김영한의 HTTP강의 정리 내용입니다.
모든 개발자를 위한 HTTP 웹 기본 지식
인터넷 통신
클라이언트와 서버 중간에 인터넷이 있으며 수많은 서버들을 거쳐서 넘어간다.
IP(인터넷 프로토콜)
복잡한 인터넷 망에서 데이터를 보내려면 규칙이 있어야 한다. 이 때 사용하는 규칙이 IP이다.
IP의 역할
- 지정한 IP주소에 데이터를 전달한다.
- 패킷이라는 통신 단위로 데이터를 전달한다.
IP 프로토콜의 한계
- 비연결성
패킷을 받을 대상이 없거나 서비스 불능 상태여도 패킷이 전송된다.
대상 서버가 패킷을 받을 수 있는 상태인지 알 수 없으며 일단 보내고 본다. - 비신뢰성
- 중간에 패킷이 사라지면?
- 패킷이 순서대로 안오면?
- 프로그램 구분
- 같은 IP를 사용하는 서버에서 통신하는 애플리케이션이 둘 이상이라면?
이 문제들을 해결해 주는 것이 TCP와 UDP이다.
TCP
인터넷 프로토콜 스택의 4계층
- 애플리케이션 계층 - HTTP, FTP
- 전송 계층 - TCP, UDP
- 인터넷 계층 - IP
- 네트워크 인터페이스 계층
IP에 TCP/UDP를 올려서 보완한다.
TCP 특징
TCP(Transmission Control Protocol) 전송 제어 프로토콜이다.
- 연결지향
TCP 3 way handshake (가상 연결) - 데이터 전달 보증
- 순서 보장
- 신뢰할 수 있는 프로토콜
- 현재는 대부분 TCP 사용
TCP 3 way handshake
- 클라이언트가 서버에게 SYN을 보낸다.
- 서버가 클라이언트에게 SYN + ACK을 보낸다.
- 클라이언트가 서버에게 ACK을 보낸다.
- 서버가 클라이언트에게 데이터를 전송한다.
SYN은 접속 요청이며 ACK는 요청 수락이다.
3번의 ACK과 함께 데이터 전송을 함께 할 수도 있다.
이런 과정을 거쳐 클라이언트와 서버가 서로 믿을 수 있게 된다. 단 물리적이 아닌 개념적으로만 연결된 것이다.
데이터 전달 보증
클라이언트가 서버로 데이터를 전송하면 서버는 클라이언트에게 데이터를 받았다고 응답한다.
순서 보장
클라이언트가 서버로 패킷들을 전송하였을 때 순서가 뒤바껴 도착하게 되면 서버는 클라이언트에게 패킷을 재요청하게 된다. 패킷1,2,3을 전송하였을 때 서버에 패킷1,3,2 순서로 도착하게 되면 패킷2부터 재요청한다.
UDP
사용자 데이터그램 프로토콜(User Datagram Protocol)이다.
- 하얀 도화지에 비유(기능이 거의 없다.)
- 연결지향 - TCP 3 way handshake X
- 데이터 전달 보증 X
- 순서 보장 X
- TCP는 3 way handshake를 하고 전달하는 데이터가 많으니 최적화에 한계가 있다. UDP는 데이터 전달 및 순서가 보장되지 않지만, 단순하고 빠르다. 원하는 대로 최적화를 할 수 있다.
- 정리
- IP와 거의 같다. + PORT + 체크섬(메시지가 제대로 왔는지 검증하는 데이터) 정도만 추가
- 애플리케이션에서 추가 작업이 필요하다.
PORT
한번에 둘 이상 연결해야 하면?
복수개의 요청이 같은 서버로 들어올 때 애플리케이션을 구분할 수 없게 된다. 그래서 PORT를 사용한다. 서버안에서 돌아가는 애플리케이션을 PORT로 구분한다.
- 0 ~ 65535 할당 가능
- 0 ~ 1023: 잘 알려진 포트, 사용하지 않는 것이 좋다.
- FTP - 20, 21
- TELNET - 23
- HTTP - 80
- HTTPS - 443
DNS
DNS 도메인 네임 시스템(Domain Name System)
- IP는 기억하기 어렵고 변경될 수 있다.
- 그래서 중간에 전화번호부같은 서버를 제공한다.
- 도메인 명을 등록하고 IP 주소로 변환한다.
클라이언트가 도메인 명을 사용하면 DNS서버에 요청해 해당 도메인 명에 대응하는 IP를 응답받은 후 해당 IP의 서버에 접속한다.
URI
URI(Resource Identifier)는 URL(Resource Locator)와 URN(Resource Name)을 포괄하는 개념이다.
- Uniform: 리소스 식별하는 통일된 방식
- Resource: 자원, URI로 식별할 수 있는 모든 것(제한 없음)
- Identifier: 다른 항목과 구분하는데 필요한 정보
URL, URN
- URL: Uniform Resource Locator
- Locator: 리소스가 있는 위치를 지정
- URN: Uniform Resource Name
- Name: 리소스에 이름을 부여
- 위치는 변할 수 있지만, 이름은 변하지 않는다.
- urn:isbn:8960777331 (어떤 책의 isbn URN)
- URN 이름만으로 실제 리소스를 찾을 수 있는 방법이 보편화 되지 않았다.
URL 전체 문법
-
scheme://[userinfo@]host[:port][/path][?query][#fragment]
- https://www.google.com:443/search?q=hello&hl=ko
- 프로토콜(https)
- 호스트명(www.google.com)
- 포트 번호(443)
- 패스(/search)
- 쿼리 파라미터(q=hello&hl=ko)
URL scheme
- scheme://[userinfo@]host[:port][/path][?query][#fragment]
- https://www.google.com:443/search?q=hello&hl=ko
- 주로 프로토콜에 사용된다.
- 프로토콜: 어떤 방식으로 자원에 접근할 것인가 하는 약속 규칙을 말한다.
- 예시) http, https, ftp 등등
- http는 80포트, https는 443 포트를 주로 사용, 포트는 생략 가능하다.
- https는 http에 보안을 추가한 것이다.(HTTP Secure)
URL userinfo
- scheme://[userinfo@]host[:port][/path][?query][#fragment]
- https://www.google.com:443/search?q=hello&hl=ko
- URL에 사용자 정보를 포함해서 인증해야 할 때 사용한다.
- 거의 사용하지 않는다.
URL host
- scheme://[userinfo@]host[:port][/path][?query][#fragment]
- https://www.google.com:443/search?q=hello&hl=ko
- 호스트명이다.
- 도메인명 또는 IP 주소를 직접 사용 가능하다.
URL PORT
- scheme://[userinfo@]host[:port][/path][?query][#fragment]
- https://www.google.com:443/search?q=hello&hl=ko
- 일반적으로 생략하며 생략시 http는 80, https는 443이다.
URL path
- scheme://[userinfo@]host[:port][/path][?query][#fragment]
- https://www.google.com:443/search?q=hello&hl=ko
- 리소스가 있는 경로(path)이다.
- 계층적 구조로 되어있다.
- 예시) /home/file1.jpg
URL query
- scheme://[userinfo@]host[:port][/path][?query][#fragment]
- https://www.google.com:443/search?q=hello&hl=ko
- key=value 형태이다.
- ?로 시작하고, &로 추가 가능하다. ?keyA=valueA&keyB=valueB
- query parameter, query string 등으로 불린다. 웹서버에 제공하는 파라미터, 문자 형태.
URL fragment
- scheme://[userinfo@]host[:port][/path][?query][#fragment]
- https://docs.spring/io/spring-boot/docs/current/reference/html/getting-started.html#getting-started-introducing-spring-boot
- html내부에서 중간에 이동할 때(html 내부 북마크 등) 사용된다.
- 서버에 전송하는 정보는 아니다.
웹 브라우저 요청 흐름
- https://www.google.com:443/search?q=hello&hl=ko 를 입력하면 먼저 DNS를 조회해서 IP와 PORT정보를 찾는다. 그리고 HTTP 요청 메시지를 생성한다.
-
애플리케이션에서 웹 브라우저가 HTTP 메시지를 생성한다. 그리고 소켓 라이브러리를 통해서 OS계층의 TCP/IP계층에 전달하는데 먼저 소켓 라이브러리를 통해서 IP와 PORT정보를 찾고 3 way handshake를 한다. 그다음 데이터를 전달한다. TCP/IP에서 데이터에 패킷을 씌우고 인터넷으로 넘긴다.
- 서버에 요청 패킷이 도착하면 TCP 패킷을 벗기고 HTTP 메시지를 끄집어내서 해석한다.
- 서버에서 응답 메시지를 생성해서 보낸다. 서버에서도 똑같이 패킷을 만들고 TCP/IP패킷을 씌운다.
- 클라이언트에 도착한 HTTP 메시지를 해석한다. HTML 렌더링을 하고 결과를 보게된다.
Leave a comment