3 minute read

김영한의 HTTP강의 정리 내용입니다.
모든 개발자를 위한 HTTP 웹 기본 지식

인터넷 통신

클라이언트와 서버 중간에 인터넷이 있으며 수많은 서버들을 거쳐서 넘어간다.

IP(인터넷 프로토콜)

복잡한 인터넷 망에서 데이터를 보내려면 규칙이 있어야 한다. 이 때 사용하는 규칙이 IP이다.

IP의 역할

  • 지정한 IP주소에 데이터를 전달한다.
  • 패킷이라는 통신 단위로 데이터를 전달한다.

IP 프로토콜의 한계

  1. 비연결성
    패킷을 받을 대상이 없거나 서비스 불능 상태여도 패킷이 전송된다.
    대상 서버가 패킷을 받을 수 있는 상태인지 알 수 없으며 일단 보내고 본다.
  2. 비신뢰성
    • 중간에 패킷이 사라지면?
    • 패킷이 순서대로 안오면?
  3. 프로그램 구분
    • 같은 IP를 사용하는 서버에서 통신하는 애플리케이션이 둘 이상이라면?

이 문제들을 해결해 주는 것이 TCP와 UDP이다.

TCP

인터넷 프로토콜 스택의 4계층

  • 애플리케이션 계층 - HTTP, FTP
  • 전송 계층 - TCP, UDP
  • 인터넷 계층 - IP
  • 네트워크 인터페이스 계층

IP에 TCP/UDP를 올려서 보완한다.

TCP 특징

TCP(Transmission Control Protocol) 전송 제어 프로토콜이다.

  • 연결지향
    TCP 3 way handshake (가상 연결)
  • 데이터 전달 보증
  • 순서 보장
  • 신뢰할 수 있는 프로토콜
  • 현재는 대부분 TCP 사용

TCP 3 way handshake

  1. 클라이언트가 서버에게 SYN을 보낸다.
  2. 서버가 클라이언트에게 SYN + ACK을 보낸다.
  3. 클라이언트가 서버에게 ACK을 보낸다.
  4. 서버가 클라이언트에게 데이터를 전송한다.

SYN은 접속 요청이며 ACK는 요청 수락이다.
3번의 ACK과 함께 데이터 전송을 함께 할 수도 있다.

이런 과정을 거쳐 클라이언트와 서버가 서로 믿을 수 있게 된다. 단 물리적이 아닌 개념적으로만 연결된 것이다.

데이터 전달 보증

클라이언트가 서버로 데이터를 전송하면 서버는 클라이언트에게 데이터를 받았다고 응답한다.

순서 보장

클라이언트가 서버로 패킷들을 전송하였을 때 순서가 뒤바껴 도착하게 되면 서버는 클라이언트에게 패킷을 재요청하게 된다. 패킷1,2,3을 전송하였을 때 서버에 패킷1,3,2 순서로 도착하게 되면 패킷2부터 재요청한다.

UDP

사용자 데이터그램 프로토콜(User Datagram Protocol)이다.

  • 하얀 도화지에 비유(기능이 거의 없다.)
  • 연결지향 - TCP 3 way handshake X
  • 데이터 전달 보증 X
  • 순서 보장 X
  • TCP는 3 way handshake를 하고 전달하는 데이터가 많으니 최적화에 한계가 있다. UDP는 데이터 전달 및 순서가 보장되지 않지만, 단순하고 빠르다. 원하는 대로 최적화를 할 수 있다.
  • 정리
    • IP와 거의 같다. + PORT + 체크섬(메시지가 제대로 왔는지 검증하는 데이터) 정도만 추가
    • 애플리케이션에서 추가 작업이 필요하다.

PORT

한번에 둘 이상 연결해야 하면?

복수개의 요청이 같은 서버로 들어올 때 애플리케이션을 구분할 수 없게 된다. 그래서 PORT를 사용한다. 서버안에서 돌아가는 애플리케이션을 PORT로 구분한다.

  • 0 ~ 65535 할당 가능
  • 0 ~ 1023: 잘 알려진 포트, 사용하지 않는 것이 좋다.
    • FTP - 20, 21
    • TELNET - 23
    • HTTP - 80
    • HTTPS - 443

DNS

DNS 도메인 네임 시스템(Domain Name System)

  • IP는 기억하기 어렵고 변경될 수 있다.
  • 그래서 중간에 전화번호부같은 서버를 제공한다.
  • 도메인 명을 등록하고 IP 주소로 변환한다.

클라이언트가 도메인 명을 사용하면 DNS서버에 요청해 해당 도메인 명에 대응하는 IP를 응답받은 후 해당 IP의 서버에 접속한다.

URI

URI(Resource Identifier)는 URL(Resource Locator)와 URN(Resource Name)을 포괄하는 개념이다.

  • Uniform: 리소스 식별하는 통일된 방식
  • Resource: 자원, URI로 식별할 수 있는 모든 것(제한 없음)
  • Identifier: 다른 항목과 구분하는데 필요한 정보

URL, URN

  • URL: Uniform Resource Locator
    • Locator: 리소스가 있는 위치를 지정
  • URN: Uniform Resource Name
    • Name: 리소스에 이름을 부여
  • 위치는 변할 수 있지만, 이름은 변하지 않는다.
  • urn:isbn:8960777331 (어떤 책의 isbn URN)
  • URN 이름만으로 실제 리소스를 찾을 수 있는 방법이 보편화 되지 않았다.

URL 전체 문법

  • scheme://[userinfo@]host[:port][/path][?query][#fragment]

  • https://www.google.com:443/search?q=hello&hl=ko
  • 프로토콜(https)
  • 호스트명(www.google.com)
  • 포트 번호(443)
  • 패스(/search)
  • 쿼리 파라미터(q=hello&hl=ko)

URL scheme

  • scheme://[userinfo@]host[:port][/path][?query][#fragment]
  • https://www.google.com:443/search?q=hello&hl=ko
  • 주로 프로토콜에 사용된다.
  • 프로토콜: 어떤 방식으로 자원에 접근할 것인가 하는 약속 규칙을 말한다.
    • 예시) http, https, ftp 등등
  • http는 80포트, https는 443 포트를 주로 사용, 포트는 생략 가능하다.
  • https는 http에 보안을 추가한 것이다.(HTTP Secure)

URL userinfo

  • scheme://[userinfo@]host[:port][/path][?query][#fragment]
  • https://www.google.com:443/search?q=hello&hl=ko
  • URL에 사용자 정보를 포함해서 인증해야 할 때 사용한다.
  • 거의 사용하지 않는다.

URL host

  • scheme://[userinfo@]host[:port][/path][?query][#fragment]
  • https://www.google.com:443/search?q=hello&hl=ko
  • 호스트명이다.
  • 도메인명 또는 IP 주소를 직접 사용 가능하다.

URL PORT

  • scheme://[userinfo@]host[:port][/path][?query][#fragment]
  • https://www.google.com:443/search?q=hello&hl=ko
  • 일반적으로 생략하며 생략시 http는 80, https는 443이다.

URL path

  • scheme://[userinfo@]host[:port][/path][?query][#fragment]
  • https://www.google.com:443/search?q=hello&hl=ko
  • 리소스가 있는 경로(path)이다.
  • 계층적 구조로 되어있다.
  • 예시) /home/file1.jpg

URL query

  • scheme://[userinfo@]host[:port][/path][?query][#fragment]
  • https://www.google.com:443/search?q=hello&hl=ko
  • key=value 형태이다.
  • ?로 시작하고, &로 추가 가능하다. ?keyA=valueA&keyB=valueB
  • query parameter, query string 등으로 불린다. 웹서버에 제공하는 파라미터, 문자 형태.

URL fragment

  • scheme://[userinfo@]host[:port][/path][?query][#fragment]
  • https://docs.spring/io/spring-boot/docs/current/reference/html/getting-started.html#getting-started-introducing-spring-boot
  • html내부에서 중간에 이동할 때(html 내부 북마크 등) 사용된다.
  • 서버에 전송하는 정보는 아니다.

웹 브라우저 요청 흐름

  1. https://www.google.com:443/search?q=hello&hl=ko 를 입력하면 먼저 DNS를 조회해서 IP와 PORT정보를 찾는다. 그리고 HTTP 요청 메시지를 생성한다.
  2. 애플리케이션에서 웹 브라우저가 HTTP 메시지를 생성한다. 그리고 소켓 라이브러리를 통해서 OS계층의 TCP/IP계층에 전달하는데 먼저 소켓 라이브러리를 통해서 IP와 PORT정보를 찾고 3 way handshake를 한다. 그다음 데이터를 전달한다. TCP/IP에서 데이터에 패킷을 씌우고 인터넷으로 넘긴다.

  3. 서버에 요청 패킷이 도착하면 TCP 패킷을 벗기고 HTTP 메시지를 끄집어내서 해석한다.
  4. 서버에서 응답 메시지를 생성해서 보낸다. 서버에서도 똑같이 패킷을 만들고 TCP/IP패킷을 씌운다.
  5. 클라이언트에 도착한 HTTP 메시지를 해석한다. HTML 렌더링을 하고 결과를 보게된다.

Tags:

Categories:

Updated:

Leave a comment