네트워크
- 네트워크는 컴퓨터 등의 장치들이 통신 기술을 이용하여 구축하는 연결망을 지칭하는 용어이다.
네트워크의 기초
- 네트워크 : 노드와 링크가 서로 연결되어 있거나 연결되어 있지 않은 집합체를 의미한다.
- 여기서 노드란 서버, 라우터, 스위치 등 네트워크 장치를 의미하고 링크는 유선 또는 무선을 의미한다.
처리량과 지연 시간
- 네트워크를 구축할 때는 ‘좋은’ 네트워크를 만드는 것이 중요함.
- 좋은 네트워크란 많은 처리량을 처리할 수 있고, 지연 시간이 짧고 장애 빈도가 적으며 좋은 보안을 갖춘 네트워크를 말한다.
- 처리량(throughput) : 링크를 통해 전달되는 단위 시간당 데이터양을 말한다.
- 단위로는 bps(bits per second)를 쓴다.
- 처리량은 트래픽, 네트워크 장치 간의 대역폭, 네트워크 중간에 발생하는 에러, 장치의 하드웨어 스펙에 영향을 많이 받는다.
- 대역폭 : 주어진 시간 동안 네트워크 연결을 통해 흐를 수 있는 최대 비트 수
- 트래픽 : 네트워크 상에서 전송되는 데이터의 양
- 지연 시간(latency) : 요청이 처리되는 시간을 말하며 어떤 메시지가 두 장치 사이를 왕복하는데 걸리는 시간을 말한다.
- 지연 시간은 매체 타입(무선, 유선), 패킷 크기, 라우터의 패킷 처리 시간에 영향을 받는다.
네트워크 토폴로지와 병목현상
- 네트워크 토폴로지(network topology) : 노드와 링크가 어떻게 배치되어 있는지에 대한 방식이자 연결형태를 의미한다.
- 트리 토폴로지 : 계층형 토폴로지라고 하며 트리 형태로 배치한 네트워크 구성을 말한다.
- 노드의 추가, 삭제가 쉬우며, 특정 노드에 트래픽이 집중될 때 하위 노드에 영향을 끼칠 수 있다.
- 버스 토폴로지 : 중앙 통신 회선 하나에 여러 개의 노드가 연결되어 공유하는 네트워크 구성을 말한다.
- 근거리 통신망(LAN)에서 사용한다.
- 설치 비용이 적고 신뢰성이 우수하며, 중앙 통신 회선에 노드를 추가하거나 삭제하지 쉽다.
- 그러나 스푸핑이 가능한 문제점이 있다.
- 스푸핑 : LAN상에서 송신부의 패킷을 송신과 관련없는 다른 호스트에 가지 않도록 하는 스위칭 기능을 마비시키거나 속여서 특정 노드에 해당 패킷이 오도록 처리하는 것을 말한다.
- 스타 토폴로지 : 중앙에 있는 노드에 모두 연결된 네트워크 구성을 말한다.
- 노드를 추가하거나 에러를 탐지하기 쉽고 패킷의 충돌 발생 가능성이 적다.
- 어떠한 노드에 장애가 발생해도 쉽게 발견할 수 있다.
- 중앙 노드가 아닌 곳에 에러가 발생하더라도 다른 노드에 영향을 덜 끼친다.
- 하지만 중앙 노드에 장애가 발생하면 전체 네트워크를 사용할 수 없고, 설치 비용이 고가이다.
- 링형 토폴로지 : 각각의 노드가 양 옆의 두 노드와 연결하여 전체적으로 고리처럼 하나의 연속된 길을 통해 통신을 하는 망을 구성하는 방식이다.
- 데이터는 노드에서 노드로 이동하게 되며, 각각의 노드는 고리 모양의 길을 통해 패킷을 처리한다.
- 노드 수가 증가되어도 네트워크상의 손실이 거의 없고 충돌이 발생되는 가능성이 적고 노드의 고장 발견을 쉽게 찾을 수 있다.
- 하지만 네트워크 구성 변경이 어렵고, 회선에 장애가 발생하면 전체 네트워크에 영향을 크게 끼친다.
- 메시(mesh) 토폴로지
- 망형 토폴로지라고도 하며 그물망처럼 연결되어 있는 구조이다.
- 한 단말 장치에 장애가 발생해도 여러 개의 경로가 존재하므로 네트워크를 계속 사용할 수 있고 트래픽도 분산 처리가 가능하다.
- 노드의 추가가 어렵고 구축 비용과 운용 비용이 고가이다.
- 트리 토폴로지 : 계층형 토폴로지라고 하며 트리 형태로 배치한 네트워크 구성을 말한다.
- 병목 현상
- 전체 시스템의 성능이나 용량이 하나의 구성 요소로 인해 제한을 받는 현상을 말한다.
- 예를 들어 병의 몸통보다 병의 목 부분 내부 지름이 좁아서 물이 상대적으로 천천히 쏟아지는 것에 비유할 수 있다.
- 서비스에서 이벤트를 열었을 때 트래픽이 많이 생기고 그 트래픽을 잘 관리하지 못하면 병목 현상이 생겨 사용자는 웹 사이트로 들어가지 못한다.
- 토폴로지가 중요한 이유는 병목 현상을 찾을 때 중요한 기준이 되기 때문이다.
- 전체 시스템의 성능이나 용량이 하나의 구성 요소로 인해 제한을 받는 현상을 말한다.
네트워크 분류
- 네트워크는 규모를 기반으로 분류할 수 있다.
- LAN(Local Area Network):사무실과 개인적으로 소유 가능한 규모
- 근거리 통신망을 의미하며 건물이나 캡퍼스 같은 좁은 공간에서 운영됨
- 전송 속도가 빠르며 혼잡하지 않다.
- MAN(Metropolitan Area Network) : 서울시 등의 규모
- 대도시 지역 네트워크를 나타내며 도시 같은 넓은 지역에서 운영된다.
- 전송 속도는 평균이며 LAN보다는 더 많이 혼잡하다.
- WAN(Wide Area Network) : 세게 규모
- 광역 네트워크를 의미하며 국가 또는 대륙 같은 더 넓은 지역에서 운영된다.
- 전송 속도는 낮으며 MAN보다 더 혼잡하다.
네트워크 성능 분석 명령어
- 애플리케이션 코드 상에는 전혀 문제가 없는데 사용자가 서비스로부터 데이터를 가져오지 못하는 상황이 발생되기도 함.
- 이는 네트워크 병목 현상일 가능성이 있음.
- 네트워크 병목 현상의 주된 원인
- 네트워크 대역폭
- 네트워크 토폴로지
- 서버 CPU, 메모리 사용량
- 비효율적인 네트워크 구성
- 이때는 네트워크 관련 테스트와 네트워크와 무관한 테스트를 통해 ‘네트워크로부터 발생한 문제점’인 것을 확인한 후 네트워크 성능 분석을 해봐야 한다.
- 해당 상황에서 유용한 명령어
- ping
- netstat
- nslookup
- traceroute
네트워크 프로토콜 표준화
- 네트워크 프로토콜이란 다른 장치들끼리 데이터를 주고받기 위해 설정된 공통된 인터페이스를 말한다.
- 이러한 프로토콜은 IEEE또는 IETF라는 표준화 단체가 정한다.
TCP/IP 4계층 모델
- 인터넷 프로토콜 스위트(internet protocol suite)는 인터넷에서 컴퓨터들이 서로 정보를 주고 받는 데 쓰이는 프로토콜의 집합이다.
계층 구조
- TCP/IP 게층과 달리 OSI 계층은 애플리케이션 계층을 세 개로 쪼개고 링크 계층을 데이터 링크 계층, 물리 계층으로 나눠서 표현하는 것이 다르다.
- 또한 인터넷 계층을 네트워크 계층으로 부른다는 점이 다르다.
- 이 계층들은 특정 계층이 변경되었을 때 다른 계층이 영향 받지 않도록 설계되어 있다.
애플리케이션 계층
- FTP, HTTP, SSH, SMTP, DNS 등 응용 프로그램이 사용되는 프로토콜 계층이다.
- FTP : 장치와 장치 간의 파일을 전송하는 데 사용되는 표준 통신 프로토콜
- SSH : 보안되지 않은 네트워크에서 네트워크 서비스를 안전하게 운영하기 위한 암호화 네트워크 프로토콜
- HTTP : World Wide Web을 위한 데이터 통신의 기초이자 웹 사이트를 이용하는 데 쓰는 프로토콜
- SMTP : 전자 메일 전송을 위한 인터펫 표준 프로토콜
- DNS : 도메인 이름과 IP 주소를 매핑해주는 서버
- 웹 서비스, 이메일 등 서비스를 실질적으로 사람들에게 제공하는 층이다.
전송 계층
- 송신자와 수신자를 연결하는 통신 서비스를 제공하며 연결 지향 데이터 스트림 지원, 신뢰성, 흐름 제어를 제공한다.
- 애플리케이션과 인터넷 계층 사이의 데이터가 전달 될 때 중계 역할을 한다.
- 예로는 TCP, UDP 등이 있다.
- TCP
- 패킷 사이의 순서를 보장하고 연결지향 프로토콜을 사용해서 연결을 하여 신뢰성을 구축해서 수신여부를 확인하며, ‘가상회선 패킷 교환 방식’을 사용한다.
- 가상회선 패킷 교환 방식 : 각 패킷에 식별자가 포함되어, 패킷들은 전송된 순서대로 도착하는 방식
- 패킷 사이의 순서를 보장하고 연결지향 프로토콜을 사용해서 연결을 하여 신뢰성을 구축해서 수신여부를 확인하며, ‘가상회선 패킷 교환 방식’을 사용한다.
- UDP
- 순서를 보장하지 않고 수신 여부를 확인하지 않으며 단순히 데이터만 주는 ‘데이터그램 패킷 교환 방식’을 사용함
- 패킷이 독립적으로 이동하며 최적의 경로를 선택하여 가는데, 하나의 메시지에서 분할된 여러 패킷은 서로 다른 경로로 전송될 수 있으며 도착한 순서가 다를 수 있다.
- 순서를 보장하지 않고 수신 여부를 확인하지 않으며 단순히 데이터만 주는 ‘데이터그램 패킷 교환 방식’을 사용함
- TCP
인터넷 계층
- 장치로부터 받은 네트워크 패킷을 IP 주소로 지정된 목적지로 전송하기 위해 사용되는 계층이다.
- IP, ARP, ICMP 등이 있으며 패킷을 수신해야 할 상대의 주소를 지정하여 데이터를 전달한다.
- 상대방이 제대로 받았는지에 대해 보장하지 않는 비연결형적인 특징을 가지고 있다.
링크 계층(네트워크 접근 계층)
- 전선, 광섬유, 무선 등으로 실질적으로 데이터를 전달하며 장치 간에 신호를 주고받는 ‘규칙’을 정하는 계층이다.
- 이를 물리 계층과 데이터 링크 계층으로 나누기도 한다.
- 물리 계층 : 무선 LAN과 유선 LAN을 통해 0과 1로 이루어진 데이터를 보네는 게층
- 데이터 링크 계층 : ‘이더넷 프레임’을 통해 에러 확인, 흐름 제어, 접근 제어를 담당하는 계층
- 유선 LAN
- 유선 LAN을 이루는 이더넷은 IEEE802.3이라는 프로토콜을 따르며 전이중화 통신을 쓴다.
- 전이중화 통신(full duplex) : 양쪽 장치가 동시에 송수신할 수 있는 방식. 즉 실시간으로 데이터를 주고 받을 수 있는 것.
- 이전에는 반이중화 통신인 CSMA/CD 방식을 썼다.
- 유선 LAN을 이루는 케이블
- 트위스트 페어 케이블 : 여덟 개의 구리선을 두 개씩 꼬아 묶은 케이블을 지칭.
- 광섬유 케이블 : 레이저를 이용해서 통신하기 때문에 구리선과는 비교할 수 없을 만큼 장거리 및 고속 통신이 가능하다.
- 빛의 굴절률이 높은 부분을 코어, 낮은 부분을 클래딩이라고 한다.
- 무선 LAN
- 수신과 송신에 같은 채널을 사용하기 때문에 반이중화 통신을 사용한다.
- 반이중화 통신(half duplex) : 양쪽 장치는 서로 통신할 수 있지만, 동시에는 통신할 수 없으며 한 번에 한 방향으로만 통신할 수 있는 방식을 말한다.
- 둘 이상의 장치가 동시에 전송하면 충돌이 발생하여 메시지가 손실되거나 왜곡될 수 있기 때문에 충돌 방지 시스템이 필요하다.
- 반이중화 통신(half duplex) : 양쪽 장치는 서로 통신할 수 있지만, 동시에는 통신할 수 없으며 한 번에 한 방향으로만 통신할 수 있는 방식을 말한다.
- 수신과 송신에 같은 채널을 사용하기 때문에 반이중화 통신을 사용한다.
- CSMA/CA
- 반이중화 통신 중 하나로 장치에서 데이터를 보내기 전에 캐리어 감지 등으로 사전에 가능한 한 충돌을 방지하는 방식을 사용한다.
- 과정 : 데이터를 송신하기 전에 무선 매체를 살핌 -> 캐리어 감지(회선이 비어있는지 판단) -> IFS(Inter FrameSpace, 랜덤 값을 기반으로 정해진 시간만큼 기다리며, 만약 무선 매체가 사용중이면 점차 그 간격을 늘려가며 기다린다.) -> 이후에 데이터를 송신.
- 반이중화 통신 중 하나로 장치에서 데이터를 보내기 전에 캐리어 감지 등으로 사전에 가능한 한 충돌을 방지하는 방식을 사용한다.
- 무선 LAN을 이루는 주파수
- 무선 LAN(WLAN, Wireless Local Area Network)은 무선 신호 전달 방식을 이용하여 2대 이상의 장치를 연결하는 기술이다.
- 비유도 매체인 공기에 주파수를 쏘아 무선 통신망을 구축하는데, 주파수 대역은 2.4GHz 대역 또는 5GHz 대역 중 하나를 써서 구축한다.
- 2.4GHz는 장애물에 강한 특서을 갖고 있지만 전자레인지, 무선 등 전파 간섭이 일어나는 경우가 많다.
- 5GHz 대역은 사용할 수 있는 채널 수도 많고 동시에 사용할 수 있기 때문에 상대적으로 깨끗한 전파 환경을 구축할 수 있다.
- 와이파이
- 전자기기들이 무선 LAN에 연결할 수 있게 하는 기술.
- 이를 사용하려면 AP(Access Point, 무선 접속 장치, 공유기)가 있어야 한다.
- 이를 통해 유선 LAN에 흐르는 신호를 무선 LAN 신호로 바꿔주어 신호가 닿는 범위 내에서 무선 인터넷을 사용할 수 있게 된다.
- 와이파이 이외에도 지그비, 블루투스 등이 있다.
- 전자기기들이 무선 LAN에 연결할 수 있게 하는 기술.
- BSS(Basic Service Set)
- 단순 공유기를 통해 네트워크에 접속하는 것이 아닌 동일 BSS 내에 있는 AP들과 장치들이 서로 통신이 가능한 구조를 말한다.
- 근거리 무선 통신을 제공하고, 하나의 AP만을 기반으로 구축되어 있어 사용자가 한 곳에서 다른 곳으로 자유롭게 이동하며 네트워크에 접속하는 것은 불가능하다.
- ESS(Extended Service Set)
- 하나 이상의 연결된 BSS 그룹이다.
- 장거리 무선 통신을 제공하며 BSS보다 더 많은 가용성과 이동성을 제공한다.
이더넷 프레임
- 데이터 링크 계층은 이더넷 프레임을 통해 전달받은 데이터의 에러를 검출하고 캡슐화하며 다음과 같은 구조를 가진다.
- Preamble(7byte): 이더넷 프레임이 시작임을 알린다.
- SFD(Start Frame Delimiter, 1byte) : 다음 바이트부터 MAC 주소 필드가 시작됨을 알린다.
- Destination,Source Address(DMAC, SMAC) : 수신, 송신 MAC주소를 말한다.
- MAC 주소 : 컴퓨터나 노트북 등 각 장치에 네트워크 연결을 위한 장치(LAN 카드)가 있는데, 이를 구별하기 위한 식별 번호를 말함.(6byte)로 구성된다.
- EtherType : 데이터 계층 위의 계층인 IP 프로토콜을 정의한다. 예를 들어 IPv4 또는 IPv6가 된다
- Payload(46~1500byte) : 전달받은 데이터
- CRC: 에러 확인 비트
계층 간 데이터 송수신 과정
- HTTP를 통해 웹 서버에 있는 데이터를 요청하면 사용자의 요청 값들이 캡슐화 과정을 거쳐 전달되고, 다시 링크 계층을 통해 해당 서버와 통신하고, 해당 서버의 링크 계층으로부터 애플리케이션까지 비캡슐화 과정을 거쳐 데이터가 전송된다.
- 캡슐화 과정
- 상위 계층의 헤더와 데이터를 하위 계층의 데이터 부분에 포함시키고 해당 계층의 헤더를 삽입하는 과정을 말한다.
- 과정
- 애플리케이션 계층의 데이터가 전송 계층으로 전달되면서 ‘세그먼트’또는 ‘데이터그램’화가 되며 TCP 헤더가 붙여지게 된다.
- 인터넷 계층으로 가면서 IP헤더가 붙여지게 되며 ‘패킷’화가 된다.
- 링크 계층으로 전달되면서 프레임 헤더와 프레임 트레일러가 붙어 ‘프레임’화가 된다.
- 비캡슐화 과정
- 하위 계층에서 상위 계층으로 가면서 각 계층의 헤더 부분을 제거하는 과정을 말함.
- 프레임화된 데이터는 패킷화를 거쳐 세그먼트, 데이터그램화를 거쳐 메시지화가 되는 비캡슐화 과정이 일어난다. 그 이후 최종적으로 사용자에게 애플리케이션의 PDU인 메시지로 전달된다.
PDU(Protocol Data Unit)
- 네트워크의 어떠한 계층에서 계층으로 데이터가 전달될 때 한 덩어리의 단위를 지칭하는 말.
- PDU는 제어 관련 정보들이 포함된 헤더, 데이터를 의미하는 페이로드로 구성되어 있으며 계층마다 부르는 명칭이 다르다.
- 애플리케이션 계층 : 메시지
- 전송 계층 : 세그먼트(TCP), 데이터그램(UDP)
- 인터넷 계층 : 패킷
- 링크 계층 : 프레임(데이터 링크 계층), 비트(물리 계층)
- 비트로 송수신하는 것이 가장 빠르고 효율적이다. 하지만 다른 값들을 넣는 확장이 어렵다.
네트워크 기기
- 네트워크는 여러 개의 네트워크 기기를 기반으로 구축된다.
네트워크 기기의 처리 범위
- 네트워크 기기는 계층별로 처리 범위를 나눌 수 있다.
- 상위 계층을 처리하는 기기는 하위 계층을 처리할 수 있지만 그 반대는 불가능하다.
- 종류
- 애플리케이션 계층 : L7 스위취
- 인터넷 계층 : 라우터, L3 스위치
- 데이터 링크 계층 : 브리지, L2 스위치
- 물리 계층 : NIC, 리피터, AP
애플리케이션 계층을 처리하는 기기
L7 스위치
- 스위치는 여러 장비를 연결하고 데이터 통신을 중재하며 목적지가 연결된 포트로만 전기 신호를 보내 데이터를 전송하는 통신 네트워크 장비이다.
- L7 스위치는 로드밸런서라고도 하며, 서버의 부하를 분산하는 기기이다.
- URL, 서버, 캐시, 쿠기들을 기반으로 트래픽을 분산 시킨다.
- 바이러스, 불필요한 외부 데이터 등을 걸러내는 필터링 기능 또한 가지고 있다.
- 응용 프로그래밍 수준의 트래픽 모니터링도 가능하다.
- 장애가 발생한 서버가 있으면 이를 트래픽 분산 대상에서 제외해야 한다.(헬스체크를 통해 이뤄진다)
- L4 스위치와 L7 스위치 차이
- 로드밸런서로는 L7 스위치뿐만 아니라 L4 스위치도 있다.
- L4 스위치는 인터넷 계층을 처리하는 기기로 스트리밍 관련 서비스에서는 사용할 수 없으며 메시지를 기반으로 인식하지 못하고 IP와 포트를 기반으로 (특히 포트를 기반으로) 트래픽을 분산한다.
- IP와 포트 이외에도 URL, HTTP헤더, 쿠키 등을 기반으로 트래픽을 분사하는 L7 로드밸런서와는 차이가 있다.
- L7 스위치를 이용한 로드밸런싱은 ALB 컴포넌트로 하며, L4 스위치를 이용한 로드 밸런싱은 NLB 컴포넌트로 한다.
헬스 체크
- L4 스위치 또는 L7 스위치 모두 헬스 체크를 통해 정상적인 서버 또는 비정상적인 서버를 판별함.
- 헬스 체크는 전송 주기와 재전송 횟수 등을 설정한 이후 반복적으로 서버에 요청을 보내는 것을 말함.
- 이때 서버에 부하가 되지 않을 만큼 요청 횟수가 적절해야 한다.
인터넷 계층을 처리하는 기기
라우터
- 여러 개의 네트워크 연결, 분할, 구분 시켜주는 역할을 하며 “다른 네트워크에 존재하는 장치끼리 서로 데이터를 주고 받을 때 패킷 소모를 최소화하고 경로릴 최적화하여 최소 경로로 패킷을 포워딩”하는 라우팅을 하는 장비이다.
L3 스위치
- L3 스위치란 L2 스위치의 기능과 라우팅 기능을 갖춘 장비를 말한다.
- L3 스위치를 라우터라해도 무방하다.
- 라우터는 소프트웨어 기반의 라우팅과 하드웨어 기반의 라우팅을 하는 것으로 나눠지고 하드웨어 기반의 라우팅을 담당하는 장치를 L3 스위치라고 한다.
데이터 링크 계층을 처리하는 기기
L2 스위치
- 장치들의 MAC 주소를 MAC주소 테이블을 통해 관리하며, 연결된 장치로부터 패킷이 왔을 때 패킷 전송을 담당한다.
- IP주소를 이해하지 못해 IP주소를 기반으로 라우팅은 불가능하며 단순히 패킷의 MAC 주소를 읽어 스위칭하는 역할을 한다.
- 목적지가 MAC 주소 테이블에 없다면 전체 포트에 전달하고 MAC 주소 테이블의 주소는 일정 시간 이후 삭제하는 기능도 있다.
브리지
- 두 개의 근거리 통신망(LAN)을 상호 접속할 수 있도록 하는 통신망 연결 장치.
- 포트와 포트 사이의 다리 역할을 하며 장치에서 받아온 MAC 주소를 MAC주소 테이블로 관리한다.
- 통신망 범위를 확장하고 서로 다른 LAN등으로 이루어진 하나의 통신망을 구축할 때 쓰인다.
물리 계층을 처리하는 기기
NIC
- LAN 카드라고 하는 네트워크 인터페이스 카드(NIC, Network Interface, Card)는 2대 이상의 컴퓨터 네트워크를 구성하는 데 사용하며, 네트워크와 빠른 속도로 데이터를 송수신할 수 있도록 컴퓨터 내에 설치하는 확장 카드이다.
- 각 LAN 카드에는 주민등록번호처럼 각각을 구분하기 위한 고유의 식별번호인 MAC 주소가 있다.
리피터
- 약해진 신호 증폭기
- 광케이블이 사용되면서 잘 사용안됨
AP
- 패킷을 복사하는 기기
- 해당 기기를 통해 유선 LAN을 연결한 후 다른 장치에 무선 LAN 기술을 사용하여 무선 네트워크를 연결할 수 있다.
IP주소
ARP
- 컴퓨터와 컴퓨터 간의 통신은 정확히 말하면 IP주소에서 ARP를 통해 MAC주소를 찾아 MAC주소를 기반으로 통신한다.
- ARP(Address Resolution Protocol) : IP주소로부터 MAC주소를 구하는 IP와 MAC주소의 다리 역할을 하는 프로토콜
- 가상 주소인 IP주소를 실제 주소인 MAC주소로 변환한다.
- RARP : 실제 주소인 MAC주소를 가상 주소인 IP주소로 변환한다.
- ARP Request 브로드캐스트를 보내서 목적지인 MAC주소를 찾고, 해당 주소에 맞는 장치가 ARP Reply 유니캐스트를 통해 MAC 주소를 반환하는 과정을 거쳐 IP주소에 맞는 MAC 주소를 찾게 된다.
- 브로드캐스트(broadcast) : 송신 호스트가 전송한 데이터가 네트워크에 연결된 모든 호스트에 전송되는 방식
- 유니캐스트(unicast) : 고유 주소로 식별된 하나의 네트워크 목적지에 1:1로 데이터를 전송하는 방식
홉바이홉(Hop-By-Hop) 통신
- IP주소를 통해 통신하는 과정을 Hop-By-Hop 통신이라고 한다.
- 각각의 라우터에 있는 라우팅 테이블의 IP를 기반으로 패킷을 전달하고 다시 전달해 나간다.
- 즉, 통신 장치에 있는 라우팅 테이블의 IP를 통해 시작 주소부터 시작하여 다음 IP로 계속 해서 이동하는 라우팅 과정을 거쳐 패킷이 최종 목적지까지 도달하는 통신을 말한다.
- 라우팅 : IP주소를 찾아가는 과정
라우팅 테이블
- 송신지에서 수신지까지 도달하기 위해 사용되며 라우터에 들어가 있는 목적지 정보들과 그 목적지로 가기 위한 방법들이 들어 있는 리스트를 뜻한다.
- 라우팅 테이블에는 게이트웨이와 모든 목적지에 대해 해당 목적지에 도달하기 위해 거쳐야 할 다음 라우터의 정보를 가지고 있다.
게이트웨이
- 서로 다른 통신망, 프로토콜을 사용하는 네트워크 간의 통신을 가능하게 하는 관문 역할을 하는 컴퓨터나 소프트웨어를 두루 일컫는 용어.
- 게이트웨이는 서로 다른 네트워크 상의 통신 프로토콜을 변환해주는 역할을 하기도 한다.
IP주소 체계
- IP주소는 IPv4와 IPv6로 나뉜다.
- IPv4는 32비트를 8비트 단위로 점을 찍어 표기.
- IPv6는 64비트를 16비트 단위로 점을 찍어 표기.
DHCP(Dynamic Host Configuration Protocol)
- IP주소 및 기타 통신 매개 변수를 자동으로 할당하기 위한 네트워크 관리 프로토콜이다.
- 이 기술을 통해 네트워크 장치의 IP주소를 수동으로 설정할 필요 없이 인터넷에 접속할 때마다 자동으로 IP주소를 할당할 수 있다.
NAT(Network Address Translation)
- 패킷이 라우팅 장치를 통해 전송되는 동안 패킷의 IP주소 정보를 수정하여 다른 주소로 매핑하는 방법이다.
- IPv4 주소 체계만으로는 많은 주소들을 모두 감당하지 못하는 단점이 있는데, 이를 해결하기 위해 NAT로 공인 IP와 사설 IP로 나눠 많은 주소를 처리한다.
- 이처럼 사설 IP를 공인 IP로 변환하거나 공인 IP를 사설 IP로 변환하는데 쓰인다.
- 공유기와 NAT
- NAT을 쓰는 이유는 주로 여러 대의 호스트가 하나의 공인 IP 주소를 사용하여 인터넷에 접속하기 위함이다.
- NAT를 이용한 보안
- NAT를 이용하면 내부 네트워크에서 사용하는 IP주소와 외부에 드러나는 IP주소를 다르게 유지할 수 있기 때문에 내부 네트워크에 대한 보안이 어느정도 가능해진다.
- NAT의 단점
- 여러 명이 동시에 인터넷을 접속하게 되므로 실제로 접속하는 호스트 숫자에 따라서 접속 속도가 느려질 수 있다.
IP 주소를 이용한 위치 정보
- IP주소는 인터넷에서 사용하는 네트워크 주소이기 때문에 이를 통해 동 또는 구까지 위치 추적이 가능하다.
- IP주소를 기반으로 위치를 찾는 사이트 : https://mylocation.co.kr/
HTTP
- HTTP는 애플리케이션 계층으로서 웹 서비스 통신에 사용된다.
- HTTP/1.0부터 시작해서 지금은 HTTP/3까지 발전하였다.
HTTP/1.0
- HTTP/1.0은 기본적으로 한 연결당 하나의 요청을 처리하도록 설계되었다.
- 이는 RTT 증가를 야기했다.
- RTT(패킷 왕복 시간): 패킷이 목적지에 도달하고 나서 다시 출발지로 돌아오기까지 걸리는 시간
RTT의 증가를 해결하기 위한 방법
- 매번 연갈할 때마다 RTT가 증가하여 서비스에 부담이 많이 가고 사용자 응답 시간이 길어지는 문제를 해결하기 위해 이미지 스플리팅, 코드 압축, 이미지 Base64 인코딩을 사용하였다.
- 이미지 스플리팅
- 많은 이미지를 다운받게 되면 과부하가 걸리기 때문에 많은 이미지가 합쳐져 있는 하나의 이미지를 다운로드 받고, 이를 기반으로 background-image의 position을 이용하여 이미지를 표기하는 방법이다.(CSS를 활용함)
- 코드 압축
- 개행 문자, 빈칸을 없애서 코드를 압축하여 코드의 크기를 최소화하는 방법이다.
- 이미지 Base64 인코딩
- 이미지 파일을 64진법으로 이루어진 문자열로 인코딩하는 방법이다. 이 방법을 사용하면 서버와의 연결을 열고 이미지에 대해 서버에 HTTP 요청을 할 필요가 없는 장점이 있다.
- 하지만 Base 64 문자열로 변환할 경우 37% 정도 크기가 커지는 단점이 있다.
- 인코딩(encoding) : 정보의 형태나 형식을 표준화, 보안, 처리 속도 향상, 저장 공간 절약 등을 위해 다른 형태나 형식으로 변환하는 처리 방식이다.
- 이미지 파일을 64진법으로 이루어진 문자열로 인코딩하는 방법이다. 이 방법을 사용하면 서버와의 연결을 열고 이미지에 대해 서버에 HTTP 요청을 할 필요가 없는 장점이 있다.
HTTP/1.1
- 매번 TCP연결을 하는 것이 아니라 한 번 TCP 초기화를 한 이후 Keep-Alive라는 옵션으로 여러 개의 파일을 송수신할 수 있게 바뀌었다.
- 참고로 HTTP/1.0에서도 keep-alive가 있었지만 표준화가 되어 있지 않았고 HTTP/1.1부터 표준화가 되어 기본 옵션으로 설정되었다.
- 하지만 문서 안에 포함된 다수의 리소스(이미지, CSS파일, script 파일)를 처리하려면 요청할 리소스 개수에 비례해서 대기 시간이 길어지는 단점이 있다.
HOL Blocking(Head Of Line Blocking)
- 네트워크에서 같은 큐에 있는 패킷이 그 첫 번째 패킷에 의해 지연될 때 발생하는 성능 저하 현상을 말함.
- 즉, 첫번째 다운로드 대상이 image.jpg일 경우 그 뒤에 다운 받는 style.css, data.xml 등은 대기하게 되며 다운로드가 지연되는 상태.
무거운 헤더 구조
- HTTP/1.1의 헤더에는 쿠키 등 많은 메타데이터가 들어 있고 압축이 되지 않아 무거웠다.
HTTP/2
- HTTP/2는 SPDY 프로토콜에서 파생된 HTTP/1.x보다 지연 시간을 줄이고 응답 시간을 더 빠르게 처리할 수 있으며 멀티플렉싱, 헤더 압축, 서버 푸시, 요청의 우선순위 처리를 지원하는 프로토콜이다.
멀티 플렉싱
- 여러 개의 스트림을 사용하여 송수신한다는 것.
- 이를 통해 특정 스트림의 패킷이 손실되었다고 하더라도 해당 스트림에만 영향을 받고 나머지 스트림은 멀쩡하게 동작할 수 있다.
- 스트림(stream) : 시간이 지남에 따라 사용핢 수 있게 되는 일련의 데이터 요소를 가리키는 데이터 흐름
- 스트림 내의 데이터들 또한 쪼개져서 애플리케이션에서 송수신한 뒤 다시 조립하는 방식으로 데이터를 주고 받는다.
- 이를 통해 단일 연결을 사용하여 병렬로 여러 요청을 받을 수 있고 응답을 줄 수 있다. 이렇게 되면 HTTP/1.x에서 발생하는 문제인 HOL Blocking을 해결할 수 있다.
헤더 압축
- HTTP/1.x에는 크기가 큰 헤더라는 문제가 있었다.
- 이를 HTTP/2에서는 허프만 코딩 압축 알고리즘을 사용하여 HPACK 압축 형식을 가진다.
- 허프만 코딩(huffman coding): 문자열을 문자 단위로 쪼개 빈도수를 세어 빈도가 높은 정보는 적은 비트 수를 사용하여 표현하고, 빈도가 낮은 정보는 비트 수를 많이 사용하여 표현해서 전체 데이터의 표현에 필요한 비트 양을 줄이는 원리이다.
서버 푸시
- HTTP/1.1에서는 클라이언트가 서버에 요청을 해야 파일을 다운로드 받을 수 있었다면, HTTP/2는 클라이언트 요청 없이 서버가 바로 리소스를 푸시할 수 있다.
- 즉, html에는 css나 js파일이 거의 대부분 포함되기 때문에 html을 읽으면서 그 안에 들어가 있던 css 파일을 서버에서 푸시하여 클라이언트에게 먼저 줄 수 있다.
HTTPS
- HTTP/2는 HTTPS위에서 동작한다.
- HTTPS는 애플맄에시녀 계층과 전송 계층 사이에 신뢰 계층인 SSL/TLS 계층을 넣은 신뢰할 수 있는 HTTP 요청을 말한다.
- 이를 통해 통신을 암호화 한다.
SSL/TLS
- SSL(Secure Socket Layer)은 SSL 1.0부터 시작해서 TLS1.3까지 버전이 올라갔다.
- 이 과정에서 명칭이 TLS(Transport Layer Security Protocol)로 명칭이 변경되었으나 SSL/TLS라고 합쳐 부른다.
- SSL/TLS는 전송 계층에서 보안을 제공하는 프로토콜이다.
- 클라이언트와 서버가 통신할 때 SSL/TLS를 통해 제 3자가 메시지를 도청하거나 변조하지 못하도록 한다.
- 공격자가 서버인 척하며 사용자 정보를 가로채는 네트워크 상의 ‘인터셉터’를 방지할 수 있다.
- 보안 세션을 기반으로 데이터를 암호화하며 보안 세션이 만들어질 때 인증 메커니즘, 키 교환 암호화 알고리즘, 해싱 알고리즘이 사용된다.
보안 세션
- 보안이 시작되고 끝나는 동안 유지되는 세션을 말하고, SSL/TLS는 핸드 셰이크를 통해 보안 세션을 생성하고 이를 기반으로 상태 정보 등을 공유한다.
- 세션(session) : 운영체제가 어떠한 사용자로부터 자신의 자산 이용을 허락하는 일정한 기간을 뜻한다. 즉, 사용자는 일정 시간 동안 응용 프로그램, 자원 등을 사용할 수 있다.
- 클라이언트에서 사이퍼 슈트(cypher suites)를 서버에 전달하면 서버는 받은 사이퍼 슈트의 암호화 알고리즘 리스트를 제공할 수 있는지 확인한다. 제공할 수 있다면 서버에서 클라이언트로 인증서를 보내는 인증 메커니즘이 시작되고 이후 해싱 알고리즘 등으로 암호화된 데이터의 송수신이 시작된다.
- 사이퍼 슈트 : 프로토콜, AEAD 사이퍼 모드, 해싱 알고리즘이 나열된 규약을 말한다.
- AEAD 사이퍼 모드 (Authenticated Encryption with Associated Data cypher mode): 데이터 암호화 알고리즘이다.
- 사이퍼 슈트 : 프로토콜, AEAD 사이퍼 모드, 해싱 알고리즘이 나열된 규약을 말한다.
인증 메커니즘
- 인증 메커니즘은 CA(Certificate Authorities)에서 발급한 인증서를 기반으로 이루어진다.
- CA에서 발급한 인증서는 안전한 연결을 시작하는 데 있어서 필요한 ‘공개키’를 클라이언트에 제공하고 사용자가 접속한 ‘서버가 신뢰’할 수 있는 서버임을 보장한다.
- 인증서는 서비스 정보, 공개키, 지운, 디지털 서명 등으로 이루어져 있다.
- CA는 신뢰성이 엄격하게 공인된 기업들만 참여할 수 있다.
CA 발급 과정
- 본인의 서비스가 CA인증서를 발급받으려면 자신의 사이트 정보와 공개키를 CA에 제출해야 한다.
- 이후 CA는 공개키를 해시한 값인 지문(finger print)을 사용하는 CA의 비밀키 등을 기반으로 CA인증서를 발급한다.
암호화 알고리즘
- 키 교환 암호화 알고리즘으로는 대수곡선 기반의 ECDHE또는 모듈식 기반의 DHE를 사용한다.
- 둘 다 디피-헬만(Diffie-Hellman)방식을 근간으로 만들어진 알고리즘이다.
- 디피 헬만 키 교환 암호화 알고리즘
- 암호키를 교환하는 하나의 방법으로 $y = g^x mod p$ 라는 식에서 g와 x와 p를 안다면 y는 구하기 쉽지만 g와 y와 p만 안다면 x는 구하기 어렵다는 원리에 기반한 알고리즘이다.
- 위의 그림처럼 처음에 공개 값을 공유하고 각자의 비밀 값과 혼합한 후 혼합 값을 공유 한다.
- 그 다음 각자의 비밀 값과 또 혼합한다. 그 이후에 공통의 암호키가 생성된다.
- 이렇게 클라이언트와 서버 간의 PSK(사전 합의된 비밀키)가 생성된다면, 악의적인 공격자가 개인키 또는 공개키를 가지고도 PSK가 없기 때문에 아무것도 할 수 없게 된다.
해싱 알고리즘
- 데이터를 추정하기 힘든 더 작고, 섞여 있는 조각으로 만드는 알고리즘이다. SSL/TLS는 해싱 알고리즘으로 SHA-256과 SHA-384 알고리즘을 쓴다.
SHA-256 알고리즘
- 해시 함수의 결괏값이 256비트인 알고리즘이며 비트 코인을 비롯한 많은 블록체인 시스템에서도 쓴다.
- 해당 알고리즘은 해싱 해야할 메시지에 1을 추가하는 등 전처리를 하고 전처리된 메시지를 기반으로 해시를 반환한다.
- 해시 : 다양한 길이를 가진 데이터를 고정된 길이를 가진 데이털 메핑한 값
- 해싱 : 임의의 데이터를 해시로 바꿔주는 일이며 해시 함수가 이를 담당함.
- 해시 함수 : 임의의 데이터를 입력으로 받아 일정한 길이의 데이터로 바꿔는 함수
- 참고로 TLS 1.3은 사용자가 이전에 방문한 사이트로 다시 방문한다면 SSL/TLS에서 보안 세션을 만들 때 걸리는 통신을 하지 않아도 된다.
- 이를 0-RTT라고 한다.
SEO에도 도움이되는 HTTPS
- 구글(Google)은 SSL 인증서를 강조해왔고 사이트 내 모든 요소가 동일하다면 HTTPS 서비스를 하는 사이트가 그렇지 않은 사이트 보다 SEO 순위가 높을 것이라고 공식적으로 밝혔다.
- SEO(Search Engine Optimization)는 사용자들이 구글, 네이버 같은 검색엔진으로 웹 사이트를 검색했을 때, 그 결과를 페이지 상단에 노출시켜 많은 사람이 볼 수 있도록 최적화하는 방법을 의미한다.
- 이를 위한 방법으로는 캐노니컬 설정, 메타 설정, 페이지 속도 개선, 사이트맵 관리 등이 있다.
HTTPS 구축 방법
- CA에서 구매한 인증키를 기반으로 HTTPS 서비스를 구축하는 방법
- 서버 앞단의 HTTPS를 제공하는 로드 밸런서를 두는 방법
- 서버 앞단에 HTTPS를 제공하는 CDN을 둬서 구축하는 방법
HTTP/3
- TCP 위에서 돌아가는 HTTP/2와 달리 HTTP/3은 QUIC라는 계층 위에서 돌아가며, TCP기반이 아닌 UDP 기반으로 돌아간다.
- 또한 HTTP/2에서 장점이었던 멀티플렉싱을 가지고 있으며 초기 연결 설정 시 지연 시간 감소라는 장점이 있다.
초기 연결 설정 시 지연 감소
- QUIC는 TCP를 사용하지 않기 때문에 통신을 시작할 대 번거로운 3-way handshake 과정을 거치지 않아도 된다.
- QUIC는 첫 연결 설정에 1-RTT만 소요된다.
- 클라이언트가 서버에 어떤 신호를 한 번 주고, 서버도 거기에 응답하기만 하면 바로 본 통신을 시작할 수 있다는 것이다.
- QUIC는 순방향 오류 수정 메커니즘(FEC, Forword Error Correction)이 적용되었다. 이는 전송한 패킷이 손실되었다면 수신 측에서 에러를 검출하고 수정하는 방식이며 열악한 네트워크 환경에서도 낮은 패킷 손실률을 자랑한다.
예상 질문
- Q. OSI 7계층과 TCP/IP 4계층의 차이점은 무엇인가?
- A. TCP/IP 계층과 달리 OSI 계층은 애플리케이션 계층을 세 개로 쪼개고 링크 계층을 데이터 링크 계층, 물리 계층으로 나눠서 설명하는 것이 다르며, 인터넷 계층을 네트워크 계층으로 부른다는 점이 다르다.
- Q. HTTP/2를 설명하고 장점 두가지를 설명해라.
- A. HTTP/2는 HTTP/1.x보다 지연 시간을 줄이고 응답 시간을 더 빠르게 할 수 있으며 멀티 플렉싱, 헤더 압축, 서버 푸시, 요청의 우선 순위 처리를 지원하는 프로토콜이다.
- 장점 두가지로 멀티 플렉싱과 서버 푸시를 들자면, 멀티 플렉싱이란 여러 개의 스트림을 사용하여 송수신하는 것을 말하며, 이를 통해 특정 스트림의 패킷이 손실되었다 하더라도 해당 스트림에만 영향을 미치고 나머지 스트림은 멀쩡하게 동작할 수 있다.
- 서버 푸시란 HTTP/1.1에서는 클라이언트가 서버에 요청을 해야 파일을 다운로드 받을 수 있었다면, HTTP/2는 클라이언트 요청 없이 서버가 바로 리소스를 푸시하는 것을 말한다. 예를 들어 html에 포함되어 있는 css나 js파일을 html을 읽어들이는 클라이언트에게 같이 푸시하여 먼저 줄 수 있다.