自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Linux TCP/IP協(xié)議棧,數(shù)據(jù)發(fā)送接收流程,TCP協(xié)議特點(diǎn)

網(wǎng)絡(luò) 通信技術(shù)
可以毫不夸張的說現(xiàn)如今的互聯(lián)網(wǎng)是基于TCP/IP構(gòu)建起來的網(wǎng)絡(luò)。弄懂協(xié)議棧的原理,無論對(duì)調(diào)試網(wǎng)絡(luò)IO性能還是解決網(wǎng)絡(luò)問題都是有很大幫助的。本片文章就帶領(lǐng)大家來看看內(nèi)核是如何控制網(wǎng)絡(luò)數(shù)據(jù)流的。

 可以毫不夸張的說現(xiàn)如今的互聯(lián)網(wǎng)是基于TCP/IP構(gòu)建起來的網(wǎng)絡(luò)。弄懂協(xié)議棧的原理,無論對(duì)調(diào)試網(wǎng)絡(luò)IO性能還是解決網(wǎng)絡(luò)問題都是有很大幫助的。本片文章就帶領(lǐng)大家來看看內(nèi)核是如何控制網(wǎng)絡(luò)數(shù)據(jù)流的。

[[278274]]

TCP特點(diǎn)

我們都非常清楚TCP協(xié)議設(shè)計(jì)的初衷,就是保證數(shù)據(jù)傳輸?shù)目焖伲行?,無誤。所以特點(diǎn)總結(jié)如下:

  1. 面向連接,可以用五元組來表示一條連接(遠(yuǎn)程ip,遠(yuǎn)程端口,本地ip,本地端口,傳輸層協(xié)議)。
  2. 數(shù)據(jù)是全雙工的
  3. 數(shù)據(jù)是有序的,也就是接受的數(shù)據(jù)一定是按照發(fā)送時(shí)的順序的。
  4. 流量控制,發(fā)送方可以通過接收方滑動(dòng)窗口大小來動(dòng)態(tài)調(diào)整發(fā)送數(shù)據(jù)的大小。
  5. 擁塞控制,發(fā)送方通過ACK的狀態(tài)結(jié)合擁塞算法綜合計(jì)算給出窗口大小。

了解完TCP特點(diǎn)字后,我們就來真正的看看數(shù)據(jù)發(fā)送到底是怎樣的過程?

數(shù)據(jù)發(fā)送

我們首先來看張圖:

 

一篇文章:Linux TCP/IP協(xié)議棧,數(shù)據(jù)發(fā)送接收流程,TCP協(xié)議特點(diǎn)

 

上圖展示的是數(shù)據(jù)流動(dòng)的在硬件中的過程,下圖展示的是數(shù)據(jù)在協(xié)議棧的過程:

 

一篇文章:Linux TCP/IP協(xié)議棧,數(shù)據(jù)發(fā)送接收流程,TCP協(xié)議特點(diǎn)

 

整個(gè)過程分為三個(gè)大區(qū)域:用戶區(qū),內(nèi)核區(qū),設(shè)備。這里所說的設(shè)備就是網(wǎng)卡。流程如下:

  1. 用戶應(yīng)用程序調(diào)用write系統(tǒng)調(diào)用
  2. 確認(rèn)文件描述符
  3. 拷貝數(shù)據(jù)到socket buffer中
  4. 創(chuàng)建tcp片段,計(jì)算checksum
  5. 添加IP頭,執(zhí)行ip路由,計(jì)算checksum
  6. 添加以太網(wǎng)協(xié)議頭部,執(zhí)行ARP
  7. 告訴網(wǎng)卡芯片要發(fā)送數(shù)據(jù)了
  8. 網(wǎng)卡從內(nèi)存中獲取數(shù)據(jù)發(fā)送,發(fā)送完成中斷告訴CPU

數(shù)據(jù)接收

直接看硬件數(shù)據(jù)流圖:

 

一篇文章:Linux TCP/IP協(xié)議棧,數(shù)據(jù)發(fā)送接收流程,TCP協(xié)議特點(diǎn)

 

首先網(wǎng)卡把接收到的數(shù)據(jù)包寫入到它的內(nèi)存之中。然后對(duì)其進(jìn)行校驗(yàn),通過后發(fā)送到主機(jī)的主存之中。主存中的buffer是驅(qū)動(dòng)分配好的,驅(qū)動(dòng)會(huì)把分配好的buffer描述告訴網(wǎng)卡,如果沒有足夠的buffer接受網(wǎng)卡的數(shù)據(jù)包,網(wǎng)卡會(huì)將數(shù)據(jù)包丟棄。一旦數(shù)據(jù)包拷貝到主存完成,網(wǎng)卡會(huì)通過中斷告知主機(jī)OS。

之后驅(qū)動(dòng)會(huì)檢查它是否能處理這個(gè)新的包。如果能處理,驅(qū)動(dòng)會(huì)把數(shù)據(jù)包包裝成OS認(rèn)識(shí)的結(jié)構(gòu)(linux sk_buffer)并推送到上層。 鏈路層接收到幀后檢查通過的話會(huì)按照協(xié)議解幀并推送至IP層。

IP層會(huì)在解包之后根據(jù)包中包含的IP信息決定推送至上層還是轉(zhuǎn)發(fā)到其他IP。如果判斷需要推送至上層,則會(huì)解掉IP包頭并推送至TCP層。

TCP在解報(bào)之后會(huì)根據(jù)其四元組找到對(duì)應(yīng)的TCB,之后通過TCP協(xié)議處理這個(gè)報(bào)文。在接收到報(bào)文后,會(huì)把報(bào)文加到接受報(bào)文,之后根據(jù)TCP的狀態(tài)發(fā)送一個(gè)ACK給對(duì)端。

當(dāng)然上述過程會(huì)受到NAT等等Netfilter的作用,這里不談了,也沒深研究過。當(dāng)然為了性能,大牛們方方面面也做了很多努力,比如大到RDMA、DPDK等大的軟硬件技術(shù),小到zero-copy、checksum offload等;

總結(jié)

現(xiàn)代的軟硬件TCP/IP協(xié)議棧單鏈接發(fā)送速率到1~2GiB/s完全沒有任何問題(經(jīng)過實(shí)測(cè))。如果你想探索更優(yōu)秀的性能,你可以嘗試RMDA等技術(shù),他們通過繞過內(nèi)核以減少拷貝等方式優(yōu)化了性能,當(dāng)然可能依賴硬件。

 

責(zé)任編輯:武曉燕 來源: 今日頭條
相關(guān)推薦

2010-09-08 15:11:36

TCP IP協(xié)議棧

2010-06-13 14:54:40

TCP IP協(xié)議棧linux

2014-10-15 09:14:24

IP

2021-07-09 08:55:23

LinuxTCPIP

2010-09-08 15:34:27

TCP IP協(xié)議棧

2010-09-08 15:24:28

TCP IP協(xié)議棧

2010-09-08 15:15:12

TCP IP協(xié)議棧

2010-09-27 13:25:58

TCP IP協(xié)議棧

2019-08-21 05:48:06

TCPIP協(xié)議棧

2022-06-27 08:59:21

數(shù)據(jù)包TCP/IP協(xié)議棧

2010-06-13 13:39:46

TCP IP協(xié)議棧

2021-07-06 21:29:16

TCPIP協(xié)議棧

2021-05-12 00:07:27

TCPIP協(xié)議

2020-12-03 08:37:38

TCPIPARP協(xié)議

2010-06-09 13:54:13

TCP傳輸協(xié)議

2014-11-21 09:16:23

TCPIP

2010-06-08 13:32:19

TCP IP協(xié)議基礎(chǔ)

2010-06-08 14:23:47

TCP IP協(xié)議概念

2020-07-09 08:14:43

TCPIP協(xié)議棧

2010-09-09 14:43:08

TCP IP協(xié)議棧
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)