快速可靠协议-KCP

KCP是一个快速可靠协议,能以比 TCP浪费10%-20%的带宽的代价,换取平均延迟降低 30%-40%,且最大延迟降低三倍的传输效果。纯算法实现,并不负责底层协议(如UDP)的收发,需要使用者自己定义下层数据包的发送方式,并以 callback的方式提供给 KCP。连时钟都需要外部传递进来,内部不会有任何一次系统调用。

整个协议只有 ikcp.h, ikcp.c两个源文件,可以方便的集成到用户自己的协议栈中。也许你实现了一个P2P,或者某个基于 UDP的协议,而缺乏一套完善的 ARQ可靠协议实现,那么简单的拷贝这两个文件到现有项目中,稍微编写两行代码,即可使用。

URL:https://github.com/skywind3000/kcp

技术特性

TCP是为流量设计的(每秒内可以传输多少KB的数据),讲究的是充分利用带宽。而KCP是为流速设计的(单个数据包从一端发送到一端需要多少时间),以10%-20%带宽浪费的代价换取了比 TCP快30%-40%的传输速度。TCP信道是一条流速很慢,但每秒流量很大的大运河,而KCP是水流湍急的小激流。KCP有正常模式和快速模式两种,通过以下策略达到提高流速的结果:

  • RTO翻倍vs不翻倍:TCP超时计算是RTOx2,这样连续丢三次包就变成RTOx8了,十分恐怖,而KCP启动快速模式后不x2,只是x1.5(实验证明1.5这个值相对比较好),提高了传输速度。
  • 选择性重传 vs 全部重传:TCP丢包时会全部重传从丢的那个包开始以后的数据,KCP是选择性重传,只重传真正丢失的数据包。
  • 快速重传:发送端发送了1,2,3,4,5几个包,然后收到远端的ACK: 1, 3, 4, 5,当收到ACK3时,KCP知道2被跳过1次,收到ACK4时,知道2被跳过了2次,此时可以认为2号丢失,不用等超时,直接重传2号包,大大改善了丢包时的传输速度。
  • 延迟ACK vs 非延迟ACK :TCP为了充分利用带宽,延迟发送ACK(NODELAY都没用),这样超时计算会算出较大RTT时间,延长了丢包时的判断过程。KCP的ACK是否延迟发送可以调节。
  • UNA vs ACK+UNA :ARQ模型响应有两种,UNA(此编号前所有包已收到,如TCP)和ACK(该编号包已收到),光用 UNA会导致丢包时全部重传,光用 ACK又会导致 ACK丢失成本太高。KCP有单独ACK,且数据包和ACK包都带UNA信息,有效降低ACK丢失成本。
  • 非退让流控:KCP正常模式同TCP一样使用公平退让法则,即发送窗口大小由:发送缓存大小、接收端剩余接收缓存大小、丢包退让及慢启动这四要素决定。但传送及时性要求很高的小数据时,可选择通过配置跳过后两步,仅用前两项来控制发送频率。以牺牲部分公平性及带宽利用率之代价,换取了开着BT都能流畅传输的效果。

基本使用

  1. 创建 KCP对象:
    // 初始化 kcp对象,conv为一个表示会话编号的整数,和tcp的 conv一样,通信双方需要
    // 保证 conv相同,相互的数据包才能够被认可,user是一个给回调函数的指针。
    ikcpcb *kcp = ikcp_create(conv, user);
  2. 设置回调函数:
    // KCP的下层协议输出函数,KCP需要发送数据时会调用它
    // buf/len 表示缓存和长度
    // user指针为 kcp对象创建时传入的值,用于区别多个 KCP对象
    int udp_output(const char *buf, int len, ikcpcb *kcp, void *user)
    {   ....
    }
    
    // 设置回调函数
    kcp->output = udp_output;
  3. 循环调用 update:
    // 以一定频率调用 ikcp_update来更新 kcp状态,并且传入当前的时钟(毫秒单位)。
    // 比如 10ms调用一次,或用 ikcp_check确定下次调用 update的时间不必每次调用。
    ikcp_update(kcp, millisec);
  4. 输入一个下层数据包:
    // 收到一个下层数据包(比如UDP包)时需要调用:
    ikcp_input(kcp, received_udp_packet, received_udp_size);

处理了下层协议的输出/输入后 KCP协议就可以正常工作了,使用 ikcp_send(kcp, ptr, size)来向远端发送数据。而另一端使用ikcp_recv(kcp, ptr, size)来接收数据。

协议配置

协议默认模式是一个标准的 ARQ,需要通过配置打开各项加速开关:

  • 工作模式
    int ikcp_nodelay(ikcpcb *kcp, int nodelay, int interval, int resend, int nc);
    • nodelay :是否启用 nodelay模式,0不启用;1启用。
    • interval :协议内部工作的 interval,单位毫秒,比如 10ms或者 20ms
    • resend :快速重传模式,默认0关闭,可以设置2(2次ACK跨越将会直接重传)
    • nc :是否关闭流控,默认是0代表不关闭,1代表关闭。

    普通模式:`ikcp_nodelay(kcp, 0, 40, 0, 0); 极速模式: ikcp_nodelay(kcp, 1, 10, 2, 1);

  • 最大窗口
    int ikcp_wndsize(ikcpcb *kcp, int sndwnd, int rcvwnd);

    该调用将会设置协议的最大发送窗口和最大接收窗口大小,默认为32.

  • 最大传输单元

    纯算法协议并不负责探测 MTU,默认 mtu是1400字节,可以使用ikcp_setmtu来设置该值。该值将会影响数据包归并及分片时候的最大传输单元。

  • 最小RTO

    不管是 TCP还是 KCP计算 RTO时都有最小 RTO的限制,即便计算出来RTO为40ms,由于默认的 RTO是100ms,协议只有在100ms后才能检测到丢包,快速模式下该值为30ms,可以手动更改该值:

    kcp->rx_minrto = 10;

内存分配器

 

默认KCP协议使用 malloc/free进行内存分配释放,如果应用层接管了内存分配,可以用ikcp_allocator来设置新的内存分配器,注意要在一开始设置:

ikcp_allocator(my_new_malloc, my_new_free);

前向纠错

 

为了进一步提高传输速度,下层协议也许会使用前向纠错技术。需要注意,前向纠错会根据冗余信息解出原始数据包。相同的原始数据包不要两次input到KCP,否则将会导致kcp以为对方重发了,这样会产生更多的ack占用额外带宽。

比如下层协议使用最简单的冗余包:单个数据包除了自己外,还会重复存储一次上一个数据包,以及上上一个数据包的内容:

Fn = (Pn, Pn-1, Pn-2)

P0 = (0, X, X)
P1 = (1, 0, X)
P2 = (2, 1, 0)
P3 = (3, 2, 1)


这样几个包发送出去,接收方对于单个原始包都可能被解出3次来(后面两个包任然会重复该包内容),那么这里需要记录一下,一个下层数据包只会input给kcp一次,避免过多重复ack带来的浪费。

 

管理大规模连接

 

如果需要同时管理大规模的 KCP连接(比如大于3000个),比如你正在实现一套类 epoll 的机制,那么为了避免每秒钟对每个连接调用大量的调用 ikcp_update,我们可以使用 ikcp_check来大大减少 ikcp_update调用的次数。 ikcp_check返回值会告诉你需要 在什么时间点再次调用 ikcp_update(如果中途没有 ikcp_send, ikcp_input的话, 否则中途调用了 ikcp_send, ikcp_input的话,需要在下一次interval时调用 update)

标准顺序是每次调用了 ikcp_update后,使用 ikcp_check决定下次什么时间点再次调用 ikcp_update,而如果中途发生了 ikcp_send, ikcp_input的话,在下一轮 interval 立马调用 ikcp_update和 ikcp_check。 使用该方法,原来在处理2000个 kcp连接且每 个连接每10ms调用一次update,改为 check机制后,cpu从 60%降低到 15%。

Loading

About skywind

Putty 本无树,MinGW 亦非台
This entry was posted in 编程技术, 网络编程 and tagged , . Bookmark the permalink.

21 Responses to 快速可靠协议-KCP

  1. test says:

    这个怎么用呀,可否提供简单的 client.c server.c 例程?

  2. skywind says:

    有的呀,就是那个test,既是client,也是server,使用模拟网络

  3. skywind says:

    @test
    你编译test.cpp即可,client,server都在里面。

  4. GPL协议 says:

    怎么使用的是GPL协议啊?我想用也没法用啊!

  5. dictator says:

    请教一个问题,假设在已有的网络框架嵌入kcp,由于存在大量连接的管理,这样整个架构看起来,底层会有一个epoll,而在应用层也将会有一个epoll-like来管理kcp概念连接?这样应该会造成数据在应用层的短时间滞留?

  6. skywind says:

    @dictator
    4000个连接以下,在 epoll_wait的空余时间(比如wait 10ms),每 10ms调度一下kcp的 update即可。4000个连接以上,在每 10ms靠时钟来判断哪些 kcp该调度了,设置时钟靠 ikcp_check的返回值来设定。issue里面也有这方面的讨论。

  7. dictator says:

    @skywind
    给kcp写了个lua绑定,比较简单,只是初步测试过:https://github.com/linxiaolong/lua-kcp

  8. skywind says:

    @dictator
    哈哈,看到了,厉害呀!我在 https://github.com/skywind3000/kcp 的首页给你做了链接。

  9. daividsun says:

    kcp 这个看上去很棒的样子, 做了个简单的pyhon cffi的绑定以便在python或者pypy上使用这个类库。
    在使用上有个疑问, 在使用epoll 这样的异步调用时在output回调函数中如何比较方便获取接受者的ip和端口信息

  10. daividsun says:

    daividsun :
    kcp 这个看上去很棒的样子, 做了个简单的pyhon cffi的绑定以便在python或者pypy上使用这个类库。
    https://github.com/sunzhaoping/python-ikcp

    在使用上有个疑问, 在使用epoll 这样的异步调用时在output回调函数中如何比较方便获取接受者的ip和端口信息

  11. skywind says:

    @daividsun
    你好,使用user指针,这是标准处理方法,和epoll里面的事件返回值的 epoll_event.data.ptr 一样用途,你在ikcp_create的时候将这个kcp关联的对象指针传进去,然后output最后一个参数会被传进来。

    kcp = ikcp_create(12345, (void*)MyConnection1);
    然后:
    int udp_output(const char *buf, int len, ikcpcb *kcp, void *user)
    {
    ClientConnection *MyConnection = (ClientConnection*)user;
    MyConnection->GetFd();
    }

    user 字段还可以保存整数:
    kcp = ikey_create(12345, (void*)integerKey);

    int udp_output(const char *buf, int len, ikcpcb *kcp, void *user)
    {
    int integerKey = (int)user;
    ClientConnection *MyConnection = ConnectionMap.findKey(integerKey);
    if (MyConnection != NULL) {…}
    }

  12. daividsun says:

    @skywind
    如果使用user 指针的话, 就需要为每个连接一个kcp的对象是吧。
    先前我是这样理解的, 使用udp协议的话本身不是面相连接的, 服务端只要创建一个udp的文件描述符就可以了
    这样使用一个kcp对象处理数据,这种情况下处理不都客户端的数据就会有问题了。

  13. daividsun says:

    daividsun :
    @skywind
    如果使用user 指针的话, 就需要为每个连接一个kcp的对象是吧。
    先前我是这样理解的, 使用udp协议的话本身不是面相连接的, 服务端只要创建一个udp的文件描述符就可以了
    这样使用一个kcp对象处理数据,这种情况下处理不都客户端的数据就会有问题了。

    晕打了好多错别字

  14. skywind says:

    @daividsun
    要建立对象的,后面你还需要保存很多东西到上面,比如密钥等。

  15. daividsun says:

    @skywind
    明白了,非常感谢

  16. qqwx says:

    interval底层设置10ms以上是为了效率吗,我测试了下速度,正常情况下kcp和tcp速度是更慢,20ms左右,应该是interval 10ms*2造成的,但是如果整个网络丢包率比较大时kcp会表现的更稳定些

  17. ray says:

    能用来传输h264码流吗?如果能有哪些注意事项还有效率怎么样?谢谢!

  18. lurence says:

    test 有内存泄漏 DelayPacket 析构函数需要用 [] 回收内存数组

  19. killeven says:

    kcp确实是个很棒的协议,我翻译了一份pascal版本的
    https://github.com/killeven/kcp-pascal
    目前只做了些简单的测试

  20. MiYu says:

    UDP连接使用KCP后, 是否会变得可靠?

  21. lijinhua says:

    请教一个问题,使用udp,是不是也可以防止DDos攻击??

Leave a Reply

Your email address will not be published. Required fields are marked *