冷门端口号
时间:2022-04-15 17:49 | 分类: 句子大全 | 作者:阿里云云栖号 | 评论: 次 | 点击: 次
冷门端口号
1. 电驴子的使用技巧
如果你所使用的是WindowsXP系统的话,除了要打开你系统上安装的防火墙之外,还需要在XP自带的防火墙中打开eMule中设置的相应的TCP和UDP端口应该就可 在电骡中选择选项,TCP:7115.UDP:7125,选中在WINXP中打开这些端口 再就是不过这样只能是在eMule的本次运行当中生效,并不能保证以后都自动打开相应的端口。
可以在“扩展设置”里面设置相应的选项选中“当启动/推出eMule时,打开/关闭WinXP防火墙端口” 如果你的WinXP已经升级到了SP2。上面介绍的eMule的相关设置是一样都可以实现的。
只不过因为WinXP_SP2的防火墙安全性更高一些,会在系统防火墙打开相应端口之前“询问”一下,只要点击“解除阻止”就可以了。速度慢有很多原因,高ID速度不一定很快,速度快的主要原因就是发布资源新热 速度一般和一下方面有关: 1、如果你那文件是比较冷门的,源比较少,速度可能只有40K。
热门的一般都能够达到150以上。如何判断热门冷门,例如在veryCD里下载东西,首先在发布页面看看片子的发布时间,然后到论坛看看发布的帖子的跟贴情况,比较新的和多人回应的就是比较热门的。
2、有时候上传和下载的比例要调好,先按“选项” 再按“连接” 热门的文件,我一般都把上传速度调到40-50,因为有能力就要多积分(何谓积分,第五点会谈到),不限制速度(就是上传限制的项不打钩),下载调到300,不限制速度(我一般只能到达220) 冷门的文件,上传调到30,更冷门的甚至要限制上传在30或者20,下载仍然是300,不限制。 上传与下载的累积比例最好是1:1,控制在1:2以内 3、选一个好的服务器,好的服务器就是文件数比较多,用户多,ping值比较低的。
首先推荐使用Razorback 2.0,国内推荐VC.eserver.1或VC.eserver.ZJ。 4、如果下载的文件不够热,就同时下载10个文件以上。
不要在一棵树上吊死。 5、这里要谈到电驴的精髓,电驴与BT不同的地方在于电驴有一个积分系统,就是上传越多积分越高,积分决定了你等待下载时在各个源的排队位置,你在别人那里下载过东西,你就欠那个人的你早晚要还给他。
不要一下载完就跑了,如果你的电脑配置高,你可以一边看电影,一边开着电驴增加积分。如果你积分很高,不用排队就能下载,就不会出现明明有源但还在等待状态的情况了。
你遇到的有些任务没在下载的情况,一是由于冷门、源少,二是因为你上传不够,排队排的比较后。估计到今天不少朋友都已经初步掌握了电驴的使用,本课将讲解让很多初学者头疼的设置问题。
所有的设置变更都要点“应用”或者“确定”项才能生效。 1、先说说“统计”菜单,这个菜单很有用,你修改设置所造成的一切影响结果,就可以从这里得到体现。
那三个曲线图就不说了,很直观,自己看看就明白了。重要的是那个文本窗口,里面的统计数据对你适当更改电驴设置会有帮助。
最直观重要的是“连接”项和最前面的“本次运行上传:下载比例”。我的观点是,首先要努力提高“连接”项里面的平均下载速度,其次使“本次运行上传:下载比例”高于1,小于2(不宜太高),这样你对于电驴的奉献就和索取基本一致了,这和电驴的宗旨也是一致的。
2、点“选项”,点“服务器”,将里面的选项除最后1项以外都选上,别的倒无所谓,尤其重要的是要把倒数第2项:仅自动连接到静态服务器选上。然后再点第3项后面的“列表”,会打开写字板,把以下的每日更新的服务器列表拷贝到里面:/x1/server.met/x1/server.met然后保存,退出写字板。
这样启动emule的时侯就可以自动更新服务器了。连接服务器的数目决定你最大可以选择下载的文件数目,从理论上当然是越多越好了。
但是你的电驴扫描服务器的时候要耗费时间和内存,而且有的服务器文件数目也不过几千,几万,没有太大的价值,所以建议数目不要太多。加入我上面列的三个列表后,你的服务器数目一般可以保证150—250之间,可以满足足够的需求。
3、仍然在“选项”里面,点“连接”,如果最下面的三项没有打上勾请补上。再看上面各项: 每个文件的最大来源数—硬性限制:300-500是比较适中的数值;连接限制—最大连接数:填一个较大的数(统计里面可以提供参考意见),但是也别太大,建议输入是上一个数字的15倍左右,例如5000;最后说说连接能力和上限:首先要知道自己用网络的最大上下载速度是多少k.以下我自己定义了三种模式,对应三种不同的设定(一般的用户用傻瓜模式就可以了,本人推荐使用下两种模式):傻瓜模式:在能力里面,下载输入高于你最大速度的数值,上传里面输入你想提供给别人下载的总速度,一般可以输入你下载速度的1/5-1/3,比如你的网络最大下载速度是200K,这两个数可以输入300(只要高过200都可以)和50,在上限里面,下载输入0(就是没有限制),上传则为和前面一个上传能力相同的数值。
手动档模式:在能力里面,下载输入尽量接近你最大下载能力的数值,上传输入此数据的1/5-1/3.在上限里面两个数据都输入0.然后点右上的小点,将电驴窗。
那些你不知道的 TCP 冷门知识
最近在做数据库相关的事情,碰到了很多TCP相关的问题,新的场景新的挑战,有很多之前并没有掌握透彻的点,大大开了一把眼界,选了几个案例分享一下。
案例一:TCP中并不是所有的RST都有效
背景知识:在TCP协议中,包含RST标识位的包,用来异常的关闭连接。在TCP的设计中它是不可或缺的,发送RST段关闭连接时,不必等缓冲区的数据都发送出去,直接丢弃缓冲区中的数据。而接收端收到RST段后,也不必发送ACK来确认。
问题现象:某客户连接数据库经常出现连接中断,但是经过反复排查,后端数据库实例排查没有执行异常或者Crash等问题,客户端Connection reset的堆栈如下图
经过复现及双端抓包的初步定位,找到了一个可疑点,TCP交互的过程中客户端发了一个RST(后经查明是客户端本地的一些安全相关iptables规则导致),但是神奇的是,这个RST并没有影响TCP数据的交互,双方很愉快的无视了这个RST,很开心的继续数据交互,然而10s钟之后,连接突然中断,参看如下抓包:
关键点分析
从抓包现象看,在客户端发了一个RST之后,双方的TCP数据交互似乎没有受到任何影响,无论是数据传输还是ACK都很正常,在本轮数据交互结束后,TCP连接又正常的空闲了一会,10s之后连接突然被RST掉,这里就有两个有意思的问题了:
TCP数据交互过程中,在一方发了RST以后,连接一定会终止么连接会立即终止么,还是会等10s查看一下RFC的官方解释:
简单来说,就是RST包并不是一定有效的,除了在TCP握手阶段,其他情况下,RST包的Seq号,都必须in the window,这个in the window其实很难从字面理解,经过对Linux内核代码的辅助分析,确定了其含义实际就是指TCP的 —— 滑动窗口,准确说是滑动窗口中的接收窗口。
我们直接检查Linux内核源码,内核在收到一个TCP报文后进入如下处理逻辑:
下面是内核中关于如何确定Seq合法性的部分:
总结
Q:TCP数据交互过程中,在一方发了RST以后,连接一定会终止么?A:不一定会终止,需要看这个RST的Seq是否在接收方的接收窗口之内,如上例中就因为Seq号较小,所以不是一个合法的RST被Linux内核无视了。
Q:连接会立即终止么,还是会等10s?A:连接会立即终止,上面的例子中过了10s终止,正是因为,linux内核对RFC严格实现,无视了RST报文,但是客户端和数据库之间经过的SLB(云负载均衡设备),却处理了RST报文,导致10s(SLB 10s 后清理session)之后关闭了TCP连接
这个案例告诉我们,透彻的掌握底层知识,其实是很有用的,否则一旦遇到问题,(自证清白并指向root cause)都不知道往哪个方向排查。
案例二:Linux内核究竟有多少TCP端口可用
背景知识:我们平时有一个常识,Linux内核一共只有65535个端口号可用,也就意味着一台机器在不考虑多网卡的情况下最多只能开放65535个TCP端口。
但是经常看到有单机百万TCP连接,是如何做到的呢,这是因为,TCP是采用四元组(Client端IP + Client端Port + Server端IP + Server端Port)作为TCP连接的唯一标识的。如果作为TCP的Server端,无论有多少Client端连接过来,本地只需要占用同一个端口号。而如果作为TCP的Client端,当连接的对端是同一个IP + Port,那确实每一个连接需要占用一个本地端口,但如果连接的对端不是同一个IP + Port,那么其实本地是可以复用端口的,所以实际上Linux中有效可用的端口是很多的(只要四元组不重复即可)。
问题现象:作为一个分布式数据库,其中每个节点都是需要和其他每一个节点都建立一个TCP连接,用于数据的交换,那么假设有100个数据库节点,在每一个节点上就会需要100个TCP连接。当然由于是多进程模型,所以实际上是每个并发需要100个TCP连接。假如有100个并发,那就需要1W个TCP连接。但事实上1W个TCP连接也不算多,由之前介绍的背景知识我们可以得知,这远远不会达到Linux内核的瓶颈。但是我们却经常遇到端口不够用的情况, 也就是“bind:Address already in use”:
其实看到这里,很多同学已经在猜测问题的关键点了,经典的TCP time_wait 问题呗,关于TCP的 time_wait 的背景介绍以及应对方法不是本文的重点就不赘述了,可以自行了解。乍一看,系统中有50W的 time_wait 连接,才65535的端口号,必然不可用:
但是这个猜测是错误的!因为系统参数 net.ipv4.tcp_tw_reuse 早就已经被打开了,所以不会由于 time_wait 问题导致上述现象发生,理论上说在开启 net.ipv4.cp_tw_reuse 的情况下,只要对端IP + Port 不重复,可用的端口是很多的,因为每一个对端IP + Port都有65535个可用端口:
问题分析
Linux中究竟有多少个端口是可以被使用为什么在 tcp_tw_reuse 情况下,端口依然不够用Linux有多少端口可以被有效使用
理论来说,端口号是16位整型,一共有65535个端口可以被使用,但是Linux操作系统有一个系统参数,用来控制端口号的分配:
net.ipv4.ip_local_port_range
我们知道,在写网络应用程序的时候,有两种使用端口的方式:
方式一:显式指定端口号 —— 通过 bind() 系统调用,显式的指定bind一个端口号,比如 bind(8080) 然后再执行 listen() 或者 connect() 等系统调用时,会使用应用程序在 bind()中指定的端口号。方式二:系统自动分配 —— bind() 系统调用参数传0即 bind(0) 然后执行 listen()。或者不调用 bind(),直接 connect(),此时是由Linux内核随机分配一个端口号,Linux内核会在 net.ipv4.ip_local_port_range 系统参数指定的范围内,随机分配一个没有被占用的端口。例如如下情况,相当于 1-20000 是系统保留端口号(除非按方法一显式指定端口号),自动分配的时候,只会从 20000 - 65535 之间随机选择一个端口,而不会使用小于20000的端口:
为什么在 tcp_tw_reuse=1 情况下,端口依然不够用
细心的同学可能已经发现了,报错信息全部都是 bind() 这个系统调用失败,而没有一个是 connect() 失败。在我们的数据库分布式节点中,所有 connect() 调用(即作为TCP client端)都成功了,但是作为TCP server的 bind(0) + listen() 操作却有很多没成功,报错信息是端口不足。
由于我们在源码中,使用了 bind(0) + listen() 的方式(而不是bind某一个固定端口),即由操作系统随机选择监听端口号,问题的根因,正是这里。connect() 调用依然能从 net.ipv4.ip_local_port_range 池子里捞出端口来,但是 bind(0) 却不行了。为什么,因为两个看似行为相似的系统调用,底层的实现行为却是不一样的。
源码之前,了无秘密:bind() 系统调用在进行随机端口选择时,判断是否可用是走的 inet_csk_bind_conflict ,其中排除了存在 time_wait 状态连接的端口:
而 connect() 系统调用在进行随机端口的选择时,是走 __inet_check_established 判断可用性的,其中不但允许复用存在 TIME_WAIT 连接的端口,还针对存在TIME_WAIT的连接的端口进行了如下判断比较,以确定是否可以复用:
一张图总结一下:
于是答案就明了了,bind(0) 和 connect()冲突了,ip_local_port_range 的池子里被 50W 个 connect() 遗留的 time_wait 占满了,导致 bind(0) 失败。知道了原因,修复方案就比较简单了,将 bind(0) 改为bind指定port,然后在应用层自己维护一个池子,每次从池子中随机地分配即可。
总结
Q:Linux中究竟有多少个端口是可以被有效使用的?A:Linux一共有65535个端口可用,其中 ip_local_port_range 范围内的可以被系统随机分配,其他需要指定绑定使用,同一个端口只要TCP连接四元组不完全相同可以无限复用。
Q:什么在 tcp_tw_reuse=1 情况下,端口依然不够用?A:connect() 系统调用和 bind(0) 系统调用在随机绑定端口的时候选择限制不同,bind(0) 会忽略存在 time_wait 连接的端口。
这个案例告诉我们,如果对某一个知识点比如 time_wait,比如Linux究竟有多少Port可用知道一点,但是只是一知半解,就很容易陷入思维陷阱,忽略真正的Root Case,要掌握就要透彻。
案例三:诡异的幽灵连接
背景知识:TCP三次握手,SYN、SYN-ACK、ACK是所有人耳熟能详的常识,但是具体到Socket代码层面,是如何和三次握手的过程对应的,恐怕就不是那么了解了,可以看一下如下图,理解一下(图源:小林coding):
这个过程的关键点是,在Linux中,一般情况下都是内核代理三次握手的,也就是说,当你client端调用 connect() 之后内核负责发送SYN,接收SYN-ACK,发送ACK。然后 connect() 系统调用才会返回,客户端侧握手成功。
而服务端的Linux内核会在收到SYN之后负责回复SYN-ACK再等待ACK之后才会让 accept() 返回,从而完成服务端侧握手。于是Linux内核就需要引入半连接队列(用于存放收到SYN,但还没收到ACK的连接)和全连接队列(用于存放已经完成3次握手,但是应用层代码还没有完成 accept() 的连接)两个概念,用于存放在握手中的连接。
问题现象:我们的分布式数据库在初始化阶段,每两个节点之间两两建立TCP连接,为后续数据传输做准备。但是在节点数比较多时,比如320节点的情况下,很容易出现初始化阶段卡死,经过代码追踪,卡死的原因是,发起TCP握手侧已经成功完成的了 connect() 动作,认为TCP已建立成功,但是TCP对端却没有握手成功,还在等待对方建立TCP连接,从而整个集群一直没有完成初始化。
关键点分析:看过之前的背景介绍,聪明的小伙伴一定会好奇,假如我们上层的 accpet() 调用没有那么及时(应用层压力大,上层代码在干别的),那么全连接队列是有可能会满的,满的情况会是如何效果,我们下面就重点看一下全连接队列满的时候会发生什么。当全连接队列满时,connect() 和 accept() 侧是什么表现行为?实践是检验真理的最好途径我们直接上测试程序。
client.c :
server.c :
通过执行上述代码,我们观察Linux 3.10版本内核在全连接队列满的情况下的现象。神奇的事情发生了,服务端全连接队列已满,该连接被丢掉,但是客户端 connect() 系统调用却已经返回成功,客户端以为这个TCP连接握手成功了,但是服务端却不知道,这个连接犹如幽灵一般存在了一瞬又消失了:
这个问题对应的抓包如下:
正如问题中所述的现象,在一个320个节点的集群中,总会有个别节点,明明 connect() 返回成功了,但是对端却没有成功,因为3.10内核在全连接队列满的情况下,会先回复SYN-ACK,然后移进全连接队列时才发现满了于是丢弃连接,这样从客户端看来TCP连接成功了,但是服务端却什么都不知道。
Linux 4.9版本内核在全连接队列满时的行为在4.9内核中,对于全连接队列满的处理,就不一样,connect() 系统调用不会成功,一直阻塞,也就是说能够避免幽灵连接的产生:
抓包报文交互如下,可以看到Server端没有回复SYN-ACK,客户端一直在重传SYN:
事实上,在刚遇到这个问题的时候,我第一时间就怀疑到了全连接队列满的情况,但是悲剧的是看的源码是Linux 3.10的,而随手找的一个本地日常测试的ECS却刚好是Linux 4.9内核的,导致写了个demo测试例子却死活没有复现问题。排除了所有其他原因,再次绕回来的时候已经是一周之后了(这是一个悲伤的故事)。
总结
Q:当全连接队列满时,connect() 和 accept() 侧是什么表现行为?A:Linux 3.10内核和新版本内核行为不一致,如果在Linux 3.10内核,会出现客户端假连接成功的问题,Linux 4.9内核就不会出现问题。
这个案例告诉我们,实践是检验真理的最好方式,但是实践的时候也一定要睁大眼睛看清楚环境差异,如Linux内核这般稳定的东西,也不是一成不变的。唯一不变的是变化,也许你也是可以来数据库内核玩玩底层技术的。
本文为阿里云原创内容,未经允许不得转载。