TCP连接的状态详解以及故障排查

您所在的位置:网站首页 端口状态为reset TCP连接的状态详解以及故障排查

TCP连接的状态详解以及故障排查

2024-04-14 04:03| 来源: 网络整理| 查看: 265

经常出现的错误:

22:参数错误,比如ip地址不合法,没有目标端口等

101:网络不可达,比如不能ping通

111:链接被拒绝,比如目标关闭链接等

115:当链接设置为非阻塞时,目标没有及时应答,返回此错误,socket可以继续使用。比如socket连接

 

附录:Linux的错误码表(errno table)

_ 124 EMEDIUMTYPE_ Wrong medium type_ 123 ENOMEDIUM__ No medium found_ 122 EDQUOT___  Disk quota exceeded_ 121 EREMOTEIO__ Remote I/O error_ 120 EISNAM___  Is a named type file_ 119 ENAVAIL___ No XENIX semaphores available_ 118 ENOTNAM___ Not a XENIX named type file_ 117 EUCLEAN___ Structure needs cleaning_ 116 ESTALE___  Stale NFS file handle_ 115 EINPROGRESS  +Operation now in progress

操作正在进行中。一个阻塞的操作正在执行。

_ 114 EALREADY__  Operation already in progress_ 113 EHOSTUNREACH  No route to host_ 112 EHOSTDOWN__ Host is down_ 111 ECONNREFUSED  Connection refused

 

1、拒绝连接。一般发生在连接建立时。

拔服务器端网线测试,客户端设置keep alive时,recv较快返回0, 先收到ECONNREFUSED (Connection refused)错误码,其后都是ETIMEOUT。

2、an error returned from connect(), so it can only occur in a client (if a client is defined as the party that initiates the connection

_ 110 ETIMEDOUT_  +Connection timed out_ 109 ETOOMANYREFS  Too many references: cannot splice_ 108 ESHUTDOWN__ Cannot send after transport endpoint shutdown_ 107 ENOTCONN__  Transport endpoint is not connected

在一个没有建立连接的socket上,进行read,write操作会返回这个错误。出错的原因是socket没有标识地址。Setsoc也可能会出错。

还有一种情况就是收到对方发送过来的RST包,系统已经确认连接被断开了。

_ 106 EISCONN___ Transport endpoint is already connected

一般是socket客户端已经连接了,但是调用connect,会引起这个错误。

_ 105 ENOBUFS___ No buffer space available_ 104 ECONNRESET_  Connection reset by peer

连接被远程主机关闭。有以下几种原因:远程主机停止服务,重新启动;当在执行某些操作时遇到失败,因为设置了“keep alive”选项,连接被关闭,一般与ENETRESET一起出现。

 

1、在客户端服务器程序中,客户端异常退出,并没有回收关闭相关的资源,服务器端会先收到ECONNRESET错误,然后收到EPIPE错误。

2、连接被远程主机关闭。有以下几种原因:远程主机停止服务,重新启动;当在执行某些操作时遇到失败,因为设置了“keep alive”选项,连接被关闭,一般与ENETRESET一起出现。

3、远程端执行了一个“hard”或者“abortive”的关闭。应用程序应该关闭socket,因为它不再可用。当执行在一个UDP socket上时,这个错误表明前一个send操作返回一个ICMP“port unreachable”信息。

4、如果client关闭连接,server端的select并不出错(不返回-1,使用select对唯一一个socket进行non- blocking检测),但是写该socket就会出错,用的是send.错误号:ECONNRESET.读(recv)socket并没有返回错误。

5、该错误被描述为“connection reset by peer”,即“对方复位连接”,这种情况一般发生在服务进程较客户进程提前终止。当服务进程终止时会向客户 TCP 发送 FIN 分节,客户 TCP 回应 ACK,服务 TCP 将转入 FIN_WAIT2 状态。此时如果客户进程没有处理该 FIN (如阻塞在其它调用上而没有关闭 Socket 时),则客户 TCP 将处于 CLOSE_WAIT 状态。当客户进程再次向 FIN_WAIT2 状态的服务 TCP 发送数据时,则服务 TCP 将立刻响应 RST。一般来说,这种情况还可以会引发另外的应用程序异常,客户进程在发送完数据后,往往会等待从网络IO接收数据,很典型的如 read 或 readline 调用,此时由于执行时序的原因,如果该调用发生在 RST 分节收到前执行的话,那么结果是客户进程会得到一个非预期的 EOF 错误。此时一般会输出“server terminated prematurely”-“服务器过早终止”错误。

_ 103 ECONNABORTED  Software caused connection abort

 

1、软件导致的连接取消。一个已经建立的连接被host方的软件取消,原因可能是数据传输超时或者是协议错误。

2、该错误被描述为“software caused connection abort”,即“软件引起的连接中止”。原因在于当服务和客户进程在完成用于 TCP 连接的“三次握手”后,客户 TCP 却发送了一个 RST (复位)分节,在服务进程看来,就在该连接已由 TCP 排队,等着服务进程调用 accept 的时候 RST 却到达了。POSIX 规定此时的 errno 值必须 ECONNABORTED。源自 Berkeley 的实现完全在内核中处理中止的连接,服务进程将永远不知道该中止的发生。服务器进程一般可以忽略该错误,直接再次调用accept。

当TCP协议接收到RST数据段,表示连接出现了某种错误,函数read将以错误返回,错误类型为ECONNERESET。并且以后所有在这个套接字上的读操作均返回错误。错误返回时返回值小于0。

_ 102 ENETRESET__ Network dropped connection on reset

 

网络重置时丢失连接。

由于设置了"keep-alive"选项,探测到一个错误,连接被中断。在一个已经失败的连接上试图使用setsockopt操作,也会返回这个错误。

_ 101 ENETUNREACH_ Network is unreachable

 

网络不可达。Socket试图操作一个不可达的网络。这意味着local的软件知道没有路由到达远程的host。_ 100 ENETDOWN__  Network is down_  99 EADDRNOTAVAIL Cannot assign requested address_  98 EADDRINUSE_  Address already in use_  97 EAFNOSUPPORT  Address family not supported by protocol_  96 EPFNOSUPPORT  Protocol family not supported_  95 EOPNOTSUPP_  Operation not supported_  94 ESOCKTNOSUPPORT Socket type not supported

Socket类型不支持。指定的socket类型在其address family中不支持。如可选选中选项SOCK_RAW,但实现并不支持SOCK_RAW sockets。

_  93 EPROTONOSUPPORT Protocol not supported

不支持的协议。系统中没有安装标识的协议,或者是没有实现。如函数需要SOCK_DGRAM socket,但是标识了stream protocol.。

_  92 ENOPROTOOPT_ Protocol not available

该错误不是一个 Socket 连接相关的错误。errno 给出该值可能由于,通过 getsockopt 系统调用来获得一个套接字的当前选项状态时,如果发现了系统不支持的选项参数就会引发该错误。_  91 EPROTOTYPE_  Protocol wrong type for socket

 

协议类型错误。标识了协议的Socket函数在不支持的socket上进行操作。如ARPA Internet

UDP协议不能被标识为SOCK_STREAM socket类型。

_  90 EMSGSIZE__ +Message too long

 

消息体太长。

发送到socket上的一个数据包大小比内部的消息缓冲区大,或者超过别的网络限制,或是用来接收数据包的缓冲区比数据包本身小。

_  89 EDESTADDRREQ  Destination address required

 

需要提供目的地址。

在一个socket上的操作需要提供地址。如往一个ADDR_ANY 地址上进行sendto操作会返回这个错误。

_  88 ENOTSOCK__  Socket operation on non-socket

在非socket上执行socket操作。

_  87 EUSERS___  Too many users_  86 ESTRPIPE__  Streams pipe error_  85 ERESTART__  Interrupted system call should be restarted_  84 EILSEQ___  Invalid or incomplete multibyte or wide character_  83 ELIBEXEC__  Cannot exec a shared library directly_  82 ELIBMAX___ Attempting to link in too many shared libraries_  81 ELIBSCN___ .lib section in a.out corrupted_  80 ELIBBAD___ Accessing a corrupted shared library_  79 ELIBACC___ Can not access a needed shared library_  78 EREMCHG___ Remote address changed_  77 EBADFD___  File descriptor in bad state_  76 ENOTUNIQ__  Name not unique on network_  75 EOVERFLOW__ Value too large for defined data type_  74 EBADMSG__  +Bad message_  73 EDOTDOT___ RFS specific error_  72 EMULTIHOP__ Multihop attempted_  71 EPROTO___  Protocol error_  70 ECOMM____ Communication error on send_  69 ESRMNT___  Srmount error_  68 EADV____  Advertise error_  67 ENOLINK___ Link has been severed_  66 EREMOTE___ Object is remote_  65 ENOPKG___  Package not installed_  64 ENONET___  Machine is not on the network_  63 ENOSR____ Out of streams resources_  62 ETIME____ Timer expired_  61 ENODATA___ No data available_  60 ENOSTR___  Device not a stream_  59 EBFONT___  Bad font file format_  57 EBADSLT___ Invalid slot_  56 EBADRQC___ Invalid request code_  55 ENOANO___  No anode_  54 EXFULL___  Exchange full_  53 EBADR____ Invalid request descriptor_  52 EBADE____ Invalid exchange_  51 EL2HLT___  Level 2 halted_  50 ENOCSI___  No CSI structure available_  49 EUNATCH___ Protocol driver not attached_  48 ELNRNG___  Link number out of range_  47 EL3RST___  Level 3 reset_  46 EL3HLT___  Level 3 halted_  45 EL2NSYNC__  Level 2 not synchronized_  44 ECHRNG___  Channel number out of range_  43 EIDRM____ Identifier removed_  42 ENOMSG___  No message of desired type_  40 ELOOP____ Too many levels of symbolic links_  39 ENOTEMPTY_  +Directory not empty_  38 ENOSYS___ +Function not implemented_  37 ENOLCK___ +No locks available_  36 ENAMETOOLONG +File name too long_  35 EDEADLK__  +Resource deadlock avoided_  34 ERANGE___ +Numerical result out of range_  33 EDOM____ +Numerical argument out of domain_  32 EPIPE___  +Broken pipe

接收端关闭(缓冲中没有多余的数据),但是发送端还在write:

1、Socket 关闭,但是socket号并没有置-1。继续在此socket上进行send和recv,就会返回这种错误。这个错误会引发SIGPIPE信号,系统会将产生此EPIPE错误的进程杀死。所以,一般在网络程序中,首先屏蔽此消息,以免发生不及时设置socket进程被杀死的情况。

2、write(..) on a socket that has been closed at the other end will cause a SIGPIPE.

3、错误被描述为“broken pipe”,即“管道破裂”,这种情况一般发生在客户进程不理会(或未及时处理)Socket 错误,继续向服务 TCP 写入更多数据时,内核将向客户进程发送 SIGPIPE 信号,该信号默认会使进程终止(此时该前台进程未进行 core dump)。结合上边的 ECONNRESET 错误可知,向一个 FIN_WAIT2 状态的服务 TCP(已 ACK 响应 FIN 分节)写入数据不成问题,但是写一个已接收了 RST 的 Socket 则是一个错误。

_  31 EMLINK___ +Too many links_  30 EROFS___  +Read-only file system_  29 ESPIPE___ +Illegal seek_  28 ENOSPC___ +No space left on device_  27 EFBIG___  +File too large_  26 ETXTBSY___ Text file busy_  25 ENOTTY___ +Inappropriate ioctl for device_  24 EMFILE___ +Too many open files

打开了太多的socket。对进程或者线程而言,每种实现方法都有一个最大的可用socket数目处理,或者是全局的,或者是局部的。

_  23 ENFILE___ +Too many open files in system_  22 EINVAL___ +Invalid argument

无效参数。提供的参数非法。有时也会与socket的当前状态相关,如一个socket并没有进入listening状态,此时调用accept,就会产生EINVAL错误。

_  21 EISDIR___ +Is a directory_  20 ENOTDIR__  +Not a directory_  19 ENODEV___ +No such device_  18 EXDEV___  +Invalid cross-device link_  17 EEXIST___ +File exists_  16 EBUSY___  +Device or resource busy_  15 ENOTBLK___ Block device required_  14 EFAULT___ +Bad address地址错误_  13 EACCES___ +Permission denied_  12 ENOMEM___ +Cannot allocate memory_  11 EAGAIN___ +Resource temporarily unavailable

在读数据的时候,没有数据在底层缓冲的时候会遇到,一般的处理是循环进行读操作,异步模式还会等待读事件的发生再读

 

   1、Send返回值小于要发送的数据数目,会返回EAGAIN和EINTR。

   2、recv 返回值小于请求的长度时说明缓冲区已经没有可读数据,但再读不一定会触发EAGAIN,有可能返回0表示TCP连接已被关闭。

   3、当socket是非阻塞时,如返回此错误,表示写缓冲队列已满,可以做延时后再重试.

   4、在Linux进行非阻塞的socket接收数据时经常出现Resource temporarily unavailable,errno代码为11(EAGAIN),表明在非阻塞模式下调用了阻塞操作,在该操作没有完成就返回这个错误,这个错误不会破坏socket的同步,不用管它,下次循环接着recv就可以。对非阻塞socket而言,EAGAIN不是一种错误。

_  10 ECHILD___ +No child processes__ 9 EBADF___  +Bad file descriptor__ 8 ENOEXEC__  +Exec format error__ 7 E2BIG___  +Argument list too long__ 6 ENXIO___  +No such device or address__ 5 EIO____  +Input/output error__ 4 EINTR___  +Interrupted system call

 

    阻塞的操作被取消阻塞的调用打断。如设置了发送接收超时,就会遇到这种错误。

    只能针对阻塞模式的socket。读,写阻塞的socket时,-1返回,错误号为INTR。另外,如果出现EINTR即errno为4,错误描述Interrupted system call,操作也应该继续。如果recv的返回值为0,那表明连接已经断开,接收操作也应该结束。

__ 3 ESRCH___  +No such process__ 2 ENOENT___ +No such file or directory__ 1 EPERM___  +Operation not permitted

 



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3