前几天在看apue第16章关于socket的例子,就是一个非常典型的socket服务器,关键代码如下:
void serve (int sockfd) { int ret; int clfd; int status; FILE *fp; pid_t pid; char buf[BUFLEN]; for (;;) { clfd = accept (sockfd, NULL, NULL); if (clfd < 0) { syslog (LOG_ERR, "accept error: %d, %s", errno, strerror (errno)); //if (errno == EOPNOTSUPP) //{ // syslog (LOG_INFO, "retry.."); // continue; //} exit (1); } fp = popen ("/usr/bin/uptime", "r"); if (fp == NULL) { sprintf (buf, "error: %s\n", strerror (errno)); ret = send (clfd, buf, strlen (buf), 0); syslog (LOG_ERR, "write back %d for error", ret); } else { while (fgets (buf, BUFLEN, fp) != NULL) { ret = send (clfd, buf, strlen (buf), 0); // very amazing, add these log will lead to accept failed with EOPNOTSUPP (95) // maybe syslog used dgram socket confuse us.. syslog (LOG_ERR, "write back %d", ret); } pclose (fp); } close (clfd); } }
当accept成功返回一个连接clfd后,使用这个serve方法来服务客户端的请求,简单说就是通过popen启动uptime命令返回当前系统运行时长,然后将uptime的输出导出到clfd上返回给客户端。
正常的输出如下:
[yunhai@localhost 16.chapter]$ ./uptime_tcp_clt connect ok 02:02:26 up 6 days, 4:40, 5 users, load average: 0.00, 0.00, 0.00
但是与书上例子不同,为了查看服务端的活动情况,我在serve中加了几句syslog输出,以便通过 tail -f /var/log/messages 来查看服务运行的情况。
正常情况下服务输出如下:
ruptimed: write back 70
但是神奇的事情发生了,我再次启动客户端后,连不上服务器了:
[yunhai@localhost 16.chapter]$ ./uptime_tcp_clt connect failed, retry... connect failed, retry... connect failed, retry...
再看服务器进程,居然已经退出了,回来查看daemon日志,发现这么一句:
ruptimed: accept error: 95, Operation not supported
原来accept出错导致服务器退出了,错误码是95,。
如果我将加入的syslog注释掉,就一切正常,所以我怀疑是使用syslog和syslogd进程在进行UDP通讯传输日志时,干扰了accept从而导致后者失败。
但是这个过程具体是怎样的,目前还不得而知,只知道我用的端口是4201,改用其它端口也是这样。
我尝试过在失败后重启accept操作,结果陷入无穷循环,每次都得相同的错误。