Socket编程
套接字概念
在Linux环境下,Socket用于表示进程间网络通信的特殊文件类型。本质为内核借助缓冲区形成的伪文件。既然是文件,那么我们可以使用文件描述符引用套接字,与管道类似的,Linux系统将其封装成文件的目的是为了统一接口,使得读写套接字和读写文件的操作一致。区别是管道主要应用于本地进程间通信,而套接字多应用于网络进程间数据的传递。
在TCP/IP
协议中,”IP地址+TCP或UDP端口号”唯一标识网络通讯中的一个进程,”IP地址+端口号”就对应一个socket
。欲建立连接的两个进程各自有一个socket
来标识,那么这两个socket
组成的socket pair
就唯一标识一个连接,因此可以用Socket
来描述网络连接的一对一关系。
在网络通信中,套接字一定是成对出现的。一端的发送缓冲区对应对端的接受缓冲区。我们使用同一个文件描述符对应发送缓冲区和接收缓冲区。
网络字节序
我们已经知道,内存中的多字节数据相对于内存地址有大端和小端之分,磁盘文件中的多字节数据相对于文件中的偏移地址也有大端小端之分,网络数据流同样有大端小端之分,那么如何定义网络数据流的地址呢。发送主机通常将发送缓冲区中的数据按内存地址从低到高的顺序发出。接收主机把从网络上接到的字节一次保存在接受缓冲区中,也是按内存地址从低到高的顺序保存,因此,网络数据流的地址应这样规定:先发出的数据是低地址,后发出的数据是高地址。
TCP/IP
协议规定,网络数据流应采用大端字节序,即低地址高字节,例如在UDP
段格式中,地址0-1
是16位的源端口号,如果这个端口号是1000(0x3e8)
,则地址0是0x03
,地址1时是0xe8
,也就是先发0x03
,再发0xe8
,这16位在发送主机的缓冲区中也应该是低地址存0x03
,高地址存0xe8
,但是如果发送主机是小端字节序的,这16位被解释成0xe803
,而不是1000。因此发送主机把1000填到发送缓冲区之前需要做字节序的转换。同样的,接收主机如果是小端字节序的,接到16位的源端口号也要做字节序的转换,如果主机是大端字节序的,发送和接收都不需要做转换。同理,32位的IP地址也要考虑网络字节序和主机字节序的问题。
为了使网络程序具有可移植性,使同样的C代码在大端和小端计算机上编译后都能正常运行,可以调用以下库函数做网络字节序和主机字节序的转换。
1 |
|
其中h标识host
,n表示network
,l表示32位长整数,s表示16位短整数。如果主机时小端字节序,这些函数将参数做相应的大小端转换然后返回,如果主机时大端字节序,这些函数不做转换,将参数原封不动的返回。
IP地址转换函数
1 | int inet_pton(int af,const char *src,void *dst); |
网络套接字函数
socket函数
1 |
|
bind函数
给socket绑定一个地质结构(IP+port)
1 | int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen); |
listen函数
设置同时与服务器建立连接的上限数
1 | int listen(int sockfd,int backlog) |
accept函数
阻塞等待客户端建立连接,成功的话,返回一个与客户端成功连接的socket文件描述符。
1 | int accept(int sockfd,struct socketaddr *addr,socklen_t *addrlen); |
connect函数
使用现有的socket与服务器建立连接
1 | int connect(int sockfd,const struct sockaddr *addr,socklen_t addrlen); |
实现server端
1 |
|
实现client端
1 |
|
实现多进程并发服务器
首先实现功能封装函数wrap.c
,代码如下
1 |
|
实现自定义头文件wrap.h
,代码如下
1 |
|
实现服务端server.c
,代码如下
1 |
|
联合编译生成server
文件
1 | gcc server.c wrap.c -o server |
多路IO转接
select
借助内核,select来监听客户端连接、数据通信事件。
1 | int select(int nfds, fd_set *readfds, fd_set *writefds, |
1 | void FD_ZERO(fd_set *set) //清空一个文件描述符集合 |
使用select实现多路IO转接
server
端代码如下
1 |
|
自定义文件头wrap.h
和封装函数wrap.c
代码和之前的相同。
poll
1 | int poll(struct pollfd *fds, nfds_t nfds,int timeout) |
read函数返回值
1 | >0: 实际读到的字节数 |
poll的优点:
自带数组结构。可以将监听事件集合和返回事件集合分离
扩展 监听上限,超出1024限制
缺点
- 不能跨平台。只能在Linux下使用
- 无法直接定位满足监听事件的文件描述符,编码难度较大
epoll
1 | int epoll_create(int size) |
1 | int epoll_ctl(int epfd,int op,int fd,struct epoll_event *event) |
1 | int epoll_wait(int epfd,struct epoll_event *events,int maxevents,int timeout) |
事件模型
EPOLL事件有两种模型
Edge Triggered(ET):边缘触发只有数据到来才触发,不管缓存区中是否还有数据
1
2struct epoll_event event;
event.events = EPOLLIN | EPOLLET;Level Triggered(LT):水平触发只要有数据都会触发
epoll反应堆模型
原来
1 | socket、bind、listen -- epoll_create创建监听红黑树 -- 返回epfd -- epoll_ctl()向树上添加一个监听fd -- while(1) -- epoll_wait监听 -- 对应监听fd有事件产生 -- 返回监听满足数组 -- 判断返回数组元素 -- lfd满足 -- Accept -- cfd满足 -- read() -- 小写转大写 -- write回去 |
反应堆
1 | socket、bind、listen -- epoll_create创建监听红黑树 -- 返回epfd -- epoll_ctl()向树上添加一个监听fd -- while(1) -- epoll_wait监听 -- 对应监听fd有事件产生 -- 返回监听满足数组 -- 判断返回数组元素 -- lfd满足 -- Accept -- cfd满足 -- read() -- 小写转大写 -- cfd从监听红黑树上摘下 -- EPOLLOUT -- 回调函数 -- epoll_ctl() -- PEOLL_CTL_ADD 重新放到红黑树上监听写事件 -- epoll_ctl() -- EPOLL_CTL_ADD 重新放到红黑树上监听读事件 -- epoll_wait监听 |
UDP并发服务器
server
端
1 |
|
client
端
1 |
|