TCP/IP和网络编程
本章的主要内容是TCP/IP和网络编程,主要有两部分,一是TCP/IP协议及其应用,还有就是Web和CGI编程。
TCP/IP协议包括TCP/IP栈、IP地址、主机名、DNS、IP数据包和路由器,基于TCP/IP网络中的TCP和UDP协议的套接字服务器编程。
Web和CGI编程主要是HTTP编程模型、Web页面和Web浏览器,基于Linux的HTTPD服务器所支持的用户Web界面、PHP服务以及CGI建立的动态Web页面。
TCP/IP协议
TCP/IP协议是互联网的基础,其中TCP是传输控制协议,IP是互联网协议。目前主流的IP是IPv4和IPv6,分别是32位地址和128位地址。
IP
IP协议是在IP主机之间收发数据包时所用的协议,IP协议是默认无差错传输的,所以它并不可靠。
IP数据包是IP协议下的传输基本单位,它由IP头、发送方地址、接收方地址以及数据组成。每个IP数据包大小不超过64KB,IP头包含了有关数据包的信息,如数据包长、使用协议等,一个IP包头的格式基本如下:
路由器、UDP和TCP
路由器路由器(router)是不同IP主机间通信的中继设备,数据包经过路由器使用更加合理的路径传输到目的地址,路由器之间也可互为中继。
UDP 用户数据报协议,即UDP,在IP上运行,用来收发数据报。与IP类似,UDP也是不保障传输的可靠性的,UDP的一大特点就是它的快速高效,一些不追求传输稳定,但是要求速度的操作就需要UDP的参与,比如发送邮件的UDPS和ping操作。 ping主机或IP地址就是通过向目标主机发送带时间戳的UDP包的应用程序,目标主机接受这个UDP包后就将它发回给发送者,发送者通过计算和显示往返传输时间。
TCP 传输控制协议,即TCP,是一种面向连接的协议,用于收发数据流。TCP可以在IP上运行,但TCP保证了数据的可靠传输。TCP协议多用于电话连接。
端口编号 不同主机上的应用程序(进程)可以同时使用TCP协议和UDP协议,每个应用程序都有由三个部分组成的唯一标识。应用标识 = (主机IP , 协议 , 端口号)
协议是TCP或UDP,端口号是分配给应用程序的唯一无符号短整数。UDP和TCP都必须有一个唯一的指定端口号。下图是传输层中使用TCP的一些程序及其默认端口号。
网络编程与套接字
网络编程 网络编程需要一些网络部件,在Ubuntu Linux系统中就可能需要适用于Http和CGI编程的Apache服务器。大多数的网络编程任务都是基于服务器-客户端的模型的。在这个模型中,客户端首先从服务器主机上运行服务进程。然后在客户端主机上运行客户端。 在UDP中,服务器等待来自客户端的数据报,处理数据报并生成对客户机的响应。 在TCP中,服务器先建立一个于=与客户端的虚拟电路(虚电路),再在服务器和客户端进行数据报传输。
套接字编程 在网络编程中,TCP/IP的用户界面是通过一系列C语言库函数和系统调用来实现的,这些函数和系统调用统称为套接字API。为了使用套接字API,我们需要套接字地址结构,它用于标识服务器和客户机。netdb.h和sys/socket.h中有套接字地址结构的定义。套接字地址数据结构: struct socketddr_in { sa_family_t sin_family; //TCP/IP中的sin_family始终是AF_INET in_port_t sin_port; //按网络字节顺序排列的端口号 struct in_addr sin_addr; //按网络字节顺序排列的主机IP地址 }; struct in_addr { uint32_t s_addr; //按网络字节顺序排列的主机IP地址 } 服务器需要创建一个套接字,并将其与包含服务器IP地址和端口号的套接字地址绑定。它(指服务器套接字)可以使用一个固定端口号,或是操作系统内核所选择的端口号(当sin_port为0时)。 而为了与服务器通信,客户端也需要一个套接字。UDP套接字可以直接绑定到服务器地址,如果一个客户端套接字没有绑定到任何特定服务器,它就必须在后续的sendto()/recvfrom()调用中提供一个包含服务器IP和端口号的套接字地址。
socket系统调用
int套接字 基本格式是int (int 域,int 类型,int 协议)
,实例:用于收发UDP数据报的套接字: int udp_sock = socket(AF_INET , SOCKET_DGRAM , 0);用来收发数据流的面向连接的TCP套接字: int tcp_sock = socket(AF_INET , SOCKET_STREAM , 0);
int bind() 基本格式是int bind(int sockfd , struct sockaddr *addr , socklen_t addrlen);
bind()系统调用将addr指定的地址分配给文件描述符sockfd所引向的套接字,addrlen指定addr所指向地址结构的大小(以字节为单位)。对于用来联系其他UDP服务器主机的UDP套接字,必须绑定客户机地址,允许服务器发出应答。 对于用于接受客户端连接的TCP套接字,必须先将它绑定到服务器主机地址。
UDP套接字 UDP套接字使用scndto()/recvfrom()来发送/接收数据报。格式如下: ssize_t sendto(int sockfd , const void *buf , size_t len , int flags , const struct sockaddr *dest_addr , socklen_t addrlen); ssize_t recvfrom(int sockfd , void *buf , size_t len , itn flags , struct sockaddr *src_addr , socklen_t *addr); 其中sento()将缓冲区中的len字节数据发送到dest_addr标识的目标主机,该目标主机包含主机IP和端口号。recvfrom()从客户主机接收数据。除了数据以外,它还用客户机的IP和端口号填充src_addr,从而允许服务器将应答发送回客户机。
TCP套接字 建立起与服务器的连接后,TCP服务器使用listen()和accept()来接受来自客户机的连接: int listen(int sockfd , int backlog); listen()将sockfd引用的套接字标记为将用于接收连入连接的套接字。backlog参数定义了等待连接的最大队列长度。
int accept(int sockfd , struct sockaddr *addr , socklen_t *adderlen);
accept()与基于连接的套接字一起使用。它提取等待队列上的第一个连接请求用来监听套接字sockfd,创建一个新的套接字,并返回一个引用该套接字的新文件描述符,与客户机主机连接。在执行accept()时,TCP服务器阻塞,直到客户机通过connect()建立连接。
connect()的基本格式:
int connect(int sockfd, const struct sockaddr *addr, socklen t addrlen);
connect()系统调用将文件描述符sockfd引用的套接字连接到addr指定的地址,addrlen参数指定addr的大小。addr中的地址格式由套接字sockfd的地址空间决定。
若套接字sockfd是UDP类型,addr就是发送数据报的默认地址,同时也是接受数据报的唯一地址。
若为TCP类型,connect()就会尝试连接到绑定到addr指定地址的套接字。
send()/read()以及recv()/write() 建立连接后,两个TCP主机都可以使用send()/write()发送数据,并使用recv()/read()接受数据。它们的区别在于send()和recv()中的flag参数的不同,通常情况下的flag都被设为0。(那么什么情况下会设置为其他数呢?)
四种调用的基本格式: ssize_t send(int sockfd , const void *buf , size_t len , int flags); ssize_t write(int sockfd , const void *buf , size_t len); ssize_t recv(int socket , void *buf , size_t len , int flags); ssize_t read(int sockfd , void *buf , size_t len);