一、HTTP协议的作用原理
WWW是以Internet作为传输媒介的一个应用系统,WWW网上最基本的传输单位是Web网页。WWW的工作基于客户机/服务器计算模型,由Web 浏览器(客户机)和Web服务器(服务器)构成,两者之间采用超文本传送协议(HTTP)进行通信。HTTP协议是基于TCP/IP协议之上的协议,是Web浏览器和Web服务器之间的应用层协议,是通用的、无状态的、面向对象的协议。HTTP协议的作用原理包括四个步骤:
(1) 连接:Web浏览器和Web服务器建立连接,打开一个称为socket(套接字)的虚拟文档,此文档的建立标志着连接建立成功。
(2) 请求:Web浏览器通过socket向Web服务器提交请求。HTTP的请求一般是GET或POST命令(POST用于FORM参数的传递)。GET命令的格式为:
GET 路径/文档名 HTTP/1.0
文档名指出所访问的文档,HTTP/1.0指出Web浏览器使用的HTTP版本。
(3) 应答:Web浏览器提交请求后,通过HTTP协议传送给Web服务器。Web服务器接到后,进行事务处理,处理结果又通过HTTP传回给Web浏览器,从而在Web浏览器上显示出所请求的页面。
例:假设客户机和www.mycompany.com:8080/mydir/index.html建立了连接,就会发送GET命令:GET /mydir/index.html HTTP/1.0。主机名为www.mycompany.com的Web服务器从他的文档空间中搜索子目录mydir的文档index.html。假如找到该文档,Web服务器把该文档内容传送给相应的Web浏览器。
为了告知 Web浏览器传送内容的类型,Web服务器首先传送一些HTTP头信息,然后传送具体内容(即HTTP体信息),HTTP头信息和HTTP体信息之间用一个空行分开。
常用的HTTP头信息有:
① HTTP 1.0 200 OK
这是Web服务器应答的第一行,列出服务器正在运行的HTTP版本号和应答代码。代码“200 OK”表示请求完成。
② MIME_Version:1.0
他指示MIME类型的版本。
③ content_type:类型
这个头信息很重要,他指示HTTP体信息的MIME类型。如:content_type:text/html指示传送的数据是HTML文档。
④ content_length:长度值
他指示HTTP体信息的长度(字节)。
(4) 关闭连接:当应答结束后,Web浏览器和Web服务器必须断开,以确保其他Web浏览器能够和Web服务器建立连接。
二、Java实现Web服务器功能的程式设计
根据上述HTTP协议的作用原理,实现GET请求的Web服务器程式的方法如下:
(1) 创建ServerSocket类对象,监听端口8080。这是为了区别于HTTP的标准TCP/IP端口80而取的;
(2) 等待、接受客户机连接到端口8080,得到和客户机连接的socket;
(3) 创建和socket字相关联的输入流instream和输出流outstream;
(4) 从和socket关联的输入流instream中读取一行客户机提交的请求信息,请求信息的格式为:GET 路径/文档名 HTTP/1.0
(5) 从请求信息中获取请求类型。假如请求类型是GET,则从请求信息中获取所访问的HTML文档名。没有HTML文档名时,则以index.html作为文档名;
(6) 假如HTML文档存在,则打开HTML文档,把HTTP头信息和HTML文档内容通过socket传回给Web浏览器,然后关闭文档。否则发送错误信息给Web浏览器;
(7) 关闭和相应Web浏览器连接的socket字。