本文转载自 xyang0917
SMTP协议
SMTP
(Simple Mail Transfer Protocol,简单邮件传输协议)定义了邮件客户端与SMTP
服务器之间,以及两台SMTP
服务器之间发送邮件的通信规则 。
SMTP
协议属于TCP/IP
协议族,通信双方采用一问一答的命令/响应形式进行对话,且定了对话的规则和所有命令/响应的语法格式。
SMTP
协议中一共定了18条命令,发送一封电子邮件的过程通常只需要其中的6条命令即可完成发送邮件的功能,下表按照发送命令的先后顺序列出了这6条命令,并描述了其语法及功能说明,其中,<SP>
代表空格,<CRLF>
代表回车和换行。
命令格式 | 说明 |
---|---|
ehlo<SP><domain><CRLF> | ehlo 命令是SMTP 邮件发送程序与SMTP 邮件接收程序建立连接后必须发送的第一条SMTP 命令,参数<domain> 表示SMTP 邮件发送者的主机名。ehlo 命令用于替代传统SMTP 协议中的helo 命令 |
auth<SP><para><CRLF> | 如果SMTP 邮件接收程序需要SMTP 邮件发送程序进行认证时,它会向SMTP 邮件发送程序提示它所采用的认证方式,SMTP 邮件发送程序接着应该使用这个命令回应SMTP 邮件接收程序,参数<para> 表示回应的认证方式,通常是SMTP 邮件接收程序先前提示的认证方式 |
mail<SP>From:<reverse-path><CRLF> | 此命令用于指定邮件发送者的邮箱地址,参数<reverse-path> 表示发件人的邮箱地址 |
rcpt<SP>To:<forword-path><CRLF> | 此命令用于指定邮件接收者的邮箱地址,参数<forward-path> 表示接收者的邮箱地址。如果邮件要发送给多个接收者,那么应使用多条rcpt<SP>To 命令来分别指定每一个接收者的邮箱地址 |
data<CRLF> | 用于表示SMTP 邮件发送程序准备开始输入邮件内容,在这个命令后面发送的所有数据都将被当做邮件内容,直至遇到<CRLF>.<CRLF> 标志符,则表示邮件内容结束 |
quit<CRLF> | 表示要结束邮件发送过程,SMTP 邮件接收程序接收到此命令后,将关闭与SMTP 邮件发送程序的网络连接 |
其它SMTP
命令的语法及功能描述可以参考RFC821和RFC1869文档
对于SMTP
邮件发送程序发送的每一条命令,SMTP
邮件接收程序都将回应一条响应信息。每条响应信息都以一个响应状态开头,如:250 OK。
响应状态用于表示SMTP
服务器对请求命令的处理结果和状态,它是一个三位的十进制数。响应状态码的最高位数字代表了不同的分类,当其为 2 时表示命令执行成功;为5时表示命令执行失败;为3时表示命令没有完成。
关于响应状态码所代表的具体含义,可以参考RFC821文档。
SMTP
协议是一个基于TCP/IP
的应用层协议,SMTP服务器默认的网络监听端口号为25,下面将通过telnet
程序,手工发送SMTP
命令来发送一封电子邮件,从而理解SMTP
协议的交互过程。
模拟环境说明:连接sina的SMTP
服务器,给163的SMTP
服务器发送一封邮件,操作过程如下图所示:
说明:
- 连接
SMTP
服务器的用户名和密码需要经过base64
编码 - 红色箭头指向的文字表示我在
telnet
程序中输入的命令,以2、3、5数字开头的行表示SMTP
服务器对命令的响应。通过上表中的6个SMTP
命令就完成了一封简单电子邮件的发送。当然一封复杂的邮件不只包含这些信息,还应包括主题、发送日期、抄送和附件等消息头
POP3协议
邮件服务提供商专门为每个用户申请的电子邮箱提供了专门的邮件存储空间,SMTP
服务器将接收到的电子邮件保存到相应用户的电子邮箱中。
用户要从邮件服务提供商提供的电子邮箱中获取自己的电子邮件,就需要通过邮件服务提供商的POP3邮件服务器来帮助完成。
POP3(Post Office Protocol 邮局协议的第三版本)协议定义了邮件客户端程序与
POP3
服务器进行通信的具体规则和细节
POP3
协议在RFC1939文档中定义,它采用的网络监听端口号默认为110。POP3
协议共定义了 12 条POP3
命令,邮件客户端程序通过这些命令来检索和获取用户电子邮箱中的邮件信息。
下表列举出了这12条POP3命令及其说明,其中,
POP3命令格式 | 说明 |
---|---|
user<SP>username<CRLF> | user 命令是客户端程序与邮件服务器建立连接后通常发送的第一条命令,参数 username 表示收件人的帐户名称 |
pass<SP>password<CRLF> | pass 命令是在user 命令成功通过后,客户端程序接着发送的命令,它用于传递帐户的密码,参数 password 表示帐户的密码 |
apop<SP>name,digest<CRLF> | apop 命令用于替代user 和pass 命令,它以MD5 数字摘要的形式向邮件服务器提交帐户密码 |
stat<CRLF> | stat 命令用于查询邮箱中的统计信息,例如:邮箱中的邮件数量和邮件占用的字节大小等 |
uidl<SP>msg#<CRLF> | uidl 命令用于查询某封邮件的唯一标志符,参数msg# 表示邮件的序号,是一个从1开始编号的数字 |
list<SP>[MSG#]<CRLF> | list 命令用于列出邮箱中的邮件信息,参数 msg#是一个可选参数,表示邮件的序号。当不指定参数时,POP3服务器列出邮箱中所有的邮件信息;当指定参数msg#时,POP3服务器只返回序号对应的邮件信息 |
retr<SP>msg#<CRLF> | retr 命令用于获取某封邮件的内容,参数 msg# 表示邮件的序号 |
dele<SP>msg#<CRLF> | dele 命令用于在某封邮件上设置删除标记,参数msg# 表示邮件的序号。服务器执行dele 命令时,只是为邮件设置了删除标记,并没有真正把邮件删除掉,只有客户端发出quit 命令后,服务器才会真正删除所有设置了删除标记的邮件 |
rest<CRLF> | rest 命令用于清除所有邮件的删除标记 |
top<SP>msg#<SP>n<CRLF> | top 命令用于获取某封邮件的邮件头和邮件体中的前n行内容,参数msg# 表示邮件的序号,参数n表示要返回邮件的前几行内容。使用这条命令以提高 Web Mail系统(通过Web站点上收发邮件)中的邮件列表显示的处理效率,因为这种情况下不需要获取每封邮件的完整内容,而是仅仅需要获取每封邮件的邮件头信息 |
noop<CRLF> | noop 命令用于检测客户端与服务器的连接情况 |
quit<CRLF> | quit 命令表示要结束邮件接收过程,服务器接收到此命令后,将删除所有设置了删除标记的邮件,并关闭与客户端程序的网络连接 |
对于POP3客户程序发送的每一条POP3命令,POP3服务器都将回应一些响应信息。响应信息由一行或多行文本信息组成,其中的第一行始终以“+OK” 或 “-ERR” 开头,它们分别表示当前命令执行成功或执行失败。
下面通过telnet程序连接163的POP3服务器,来分析邮件的接收过程。操作步聚见下图:
交互过程:
- 首先用
tlenet
程序连接到163的pop3邮箱,telnet pop3.163.com 110
。 - 执行
user
命令指定用户名,user xyang0917
。 - 执行
pass
命令输入密码,pass 123456abc
。验证成功后,提示邮箱中有一封邮件,占1822字节邮箱空间。 - 执行
stat
命令统计邮箱中的信息,结果显示邮箱中有一封邮件,占1822字节的邮箱空间。 - 执行
list
命令列出邮箱中的所有邮件,结果显示1 1822,1代表邮件编号,1822代表邮件的大小,如果有多封邮件,编号从1开始向上累加依次列出来。 - 执行
retr 1
命令查看第一封邮件的内容。 - 执行
dele 1
命令将第一封邮件设置删除标志。 - 执行
rset
命令重置所有邮件的删除标志。 - 执行
quit
命令退出邮件接收程序,服务器接收到客户端发送的quit
命令后,将删除所有设置了删除标记的邮件,并断开与客户端的网络连接。并且Telnet程序自动结束运行,退回到Window命令行窗口状态。
IMAP协议
IMAP(Internet Message Access Protocol)协议是对POP3协议的一种扩展,定了邮件客户端软件与邮件服务器的通信规则。IMAP协议在RFC2060文档中定义,目前使用的是第4个版本,所以也称为IMAP4。
IMAP
协议相对于POP3
协议而言,它定了更为强大的邮件接收功能,主要体现在以下一些方面:
IMAP
具有摘要浏览功能,可以让用户在读完所有邮件的主题、发件人、大小等信息后,再由用户做出是否下载或直接在服务器上删除的决定。IMAP
可以让用户有选择性地下载邮件附件。例如一封邮件包含3个附件,如果用户确定其中只有2个附件对自已有用,就可只下载这2个附件,而不必下载整封邮件,从而节省了下载时间。IMAP
可以让用户在邮件服务器上创建自己的邮件夹,分类保存各个邮件。
MIME协议
早期人们在使用电子邮件时,都是使用普通文本内容的电子邮件内容进行交流,由于互联网的迅猛发展,人们已不满足电子邮件仅仅是用来交换文本信息,而希望使用电子邮件来交换更为丰富多彩的多媒体信息,例如,在邮件中嵌入图片、声音、动画和附件等二进制数据。
但在以往的邮件发送协议RFC822文档中定义,只能发送文本信息,无法发送非文本的邮件,针对这个问题,人们后来专门为此定义了MIME(Multipurpose Internet Mail Extension,多用途Internet邮件扩展)协议。
MIME
协议用于定义复杂的邮件体格式,它可以表达多段平行的文本内容和非文本的邮件内容,例如,在邮件体中内嵌的图像数据和邮件附件等。另外,MIME
协议的数据格式也可以避免邮件内容在传输过程发生信息丢失。
对于表示某个具体资源的MIME消息,它的消息头中需要指定资源的数据类型;对于MIME
组合消息,它的消息中需要指定组合关系。具体资源的数据类型和组合消息的组合关系,都是通过消息头中的Content-Type
头字段来指定的。Content-Type
字段中的内容以“主类型/子类型”的形式出现,主类型有text、image、audio、video、application、multipart、message
等,分别表示文本、图片、音频、视频、应用程序、组合结构、消息等。
每个主类型下面都有多个子类型,例如text
类型包含plain、html、xml、css
等子类型。multipart
主类型用于表示MIME
组合消息,它是MIME
协议中最重要的一种类型。
一封MIME
邮件中的MIME
消息可以有三种组合关系:混合、关联、选择,它们对应MIME类型如下:
multipart/mixed
表示消息体中的内容是混和组合类型,内容可以是文本、声音和附件等不同邮件内容的混和体。比如一封邮件中即包含附件,邮件内容还引用内嵌的图片或附件资源,这种类型邮件的MIME类型就必须定义为multipart/mixed。multipart/related
表示消息体中的内容是关联(依赖)组合类型。比如:邮件内容有一个img标签,这个标签的src属性指向的是邮件内部的一个图片资源,所以这封邮件MIME类型就应该定义为multipart/related
multipart/alternative
表示消息体中的内容是选择组合类型,例如一封邮件的邮件正文同时采用HTML格式和普通文本格式进行表达时,就可以将它们嵌套在一个multipart/alterntive
类型的组合消息中。这种做法的好处在于如果邮件阅读程序不支持HTML格式时,可以采用其中的文本格式进行替代
一封最复杂的电子邮件的基本情况为:含有邮件正文和邮件附件,邮件正文可以同时使用HTML格式和普通文本格式表示,并且HTML格式的正文中又引用了其它的内嵌资源。对于这种最复杂的电子邮件,可以采用下图所示的MIME消息结构进行描述:
从上图中可以看出
- 如果在邮件中要添加附件,就必须将整封邮件的MIME类型定义为
multipart/mixed
; - 如果要在HTML格式的正文中引用内嵌资源,那就要定义
multipart/related
类型的MIME消息; - 如果普通文本内容与HTML文本内容共存,那就要定义
multipart/alternative
类型的MIME消息。
注意:如果整封邮件中只有普通文本内容与HTML文本内容,那么整封邮件的MIME类型则应定义为multipart/alternative
;如果整封邮件中包含有HTML文本内容和内嵌资源,但不包含附件,那么整封邮件的MIME类型则应该定义为multipart/related
。