Home / 知识库 / Wiki / 短信格式(sms)以及编码总结

短信格式(sms)以及编码总结

短信开发指通过串口 at 命令驱动短信猫进行短信发送和接收操作。

 

 

AT 命令 :AT命令是驱动短信设备的标准工业命令,除了业界的标准之外,每个厂商可能会对其进行扩展,不过一般来说,标准命令应该够用,我在这里用的是西门子 MC39i ,有专门的 AT 命令文档。

 

一、短信猫操作分为三种模式: Block、Pdu 和 Text

1、Block 模式基本已经被 Pdu 模式取代,没有具体研究。

2、Text 模式比较简单,但是支持的设备不是很全,而且不能实现中文。

AT + CGMF=1<CR>

AT + CGMS= “ 13612344321 ” ,129<CR> >Hello World!<^Z>

 

3、Pdu 模式

Pdu 编码主要包括两个主要的部分,一是 pdu 串的整体数据格式,分别因为发送信息串和接收信息串而有区别,二是 pdu 中文本部分的编码,分别因为字符集而不同。

我们也可以这样来理解这个 pdu 编码的格式, sms 相当于一个协议栈,最简单的协议栈:

 

根据 gsm03.40 规范, sms 协议包括以下几层:

1、 SM-AL :应用层。这个部分就是数据部分。

2、 SM-TL :传输层。我们可以清楚的看到这里描述了主要的短信内容,包括发送号码,接收号码,信息类型,编码,数据报长度等等,这也是我们编程主要要面对的问题。

3、 SM-RL :中继层。这个指的是短信在网关之间中继需要的协议。

4、 SM-LL:链路层。

从上述描述中我们可以清楚的看到,我们编程主要集中于传输层。

 

 

 

二、短信传送有三种编码: 7 位, 8 位, UniCode

 

1、英文 7 位编码

这是 gsm 的默认编码方式

由于这样的移位,我们可以看到我们能发的最多英文字符等于: 140*8/7 = 160 。

2、数据 8 位编码

8-bit 编码通常用于发送数据消息,比如图片和铃声等;

3、中文 pdu 编码

发送中文时,必须用 UCS2 ( utf-16 )进行编码,最多可以发 140/2 = 70 个汉字。

UniCode 编码转换也比较简单,以中文为例,一个中文字符是两个字节,直接对高位字节和低位字节进行十六进制转换就可以了。如“欢迎”, UniCode 编码是 6B22 8FCE ,这同时也就是转换的结果,如果发送的串中有英文字符,那么在前面补全 00 ,以保证一个字符对应两个字节。

 

4、PDU 串的用户信息 (TP-UD) 段最大容量是 140 字节,所以在这三种编码方式下,可以发送的短消息的最大字符数分别是 160 、 140 和 70 。这里,将一个英文字母、一个汉字和一个数据字节都视为一个字符。

 

三、地址编码

短信发送中都会涉及到短信地址的问题,他们的编码规则是一致的 , 简单来说就是 BCD8421码编码。

如: 08 91  6808501505F0 ,

08 :地址长度,(号码类型 + 号码长度) /2 的十六进制表示

91 :号码类型

683108501505F0 :号码,实际号码应为: +8613805515500 ,号码处理方法为 , 如果为 +86 开始 , 将 + 号去掉 , 然后判断是否为偶数 , 不是在末尾补 F, 然后将奇数位和偶数位互换

 

四、编码示例

1、发送信息的 PDU 串:

用手机写一条短信息,发送手机号码为 13605696031 ,信息内容为“ Hello World! ”。通过执行 AT + CMGL=2 可以读出此条信息。

 

AT+CMGL=2 {读未发短信息} +CMGL: 1,2,,24 {1表示信息个数,2表示未发信息,24表示信息总容量} 08 91 683108501505F0 11 00 0B 81 3106656930F1 0000FF 0B E8329BFD06DDDF723619 OK

 

下面分析这条信息:

08 短信息中心地址长度。(短信息中心号码类型 + 短信息中心号码长度 /2 的十六进制表示)
91 短信息中心号码类型, 91 是 TON/NPI 。 TON/NPI 遵守 International/E.164 标准,指在号码前需加‘+’号 ; 此外还可有其他数值,但 91 最常用。
683108501505F0 短信息中心号码,是所使用的服务中心地址。由于位置上略有处理,实际号码应为: 8613805515500( 字母 F 意指长度减 1), 这是作者所在地 GSM 短信息中心的号码。 ( 号码处理方法为 , 如果为 +86 开始 , 将 + 号去掉 , 然后判断是否为偶数 ,不是在末尾补F, 然后将奇数位和偶数位互换 )
11 文件头字节 (header byte, 是一种 bitmask) 。这里 11 指正常地发送短信息。
00 信息参考号。( TP-MR )
0D 被叫号码长度。被叫号码长度的十六进制表示。
81 被叫号码类型。
3106656930F1 被叫号码,也经过了移位处理,实际号码为 13605696031 。
00 协议标识 (TP-PID),是普通 GSM 类型,点到点方式
00 用户信息编码方式 (TP-DCS), 7-bit 编码( 08 : UCS2 编码)
FF 有效期 (TP-VP),短信的有效时间
0B 短信息长度
E8329BFD06DDDF723619 短信息内容“ Hello World! ”。

 

2、接收信息的 PDU 串

读取以上发送出来的短信,可以收到如下信息 ,

接受到来自 13600554267 的“欢迎”PDU 串为: 08 91 683108503705F0 04 0D 91 683106504562F7 00 08 30507080635400 046B228FCE。

对以上的 PDU 串分析如下表:

 

含义 说明
08 SMSC 地址信息的长度 共 8 个八位字节 ( 包括 91)
91 SMSC 地址格式 (TON/NPI) 用国际格式号码 ( 在前面加 ‘+’)
683108503705F 0 SMSC 地址 8613800573500 ,补 ‘F’ 凑成偶数个
04 基本参数 (TP-MTI/MMS/RP) 接收,无更多消息,有回复地址,如果为 00 ,就没有以下关于回复地址的三个段
0D 回复地址数字个数 共 13 个十进制数 ( 不包括 91 和 ‘F’)
91 回复地址格式 (TON/NPI) 用国际格式号码 ( 在前面加 ‘+’)
683106504562F 7 回复地址 (TP-RA) 8613600554267 ,补 ‘F’ 凑成偶数个
00 协议标识 (TP-PID) 是普通 GSM 类型,点到点方式
08 用户信息编码方式 (TP-DCS) UCS2 编码(即中文)
30507080635400 时间戳 (TP-SCTS) 2003-5-7 08:36:45 +8 时区
04 用户信息长度 (TP-UDL) 实际长度 4 个字节
6B228FCE 用户信息 (TP-UD) “ 欢迎 !”

 

五、接收短消息

一般有两种接收模式

1 .AT+CNMI=2,1,0,0,0 接受并存到 SIM 串口接收到以下信息: +CMTI:"SM",X AT+CMGR=X回车   (从X存储区读短消息) AT+CMGD=X回车   (从X存储区删除短消息) PDU状态: at+cmgf=0 OK +CMTI: "SM",1 at+cmgr=1 +CMGR: 0,,24 0891683108501705 F0240D91683157805300F50000502082000281000462F11804 OK 文本状态: +CMGR: "REC READ","+86 13750835005",,"05/02/28,0:20:18+00" bbc    OK 2 .AT+CNMI=2,2,0,0,0 接受并直接到串口 串口接受到以下信息: +CMT: "+8613501154105",,"01/09/13,11:04:09+32" AAA   

 

 

附录:关于PDU模式发送短信:

 

      第一,对模块写入 AT+CMGF=0<回车>   的AT命令(<回车> 要用 /r 来实现),之后应该得到一个 OK 响应,才能继续进行下一步;

      第二,对模块写入 AT+CMGS=<length><回车>   的AT命令(其中 <length> 是一个数字,该数字是代表了PDU串中某一部分的长度,这一部分就是指除了SMSC地址之外的那一部分),之后应该得到一个 /r/n> /r/n   响应(特别要注意:/r是回车,/n是换行,>是一个大于号,>后面还有一个空格!),才能继续进行下一步;

      第三,可以开始写入要发送的内容了。这一部分只是PDU串中的一部分,并不是完整的PDU串(如前所述,去掉了SMSC地址那一部分),这一部分要以 Ctrl+Z 结尾,但是我们要知道,在字符串中要带上 Ctrl+Z 的话,必须是用ACSII码。Ctrl+Z的ASCII码是16进制的 1A ,所以你可以在你的字符串后面用strcat函数附加上 "/x1A " 来实现。

这样之后,如果发送成功,你就会收到GSM模块的一个发送成功的响应,形如:

          +CMGS: 246

 

          OK

      如果只有一个“OK”响应,没有类似于“+CMGS: 246”的部分,则并不能发送成功!所以,当你只收到一个 OK 响应的时候,那肯定是哪里出错了。