单片机和4G模块通信总结(EC20)

        第一代数据汇集单元基本开发完毕,运行也有一年了,做下总结吧,希望能够给大家提供帮助。

4G模块选择的是移远的EC20,通过串口和单片机交互。其实是什么型号并不重要,大体的流程

和注意事项基本都一样。

相关文章:

 《AT指令的一种解析想法》

 《编程学习笔记之消息地图》

《添加MQTT思路及JSON包》 

一、硬件

首先4G模块本身功耗很高,尤其是4G模块刚上电开机瞬间,会有一个大的电流脉冲,这里我们

选择的芯片本身参数符合指标,但是实际使用时候,发现有一些模块损坏问题,现场反馈是后台

没有数据,查问题发现是MCU不断在重启,在查发现是4G模块重启导致MCU复位,再分析是4G

电源貌似处于一种震荡状态。查看正常4G电源启动波形,发现有一个电流脉冲,电压有个起伏,

硬件工程师建议是换取更大电流的IC芯片,我是在软件上把每次连接关闭4G电源流程去掉,减少

4G电源冲击,现场设备升级软件测试半年,没有发现问题

二、软件

4G模块本身的AT指令不复杂,我采用消息地图(请看AT指令的一种解析想法)方案。

消息地图:

const static msg_t c_tMSGMap[]  =  {
    {"ATE0\r\n",                lte_4g_protocol_default_send},
    {"ATE0\r\n",                lte_4g_protocol_default_send},
    {"ATE0\r\n",                lte_4g_protocol_default_send},
    {"ATE0\r\n",                lte_4g_protocol_default_send},
    {"AT+CPIN?\r\n",            lte_4g_protocol_CPIN},
    {"AT+CSQ\r\n",              lte_4g_protocol_CSQ},
    {"AT+CREG?\r\n",            lte_4g_protocol_CREG},
    {"AT+CGREG?\r\n",           lte_4g_protocol_CGREG},
    {"AT$MYNETCON",             lte_4g_protocol_MYNETCON},          //设置APN
    {"AT$MYNETCON1",            lte_4g_protocol_MYNETCON1},         //设置用户名和密码
    {"AT$MYNETACT=0,0\r\n",     lte_4g_protocol_MYNETACT},          //去激活
    {"AT$MYNETACT=0,1\r\n",     lte_4g_protocol_default_send},      //激活
    {"AT$MYNETACT?\r\n",        lte_4g_protocol_default_send},      //是否激活成功
    {"AT$MYNETSRV",             lte_4g_protocol_MYNETSRV},          //配置服务器IP和端口号
    {"AT$MYNETCLOSE=0\r\n",     lte_4g_protocol_MYNETCLOSE},        //关闭socket
    {"AT$MYNETOPEN=0\r\n",      lte_4g_protocol_default_send},      //创建socket
};

2.1AT执行逻辑

每个AT指令执行成功,则继续下一条,如果本条AT指令执行失败,则重复执行,最多执行10次,

如果10全部失败,则本轮结束,从第一条指令开始执行,如果5轮全部失败,则重新执行4G模块

硬件初始化流程(电源复位(可跳过),4G模块复位,开机),然后继续执行AT指令;

创建完成socket,则整个流程结束。

2.2收发逻辑

由于4G模块有收和发流程,在进行接收流程时候不能进行发送流程;在进行发送流程时候,不能

进行接收流程。否则4G模块不能收和发(实际测试发现此现象)。

2.2.1发送流程

历程:(发送流程不可打断)

MCU->4G:AT$MYNETWRITE=0,10 //向0 号Socket 发送10 字节数据

4G->MCU:$MYNETWRITE: 0,10

MCU->4G:123456789

4G->MCU:OK //数据发送成功

注意:发送数据为ASCII码,HEX变成ASCII,长度要增加一倍。

2.2.2接收流程

数据到来,主动上报模式:(接收流程不可打断)

4G->MCU:$MYURCREAD: 0

MCU->4G:AT$MYNETREAD=0,1460

4G->MCU:$MYNETREAD: 0,10 //有10 字节数据
                 1234567890
                  OK  //接收数据成功

注意:接收数据为ASCII码,ASCII变成HEX,长度要减少一倍。

三、问题

1、现象4G模块不断重启

分析原因,是MCU主动发起4G重启流程,在分析,发现服务器不回复数据,导致登入服务器失败,

但是测试服务器,发现服务器没有问题。把4G断电,重新复现现象,分析Log发现,4G模块在登入

服务器后,一直再往服务器发送数据(下面传感器数据量太频繁),而服务器发给4G模块后,4G

模块并没有报告$MYURCREAD(我自己做的定时read任务也没有起作用,由于一直在发送忙),

导致4G模块接收缓存溢出(模块复位也不起作用),解决方案如下:

(1)和服务器通信改问答模式;

(2)强制定时读取4G模块数据(注意数据溢出,如果处理不好,很大概率会导致4G模块接收溢出)。

2、现场传感器全部掉线

运行了三天三夜后,传感器全部掉线。分析LOG,发现4G在不断重启,基站在不停登入服务器,再分析发现基站发送登入帧后,服务器也回复确认帧,但是基站没有解析出来,分析服务器下发报文,也是正确报文。怀疑原因:

(1)栈乱了,为了增加接收缓存,我调小了栈区;

(2)SRAM乱了,里面用的链表,有BUG;

(3)接收机制有BUG,当接收某个字节出错,导致长度出错,一直处于“死等”本帧收完状态,导致不解析。

从LOG分析和代码分析,第三点可能性更大,增加接收数据后,5S没有收到完成帧,则清除buffer机制,测试下看看,有结果再发生来。

程序已经跑了一周了,没有出现这个现象,基本确定就是原因(3)引起的,当时写逻辑代码时候特别注释了这个问题,只是后面测试没有出现。

3、客户要求域名登入

现场客户提出域名登入,不提供IP,查看AT手册没有发现域名相关指令,但是手册里面有如下说明:

 其中提到Address需要支持域名,于是进行如下测试:

结果:

4、增加HmacSHA256和 BASE64算法

客户那边是MQTT协议,本来是配置用户名和密码直接登入,考虑到安全问题,需要增加HmacSHA256和 BASE64和算法。具体算法是怎么实现的和算法原理,这里不做介绍,只说应用。

HmacSHA256算法下载地址:SHA256和HMAC-SHA256的C语言实现_HMAC-SHA256C-C文档类资源-CSDN下载

BASE64算法下载地址:C语言实现Base64编码/解码_开挂的熊猫-CSDN博客

经过验证,这两个算法都是没有问题的,这里说下使用注意地方:

1)HmacSHA256算法生成的是32个字节的HEX进制数,如果需要64字节的字符串,需要自己转换下,和算法本身无关,仅仅是生成的信息摘要格式转换;

2)BASE64算法的信息输入是什么格式,需要双方协议,和算法无关;

3)BASE64算法在提供的连接中使用的是malloc动态分配内存,这里根据自己实际使用环境修改,我是自己传入了一个数组地址;

4)BASE64算法在提供的连接中默认输入的是字符串格式,如果是HEX格式,需要做简单的修改。

5、STM32F407的CCRAM

以前开发过程中遇到一个奇怪的问题,就是把缓存开辟大一点lwip不正常,但是编译不报错,其他逻辑功能也正常,一直没有分析原因,今天有时间了,抽空来看看怎么回事。

整个RAM大小是192K,我的RAM才125.88kB,lwip就不正常,现象是能ping通,但是TCP连接失败,如果把缓存调小到110.77kB是正常的。

首先看407内存分布:

0x2000 0000  有128K   所有外设、MCU都可以用

0x1000 0000  有64K      只有MCU能用,外设不能用

我的设想是在上层开辟为各个通信信道开辟大缓存,放到CCRAM里面,做收发缓存,协议解析等;然后和外设打交道时候进行内存拷贝,为外设单独开辟一个接受和发送数组。

我的应用层缓存是这么定义的:

static uint8_t            s_chServiceProtocolMemoryBuffer[7][(sizeof(service_protocol_user_memory_t)+sizeof(my_list_memory_t))*(SERVICE_PROTOCOL_MEMORY_BUFFER_SIZE)] __attribute__((section("RW_IRAM2")));

查看map文件:

 看到没有,被定义到了IRAM1区,但是我定义的一些小数组,确实定义到了IRAM2区:

 说明我的语法没有错误,于是我把数组拆分了,结果如下:

 这次被定义到了IRAM2区,测试程序,LWIP能够正常建立TCP了。

我做了实验,把缓存定义超多64K,并没有报错,但是部分空间被定义在了IRAM1区;所以我猜,当IRAM2区空间不够,或者没有连续的空间,或者定义的单个数组过大,都会被定义到IRAM1区。

PS:即使是定义到了IRAM1区,但是我看了缓存,也是够的,但是lwip不能建立TCP连接,还是不清楚什么原因,有时间再查下。

版权声明:本文为CSDN博主「无痕幽雨」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/wuhenyouyuyouyu/article/details/116779258

生成海报
点赞 0

无痕幽雨

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

STM32C8T6+LORA(SX1278)

LoRa通信系统 从毕设开始搭建了一个简单的LORA通信系统(两块STM32C8T6最小单片机系统,两块正点原子的loRa,一块温湿度传感器)构建了一个简单的loRa通信系统作为入门。之