如何对接30W 远程控制 TTS 语音壁挂音箱以实现语音通知推送_解决方案

CATALOG

芯步的这款30W壁挂音箱通过HTTP接口开放语音播报能力，对接流程其实很简单——核心就是调用一个API，把要播报的文字发过去。下面我按“准备-对接-调优”的顺序梳理一遍。

在开始写代码之前，我们需要先拿到一些基本信息，就像开门需要钥匙一样。

硬件准备：确保你的“智能语音壁挂音箱”已经通电，并且通过WiFi（2.4G）连上了网络。30W的音量在车间、仓库或者大办公室里，保证大家都能听清楚。
获取API密钥：登录芯步的控制台后台。
- AppID：你的应用唯一标识。
- AppSecret：你的应用密钥，这个要注意保密，不要写在网页前端代码里。

小提示：芯步的接口采用的是设备端合成TTS，也就是你发给它文字，音箱自己把文字转成语音。这种方式的响应速度很快，通常在80-120毫秒左右，基本感觉不到延迟。

这个过程其实就是一个 HTTP POST 请求 的事儿。

我们需要向这个地址发送数据：

http(s)://api.thingboot.com/{你的AppId}/device/control/?sign={你的签名}&ts={当前时间戳}

签名算法（Sign）生成规则：

简单来说公式就是：sign = md5( md5(AppSecret) + ts )也就是：先把你的AppSecret进行MD5加密，得到的结果后面拼接上时间戳(ts)，再把拼接后的字符串整体做一次MD5加密。

这是最关键的部分，决定了音箱说什么。我们需要传一个JSON格式的数据：

参数详解：

device：这一串字符就是音箱的ID。如果你买了多个音箱，这里可以传多个ID，用英文逗号隔开，就能实现一对多的广播了。
order：这是命令对象。
- "play:gbk:16" 是播报命令，后面跟着的字符串就是你要播报的文本内容。为了兼容中文，我们通常使用 gbk 编码。

为了让大家更有感觉，这里提供一个最简单的Python示例，你可以把它集成到你的业务系统（比如订单系统、监控大屏）里：

光让他干巴巴念字肯定不够，有时候我们需要加个警告声，或者让它念金额、电话号码，芯步的接口都考虑到了。

在播报重要警报（比如火警、设备故障）前，可以先触发一个“叮叮叮”的声音。把 order 稍微改一下，支持多条命令：

如果你觉得声音太小，或者念得太快，可以在播报前设置一下：

默认情况下，它念“123”会念成“一百二十三”。如果你需要念电话号码或者金额，最好在文本里做一下标记，或者分段发送，目前的接口对于纯数字串的读法可能需要你在文本里自己加逗号分割，或者利用接口内置的读法标记（具体可参考官方文档中的数字读法规则）。

提示“Sign Invalid”？
- 检查一下你的时间戳ts是不是服务器当前时间（注意是秒数，不是毫秒），服务器时间与标准时间相差太大会校验失败。
- 再次确认 md5 的顺序，是先加密Secret，再拼接ts，再整体加密，不要搞反了。
音箱没反应？
- 确认音箱WiFi指示灯是否正常（是否连上了路由器的2.4G频段）。
- 检查一下 device 的ID是否正确，不要有多余的空格。
中文乱码？
- 确保你的 order 里的key是 "play:gbk:16" ，因为官方示例中指定了GBK编码来处理中文。如果你的开发环境是UTF-8，需要转码，或者直接发英文测试看看是不是编码问题。