CATALOG

芯步5W壁挂音箱采用芯片级TTS方案——你只需推送文本,设备端直接合成语音,无需预先录音。目前官方文档中5W型号的播报命令格式为 {"play:gbk:16":"播报内容"},以下方案以此为基准展开。

1. 产品概述与对接原理

芯步智能语音壁挂音箱5W是一款支持WiFi联网的硬件播报设备。其核心特性在于芯片级的TTS能力——用户无需在云端预先合成音频文件,只需通过HTTP接口推送文本内容,音箱即可在设备端直接完成语音合成并实时播报

对接架构图:

业务系统(ERP/收银/OA) -> 芯步云API -> WiFi网络 -> 5W壁挂音箱 -> 语音播报

核心优势:

  • 低延迟:从接口调用到播报响应约80-300ms

  • 低成本:依赖WiFi,无短信/电话费用。

  • 高渗透:直接环境广播,无APP拦截风险。

2. 前期准备与配置

在进行开发对接前,需完成以下硬件及账号准备工作:

2.1 设备配网与激活

  1. 设备供电:使用DC 5-12V电源为音箱通电。

  2. 网络配置:该设备支持2.4GHz WiFi。通常需使用芯步提供的“物联网控制台”或相关配网工具,将设备连接至本地局域网。

  3. 获取设备ID:设备成功联网并注册至平台后,可在芯步工作台的“设备管理”列表中,查看到唯一的Device ID(如:820720)请记录此ID,后续接口调用需使用。

2.2 获取API凭证

在芯步控制台的“开发设置”中,获取以下两个关键参数

  • AppID:应用的唯一标识。

  • AppSecret:接口鉴权密钥(请妥善保管,切勿泄露)。

3. 接口鉴权与签名机制

芯步的开放接口采用双重MD5签名机制,以保障API调用的安全性。所有请求必须携带动态生成的签名。

3.1 签名算法规则

公式:sign = md5( md5(AppSecret) + ts )

参数说明:

  • AppSecret:控制台获取的密钥。

  • ts:当前Unix时间戳(秒级),如 1715328468

  • md5():32位小写MD5加密函数。

  • +:字符串拼接。

3.2 计算步骤示例

假设 AppSecret = "abc123",当前时间戳 ts = 1715328468

  1. 计算 md5(AppSecret) = md5("abc123") = e99a18c428cb38d5f260853678922e03

  2. 拼接字符串: e99a18c428cb38d5f260853678922e03 + 1715328468 = e99a18c428cb38d5f260853678922e031715328468

  3. 计算最终签名:sign = md5("e99a18c428cb38d5f260853678922e031715328468") = a1b2c3d4e5f678901234567890abcdef

4. 核心API对接:文本转语音播报

本方案最核心的部分是实现“云端文本 -> 音箱语音”的播报下发。

4.1 请求地址

POST https://api.thingboot.com/{AppId}/device/control/?sign={sign}&ts={ts}
  • Content-Typeapplication/json

  • Hostapi.thingboot.com

4.2 请求体(Body)参数

请求体需包含两个根节点:deviceorder

字段类型必填描述
deviceString / Int目标音箱的设备ID,如 820720。支持批量,逗号隔开如 "id1,id2"
orderJsonObject指令集。包含具体的播报内容和控制参数。

4.2.1 TTS播报指令详解

order 对象中,使用 play:gbk:16 作为Key,文本内容作为Value。

JSON示例:

注:gbk 编码确保了中文汉字的兼容性;16 通常指代特定音色或编码格式,按默认标准使用即可

4.3 增强播报控制(TTS参数调节)

为了提升用户体验,可在播报前或播报时调节音量和音色。将控制参数放在同一个 order 对象中(调用顺序通常由设备端逻辑决定,若无严格要求,同传即可)。

支持的控制命令:

命令Key功能描述取值范围示例(JSON片段)
volume设置音量0-9 (0静音,9最大)"volume": 7
voice设置音色0(女声) / 1(男声)"voice": 0
speed设置语速0-9 (正常为5)"speed": 5
tone设置语调0-9"tone": 5
ring/message播放提示音0-4 (内置5种)"ring": 1

组合指令请求示例:场景:设定音量为8,使用女声,高语速播报重要订单信息。

5. 代码开发示例

以下提供两种常见开发语言的对接示例,均基于上述签名算法和指令协议。

5.1 Python 3 实现

5.2 cURL (Shell) 实现

用于快速测试连通性。

6. 常见问题与排障指南

1. 音箱收到指令但无声音?(排查步骤)

  • 音量值:确认是否将volume设置为0或过低(设为7-9测试)。

  • 网络状态:检查音箱指示灯状态,确认WiFi连接正常(设备支持5组WiFi自动切换,但需保证连通)

  • 静音模式:确认设备硬件本地无音量旋钮调至最低。

2. 接口返回签名错误(Invalid Signature)

  • 检查时间戳ts是否为秒级(10位数字),不要误用毫秒级(13位)。

  • 确认MD5结果为32位小写格式。

  • 核对拼接顺序:md5(AppSecret) + ts,而非 AppSecret + ts

3. 中文文本播报乱码或无声

  • 必须使用 play:gbk:16 指令格式。GBK编码对中文兼容性最好,确保接口传输及JSON解析时未破坏中文字符

4. 设备如何联网?

  • 该产品采用WiFi直连方式,无需网关。需使用芯步官方提供的APP或配置工具,为其指定目标WiFi的SSID和密码。支持配置5组备用WiFi

7. 总结

通过对接芯步5W壁挂音箱的HTTP开放接口,开发者可以高效地将文本转语音能力集成到任何业务系统中。整个过程无需关注底层音频流处理,仅需遵循动态签名鉴权play:gbk:16 指令协议即可实现稳定、低延时的语音播报服务,广泛应用于订单播报、警报通知、叫号系统等场景。