CATALOG

芯步智能语音喇叭的开放接口基于HTTP协议,对接门槛很低——你只需要能发POST请求,无需处理底层的音频编码或长连接维护。下面从接口原理、签名计算到实际代码,给出完整的对接方案。

1. 解决概述

在许多物联网应用场景中,仅靠手机推送或短信通知,往往存在信息干扰或送达延迟的问题。利用芯步的智能迷你语音喇叭,开发者可以通过其开放的HTTP接口,将业务系统中的关键状态(如设备告警、订单提醒、系统重启通知)实时转化为语音播报。

本方案的目标是指导开发者如何通过编程方式,调用该硬件接口,实现“业务触发 -> 接口调用 -> 喇叭发声” 的闭环反馈。

2. 对接原理

智能迷你语音喇叭(如Mini型号或第三代喇叭)采用端云一体的设计。设备通过Wi-Fi连接互联网,并保持与芯步平台的长期连接。用户无需拥有公网IP或维护复杂的TCP长连接,只需要通过携带签名认证的HTTP请求,即可控制设备。

核心流程如下:

  1. 设备端: 喇叭上电后自动联网,订阅平台针对该设备的指令队列。

  2. 应用端: 业务系统(如OA、ERP、APP后端)触发特定事件(如“温度过高”)。

  3. 接口调用: 业务系统向芯步API发起HTTP POST请求,包含设备ID、播报文本、签名验证。

  4. 语音输出: 平台将指令推送给设备,设备端芯片级的TTS将文本合成为语音并播放

3. 接口对接详解

由于芯步的设备接口高度统一,以下步骤适用于智能语音喇叭Mini、智能语音喇叭3及音柱等全系产品。

3.1 准备工作

在开始编码前,请在芯步控制台获取以下必要参数:

  • AppID: 应用的唯一标识。

  • AppSecret: 用于接口签名加密的密钥。

  • Device ID: 目标语音喇叭的设备编号(可在控制台查看)。

3.2 接口地址与签名机制

为保证安全性,所有接口需携带动态签名。

  • 请求地址https://api.thingboot.com/{AppId}/device/control/?sign={sign}&ts={ts}

  • 请求方法: POST

  • Content-Typeapplication/json

签名算法该平台采用双重MD5加密机制,具体步骤如下:

  1. AppSecret 进行一次MD5加密,得到 Sign1

  2. Sign1 拼接上当前的时间戳(秒级,即ts)。

  3. 将拼接后的字符串再次进行MD5加密,得到最终的 sign

公式:sign = md5( md5(AppSecret) + ts )

示例:假设 AppSecret = "abc123"ts = "1747212640"

  1. 第一次MD5:md5("abc123") = "xxxxxx"

  2. 拼接:"xxxxxx" + "1747212640" = "xxxxxx1747212640"

  3. 最终签名:md5("xxxxxx1747212640")

3.3 核心指令下发(播报文本)

通过JSON格式的order参数控制设备行为。最核心的指令是play:gbk:16,用于传输文本内容

请求体示例

3.4 设备状态调节指令

为了适应不同环境,可以通过不同的order键值对动态调节设备参数(音量、音色等),这些指令可以在播报前下发,实现个性化反馈

功能指令Key取值示例描述
音量设置volume"0" ~ "9"0为静音,9为最大音量
音色切换voice"0""1"0:女声,1:男声
语速调节speed"0" ~ "9"默认一般为5,数值越大语速越快
播放提示音message"3"触发内置提示音(1-5可选)

组合下发示例:先设置音量和音色,再播报内容。

4. 代码实现示例

以下代码演示了如何通过计算签名来下发指令。

4.1 Python 实现

4.2 cURL 实现(用于命令行测试)

参考自芯步API规范及常见对接实践

5. 场景应用与进阶优化

  • 1. 告警分级播报针对不同紧急程度的状态,采用不同音色或音量。

    • 普通通知:女声,音量4,语气平缓。

    • 严重告警:男声,音量9,配合内置alert警示音(如{"alert":"2"})。

  • 2. 解决文本转语音的歧义接口对多音字和数字读法有优化支持。

    • 数字读法[n1]888(读作“八八八”)、[n2]1888(读作“一千八百八十八”)、[n3]13800000000(读作手机号格式)

    • 多音字:使用[=diao4]标记,例如请把空调[=diao4]转一下角度

  • 3. 长文本处理Mini喇叭对单次播报字符数有一定限制(不超过50字),若反馈信息过长,业务端进行字符串切割,分多次调用接口下发,避免播报截断

6. 总结

通过对接芯步智能语音喇叭的HTTP接口,开发者仅需掌握基础的POST请求发送能力(约10行核心代码),即可为现有系统赋予“说话”的能力。无论是工业车间的设备状态警报,还是办公室OA系统的会议提醒,该方案都具有低成本、低延迟、高覆盖率的优点