CATALOG

芯步智能语音音柱(30W)通过开放HTTP接口,支持“即传即播”的语音提醒二次开发——无需预录音频,直接推送文本即可触发TTS播报。以下方案涵盖签名鉴权、核心命令示例及多语言代码实现。

1. 概述

芯步智能语音音柱(30W)是一款支持WiFi联网的硬件设备,具备芯片级TTS(文本转语音) 能力。它开放了标准的HTTP API接口,允许开发者通过任何支持HTTP请求的编程语言(Java、Python、JavaScript、PHP等)向设备下发语音播报指令。

核心优势:

  • 无需预录音:直接推送文本,实时合成语音。

  • 毫秒级响应:从调用接口到设备播报延迟低(约80-200ms)

  • 多场景适配:支持音量、音色(男/女)、语速调节,支持数字(金额/手机号)与多音字智能识别

2. 接口鉴权与基础信息

在二次开发前,需要在芯步控制台获取以下凭证,用于接口鉴权

参数说明获取方式
AppID应用唯一标识登录友物联控制台,在“开发设置”中查看
AppSecret应用密钥(用于加密签名)同上(注意保管,防泄露)
Device ID目标音柱的设备编号控制台设备列表或设备机身标签

签名算法

为保证接口安全,所有请求需携带签名。算法规则如下两步MD5

Sign=MD5( MD5(AppSecret) + ts )Sign = \text{MD5}(\ \text{MD5}(AppSecret)\ +\ ts\ )
  1. 将 AppSecret 进行 MD5 加密。

  2. 将步骤1的结果与时间戳 ts(Unix秒级)拼接。

  3. 将拼接后的字符串再次进行 MD5 加密。

3. 核心开发:实现语音提醒发送

3.1 请求地址与结构

  • 请求URLhttps://api.thingboot.com/{AppID}/device/control/?sign={sign}&ts={ts}

  • 请求方式POST

  • Content-Typeapplication/json

3.2 请求参数详解

请求体为Json格式,包含两个核心字段

3.3 常用 order 命令构建

针对“语音提醒发送”场景,主要使用以下参数:

功能描述order 内容示例说明
纯文本播报{"play:gbk:16":"你好,仓库有新车到达"}立即播报指定文本。gbk为编码,16为音量参考值
带前缀播报{"play:gbk:16":"[message_3]请注意,设备已启动"}[message_X]调用内置提示音(1-5)
调节音量{"volume":"7"}范围0-9(静音至最大),独立指令,不播报文字
切换音色{"voice":"1"}0:女声(默认),1:男声
停止播放{"stop":"1"}1:立即停止当前所有播报任务

注意:当需要播报大量文字时,可利用数字读法优化,如传入“18888888888”会自动识别为手机号读法

3.4 代码实现示例

示例 A:Java (Unirest)

示例 B:Python (Requests)

示例 C:JavaScript (Node.js / Fetch)

4. 高级应用场景与集成

4.1 对接第三方系统

  • 集成方式:在现有ERP、MES、SaaS系统的业务触发点(如扫码枪扫描成功、温湿度超标、新订单生成)直接嵌入上述HTTP调用代码

  • 私有化部署:音柱支持局域网通信。若在内网环境,可将域名 api.thingboot.com 替换为自建的私有化服务器地址,实现纯本地闭环,无需连接公网

4.2 多设备管理与负载均衡

  • 批量播报:请求参数的 device 字段支持逗号分隔(如 “123,456,789”),可一条指令触发多个音柱同步播报,适合工厂车间、大型停车场等空旷区域

  • 网络冗余:音柱可预设5组WiFi网络,若主信号断开,自动切换至次优信号,保障业务连续性

4.3 优化语音播报体验

  • 处理多音字:如果系统检测到TTS读法错误,可通过同音字替换的方式优化,例如将“行走”改为“步行走”,或利用数字读法强制纠正

  • 组合播报:支持在播报文本前叠加“内置铃声/警示音”(如 [ring_1][alert_2]),利用特定的声音频率引起操作员注意,避免错过关键提醒

5. 总结

通过芯步提供的标准HTTP接口,开发者仅需三步即可完成智能30W语音音柱的二次开发:

  1. 获取凭证(AppID/Secret)。

  2. 实现签名算法(推荐使用现成代码块)。

  3. 构造JSON命令调用接口。

该方案无需复杂的硬件编程,通过简洁的代码即可将物理世界的“提醒”与软件系统的“逻辑”无缝连接,适用于智慧工厂、仓储物流、餐厅零售等多类场景。