CATALOG

60W云远程语音音柱的二次开发核心在于其开放的HTTP接口——任何能发起网络请求的系统都可以直接调用,无需中间网关或复杂协议。下面从接口原理、签名机制、核心指令到落地架构,给出完整的技术方案。

一、 技术背景与接口概述

芯步的60W智能语音音柱(型号:UNI-YY-YZ-60W)区别于传统的蓝牙或音频线连接的音柱,其核心能力在于 “云远程”“文本直驱”

  • 开放接口:设备完全基于HTTP协议通信。这意味着无论是Java后端、Python脚本、Node.js服务,甚至是Shell脚本,都可以直接向音柱发送指令

  • TTS能力:开发者无需在本地准备MP3音频文件。你只需将文本内容(如“工号10086,有新的派单任务”)推送给音柱,音柱内置的语音引擎会实时将文字合成为自然语音进行播放

  • 网络连接:音柱通过WiFi 2.4G联网,无需额外的网关硬件,拿到设备后配网即可获得云端能力

二、 二次开发的核心流程

二次开发并不复杂,本质上就是在你的业务系统中,编写一段代码向芯步的API服务器发送一条HTTP POST请求。整个过程分为三个技术步骤:

1. 准备凭证与设备ID

在芯步开发者后台,你将获得两个关键字符串:

  • AppID:你的应用唯一标识。

  • AppSecret:你的应用密钥(严禁直接写在客户端代码中,仅在后端使用)

  • Device ID:60W音柱的设备编号,可以在控制台查看。

2. 动态生成签名

为了防止接口被恶意攻击,每次请求都需要携带动态签名(sign)。芯步采用的签名算法是 MD5嵌套,签名生成规则如下

sign=MD5( MD5(AppSecret) && ts )sign = \text{MD5}(\ \text{MD5}(AppSecret)\ \&\&\ ts\ )

参数说明:

  • ts :当前的Unix时间戳(秒级),例如 1747212640

  • 拼接逻辑:先将 AppSecret 进行MD5加密得到字符串 S1,然后将 S1 与时间戳 ts 直接拼接成字符串 S2,最后对 S2 再次进行MD5加密得到最终的 sign

3. 发起HTTP请求

使用标准的HTTP POST方法调用以下地址:

  • URLhttps://api.thingboot.com/{AppID}/device/control/?sign={sign}&ts={ts}

  • HeaderContent-Type: application/json

  • Body (JSON)

注意:{AppID} 是直接拼在URL路径中的,而不是作为参数

三、 核心指令集与功能控制

针对“语音通知推送”场景,你需要重点掌握order对象中的以下几个指令

功能类别Order Key示例值说明
文本播报play:gbk:16"[message_3]设备温度过高"核心功能。message_3为可选的提示音前缀。
音量调节volume"7"范围 0-9,数字越大音量越高,用于环境适配。
音色切换voice"1"0=女声,1=男声。
语速调节speed"5"范围 0-9,默认为5。
停止播放stop"1"紧急情况下强制清空播放队列。
播放铃声ring"3"播放设备内置的5种铃声之一,用于紧急警报。

场景示例:假设需要在中午静音时段降低音量播放通知,你的 order 可以这样写:

注意:在一次请求中,可以同时下发音量调整和播报指令。

四、 业务系统集成方案架构

在实际的企业应用中,不直接在订单创建时同步调用音柱接口(这会阻塞业务流程),推荐采用 “异步消息队列” 的架构。

  1. 触发层:当ERP系统产生新订单、MES系统出现警报或OA系统有会议通知时,系统触发一个“语音通知事件”。

  2. 队列层:将该事件发送到RabbitMQ或Redis队列中。这样做的好处是:如果芯步的API网络抖动,不会影响你主业务的交易速度。

  3. 消费层:开发一个Worker服务(独立的Java/Python进程)从队列中拉取消息。

  4. 执行层:Worker负责计算签名,调用芯步API。

  5. 反馈层:音柱收到指令并播报。如需确认,可开启“设备上行”功能,接收音柱的回调,确认播报成功。

五、 快速落地的代码参考

这里提供一个Java(最常用的后端语言)和Shell(用于测试)的对接逻辑示例。

1. Java 实现 (使用 Unirest)

这段代码适合放在Spring Boot等后端服务中

2. Shell 脚本实现 (Curl)

最适合在Linux服务器上快速调试或编写简单的监控告警脚本

六、 总结

利用芯步60W音柱的开放接口实现语音通知推送,技术门槛较低,核心在于 签名计算HTTP指令封装。通过将音柱接口集成到你的业务逻辑中(如订单完成、设备告警、流水线异常),可以快速实现办公室、工厂、仓库等场景下的实时语音播报能力,提升运维响应速度和人员沟通效率。