1. 项目概述与二次开发背景
60W远程控制HTTP接口音柱是一种支持通过网络API远程触发语音播报的智能设备,广泛应用于需要即时语音通知的场景——如工厂车间工单播报、仓库出入库提醒、医院叫号系统、智慧办公楼的访客通知等。
“二次开发”的本质不是修改设备固件,而是通过调用设备暴露的HTTP API,将其语音能力集成到你现有的软件系统(ERP、OA、工单系统、监控平台等)中。芯步60W音柱(型号UNI-YY-YZ-60W及其有线版UNI-YY-YZ-60W-LAN)正是为此设计——设备开放标准HTTP接口,无需复杂协议,只需发送文本即可播报。
核心集成价值
免费开放HTTP API,响应延迟80-120ms,任何支持HTTP请求的语言均可接入
芯片级TTS,无需上传录音,文本即发即播
支持私有化部署,满足内网安全要求
内置5种提示音/警示音,支持音量/音色/语速远程调节
2. 产品选型与规格说明
2.1 60W音柱型号对比
| 参数 | UNI-YY-YZ-60W (WiFi版) | UNI-YY-YZ-60W-LAN (有线版) |
|---|---|---|
| 输出功率 | 60W | 60W |
| 联网方式 | WiFi 2.4GHz | 10Mbps以太网 |
| 覆盖面积 | 约200-300㎡ | 约200-300㎡ |
| 适用场景 | 已装修、不便布线的场所 | 新建项目、稳定性要求高的场所 |
| 私有化部署 | 支持 | 支持 |
2.2 核心能力
远程文本播报:通过HTTP API推送文本,设备实时合成语音播报
多网络备援:WiFi版可设定5组WiFi网络,自动连接信号最强的
音色调节:支持男声/女声切换
提示音库:内置5种提示音、5种警示音
私有化部署:支持自建消息服务器,纯局域网环境运行
3. 二次开发设计
3.1 整体架构
你的软件项目将作为“控制端”,通过芯步API网关向音柱下发播报指令:
┌─────────────────────────────────────────────────────────────┐
│ 你的业务系统(后端) │
│ ERP / OA / 工单系统 / 监控平台 / 自定义调度程序 │
└─────────────────────────────────────────────────────────────┘
│ HTTP POST (携带签名+设备ID+文本)
▼
┌─────────────────────────────────────────────────────────────┐
│ 芯步API网关 │
│ https://api.thingboot.com/{AppId}/device/control/ │
└─────────────────────────────────────────────────────────────┘
│ 下发至设备
▼
┌─────────────────────────────────────────────────────────────┐
│ 60W音柱(执行端) │
│ 接收指令 → TTS合成 → 音频放大 → 扬声器播报 │
└─────────────────────────────────────────────────────────────┘3.2 二次开发的核心任务
签名计算:按规则生成签名,用于API鉴权
指令构造:按设备命令格式构造播报内容
业务集成:在业务触发点调用播报接口(如工单创建、报警触发、订单完成)
状态管理(可选):轮询或接收回调,掌握设备在线/播报状态
注意:音柱本身不维护复杂的“队列”或“优先级”,若需要这些高级特性,需在你的后端自行实现。
4. API对接开发详解
4.1 接口基础信息
核心请求地址
https://api.thingboot.com/{AppId}/device/control/?sign={sign}&ts={ts}参数说明
{AppId}:应用ID,在芯步控制台注册获取{ts}:当前Unix时间戳(秒),用于防重放攻击{sign}:签名,计算方式见下节
4.2 签名算法(关键步骤)
芯步接口的安全性基于签名验证。签名生成规则为
sign = md5( md5(AppSecret) + ts )
具体步骤
将你的
AppSecret进行一次MD5哈希将结果与时间戳
ts拼接(直接拼接,无分隔符)对拼接后的字符串再做一次MD5
公式说明sign = md5( md5(AppSecret) + ts )
⚠️ 注意区分:
AppId和AppSecret在芯步控制台获取,ts为Unix时间戳,不同请求需重新生成。
4.3 请求体构造格式
请求体为JSON格式,包含device和order两个字段
参数说明
device:目标音柱的设备ID(字符串),可在控制台查看。order:命令对象。"play:gbk:16":指定文本编码和格式,固定使用此key。值:要播报的具体内容(字符串)。
4.4 各编程语言实现示例
Python实现
JavaScript/Node.js实现
Java实现
Shell脚本实现
5. 高级播报命令
除了基础文本播报,音柱还支持以下高级控制指令,可在order字段中使用:
5.1 音色控制
| 命令 | 说明 |
|---|---|
{"voice":"0"} | 切换为女声 |
{"voice":"1"} | 切换为男声 |
5.2 音量/语速/语调调节
| 命令 | 说明 | 取值范围 |
|---|---|---|
{"volume":"5"} | 设置音量 | 0-9(默认5) |
{"speed":"5"} | 设置语速 | 0-9(默认5) |
{"tone":"5"} | 设置语调 | 0-9(默认5) |
5.3 内置提示音与警示音
| 命令 | 说明 |
|---|---|
{"ring":"3"} | 播放内置铃声(1-5可选) |
{"message":"3"} | 播放提示音(1-5可选) |
{"alert":"3"} | 播放警示音(1-5可选) |
5.4 组合播报示例
在文本前添加提示音标识,可实现“提示音+语音”的组合效果:
支持的标识符:
[message_1]~[message_5]:提示音[alert_1]~[alert_5]:警示音[ring_1]~[ring_5]:铃声
5.5 停止播报
6. 业务集成场景示例
6.1 工单系统集成
将音柱与工单系统/ERP对接,实现工单流转的语音提醒:
6.2 监控告警集成
将音柱接入监控系统,实现异常事件的语音播报:
6.3 订单播报(自动/手动双模式)
订单通知场景可能需要“自动播报全量订单”和“管理员手动触发”两种模式:
7. 私有化部署方案
7.1 适用场景
部分企业内网环境不允许设备访问公网,或对数据安全有严格要求。芯步60W音柱支持私有化部署,可在纯局域网环境运行。
7.2 部署架构
┌─────────────────────────────────────────────────────────────┐
│ 你的内网业务系统 │
│ (ERP / OA / 自建平台) │
└─────────────────────────────────────────────────────────────┘
│ HTTP (内网)
▼
┌─────────────────────────────────────────────────────────────┐
│ 自建消息服务器(内网) │
│ (芯步私有化部署包) │
└─────────────────────────────────────────────────────────────┘
│ 内网通信
▼
┌─────────────────────────────────────────────────────────────┐
│ 60W音柱(内网IP) │
└─────────────────────────────────────────────────────────────┘7.3 配置步骤
申请私有化部署包:联系芯步获取部署包
部署消息服务器:在内网服务器上运行消息服务
配置音柱连接:将音柱的网络配置指向内网消息服务器
业务系统对接:你的业务系统调用内网消息服务器的接口
8. 设备初始化与网络配置
8.1 WiFi版配网步骤
将音柱接通电源
使用芯步配网工具,将设备连接到2.4GHz WiFi
登录芯步控制台,获取设备ID(Device ID)
测试播报功能:使用API发送测试文本
8.2 多WiFi备援配置
WiFi版支持配置5组WiFi网络,设备会自动选择信号最强的进行连接,适合在多AP环境或信号不稳定的场所部署。
9. 方案总结
通过芯步60W远程控制HTTP接口音柱的二次开发,你可以将语音通知能力快速集成到任意软件项目中:
| 开发任务 | 实现的方式是 | 难度 |
|---|---|---|
| API签名计算 | MD5双重加密 | 低 |
| 基础文本播报 | POST请求+play:gbk:16命令 | 低 |
| 音量/音色调节 | 发送控制命令 | 低 |
| 内置音效播放 | ring/message/alert命令 | 低 |
| 业务集成 | 在业务触发点调用播报接口 | 中 |
| 私有化部署 | 部署内网消息服务器 | 中 |
集成要点回顾
选择WiFi版或有线网版,按网络条件选型
掌握签名算法:
md5(md5(AppSecret) + ts)核心命令格式:
order: {"play:gbk:16": "播报内容"}支持多种编程语言:Python/Java/Node.js/Shell等
可私有化部署,保障内网数据安全
你无需开发任何语音合成技术,芯步的标准化API可让语音通知推送功能在1-2天内完成从设备部署到业务集成的全流程。