CATALOG

芯步智能语音音柱采用标准的HTTP接口,通过简单的文本推送即可触发TTS语音播报,非常适合集成到自助设备的操作引导场景中。以下是完整的对接方案:

1. 背景与需求分析

在自助售货机、自助取票机、自助停车缴费终端等场景中,用户常因操作指引不清晰导致使用困难,增加人工干预成本。本方案基于芯步智能语音音柱Pro 60W,通过将其对接到现有软件项目中,实现实时的、动态的语音操作引导,提升用户体验和设备智能化水平。

核心需求:

  • 用户接近或操作时,自动触发语音提示(如“请刷卡”、“请取票”)

  • 错误操作时实时语音提醒(如“请调整商品位置”)

  • 远程管理设备音量和播报内容

  • 低成本、低延迟响应

2. 产品选型:智能语音音柱Pro 60W

2.1 核心特性

智能语音音柱Pro 60W采用芯片级TTS技术,文本语音合成在设备端完成,无需上传录音。其主要特性包括:

特性说明
输出功率60W,适用于车间、停车场、场馆等中大型场景
联网方式WiFi 2.4G(支持5组WiFi自动切换)或以太网(可选)
播报方式直接推送文本,设备端合成语音
响应延迟80-120ms
开放接口HTTP API,支持任何编程语言
部署方式公网或纯局域网私有化部署
外壳材质铝合金,防水防尘,适合户外/半户外

2.2 与其他型号对比

型号功率适用场景
10W/20W小功率办公室、收银台
Pro 60W60W车间、停车场、场馆、加油站
86型10W宿舍、走廊壁挂

对于自助设备较为集中的场所(如自助洗车房、快递柜区、停车场缴费区),60W音柱覆盖范围广,一台设备即可服务多台自助终端。

3. 技术对接架构

3.1 整体架构图

flowchart LR
    subgraph A[用户侧]
        U[用户]
        D[自助设备
售货机/取票机/缴费机] end subgraph B[服务端] S[业务服务器
含对接接口] DBD[(业务数据库)] end subgraph C[物联侧] API[芯步云API
api.thingboot.com] SP[音柱Pro 60W] end U -->|操作| D D -->|上报事件| S S -->|HTTP请求
含签名+设备ID+文本| API API -->|推送播报指令| SP SP -->|语音提示| U S <-.-> DBD

3.2 数据流向

  1. 事件触发:用户在自助设备上的操作(扫码、投币、按键等)触发业务事件

  2. 业务处理:业务服务器接收事件,根据场景决策播报内容

  3. API调用:业务服务器构造HTTP请求,携带签名、设备ID和播报指令

  4. 设备播报:音柱接收指令,实时TTS合成并播放语音

4. 接口对接详解

4.1 认证机制

芯步接口采用双重MD5签名机制,确保请求安全

签名算法:

sign = md5(md5(AppSecret) + ts)

参数说明:

  • AppSecret:开发者密钥,从芯步控制台获取

  • ts:Unix时间戳(秒)

  • +:字符串拼接

签名计算步骤:

  1. AppSecret 进行一次MD5加密,得到 secret_md5

  2. secret_md5 与时间戳 ts 拼接

  3. 对拼接后的字符串再进行一次MD5加密

代码示例(多种语言):

4.2 请求地址与格式

请求URL:

https://api.thingboot.com/{AppId}/device/control/?sign={sign}&ts={ts}

请求方法:POST

Content-Type:application/json

请求体结构

完整示例(curl):

4.3 核心命令集

根据自助设备场景,以下为常用命令

命令类型命令格式说明示例
文本播报{"play:gbk:16":"文本"}直接播报文本{"play:gbk:16":"请取走您的商品"}
带前缀播报{"play:gbk:16":"[message_3]欢迎光临"}先播提示音再播报{"play:gbk:16":"[ring_1]请刷卡"}
音量设置{"volume":"x"}x=0~9,9最大{"volume":"7"}
音色设置{"voice":"x"}0=女声,1=男声{"voice":"1"}
语速设置{"speed":"x"}x=0~9,5为标准{"speed":"5"}
停止播报{"stop":""}立即停止当前播报{"stop":""}
内置提示音{"message":"x"}x=1~5{"message":"3"}
内置铃声{"ring":"x"}x=1~5{"ring":"2"}
内置警示音{"alert":"x"}x=1~5{"alert":"1"}

4.4 多设备同时控制

如需向多台音柱同时发送相同指令,设备ID用逗号分隔:

5. 场景化实现

5.1 用户接近唤醒提示

触发条件:人体传感器检测到用户接近(需配合芯步雷达传感器)

实现流程

  1. 雷达传感器上报 {"radar":"1"} 到业务服务器

  2. 服务器判断为“有人”,生成播报内容

  3. 调用音柱接口播报

播报内容示例

5.2 操作成功提示

触发条件:支付成功/商品出货/票据打印完成

播报内容示例

同时可设置音量适中:

5.3 异常/错误提醒

场景:刷卡失败、余额不足、商品缺货等

播报内容示例

5.4 远程音量调节

支持0-9级调节,9为最大音量。白天设为7,夜间设为3

5.5 完整的业务集成代码示例(Python Flask)

6. 私有化部署方案

对于网络受限或安全要求高的场景,芯步支持私有化部署

  1. 自建消息服务器:在局域网内部署

  2. 设备配置:将音柱的API地址指向自建服务器

  3. 纯局域网运行:完全脱离公网,数据不外传

7. 最佳实践

7.1 播报内容设计

  • 简洁明了:每条提示控制在15字以内,避免信息过载

  • 分步引导:复杂操作拆分为多条短提示,而非一条长提示

  • 数字读法优化:金额自动识别(如“10.5元”读作“十块五”),手机号按数字连续读出

7.2 音量策略

时段音量说明
营业高峰期7-9环境嘈杂,需大音量
普通时段5-6正常音量
夜间/静音时段2-3避免扰民

7.3 故障排查

问题可能原因解决方案
无播报音柱离线/网络故障检查WiFi连接和设备在线状态
播报延迟高网络质量差切换至有线网络或优化网络
签名错误AppSecret或时间戳问题检查时间同步和签名算法

7.4 成本优化

  • 单台覆盖多设备:60W音柱可覆盖半径50-100米区域,一台即可服务多台自助设备

  • 私有化部署:长期运行可降低公网依赖和云服务成本

8. 总结

芯步60W云TTS语音音柱通过标准的HTTP API,可快速集成到各类自助设备的软件系统中。其核心优势包括:

  • 接口友好:HTTP,任意语言均可对接

  • 响应极快:80-120ms延迟,用户体验流畅

  • 功能完整:支持音量、音色、语速、语调等多种调节

  • 部署灵活:公网或私有化均可

  • 场景丰富:适用于自助售货、自助缴费、自助取票等各类场景

通过本方案,开发团队可在1-2天内完成音柱对接,显著提升自助设备的用户体验和智能化水平。