CATALOG

一、场景需求与概述

在自助设备应用场景中(如自助取票机、快递柜、自助售货机、政务自助终端等),用户常常因操作流程不熟悉而导致操作失败、排队等待人工协助,影响使用体验和运营效率。通过在自助设备旁部署芯步60W智能语音音柱,并在用户操作的关键节点触发远程语音引导,可有效降低操作门槛,减少人工干预成本。

核心价值

  • 用户触碰屏幕时自动播放“欢迎使用”引导语

  • 操作超时时主动提示操作步骤

  • 出错时即时播报错误原因及解决方法

  • 完成后播报成功提示

技术方案:采用芯步开放HTTP接口,以标准POST请求向60W音柱下发TTS(文字转语音)指令,实现毫秒级响应(80-120ms)。设备支持WiFi 2.4G直连,无需额外网关,可部署于室内外各类场景

二、60W远程喊话音柱技术规格

2.1 硬件基础参数

项目规格
产品型号UNI-YY-YZ-PRO-60W
输出功率60W(大音量覆盖,适合开阔场景)
发声单元2寸高音 + 4寸中低音
工作电压DC 12V 3A
待机功耗< 2W
联网方式WiFi 2.4GHz(支持5组WiFi配置,自动择优连接)
防护等级铝合金外壳,防尘防水,适合户外/半户外
音频特性灵敏度90dB,频率响应0.1-16KHz

2.2 核心功能特性

  • 芯片级TTS:文本合成在设备端完成,无需上传录音,毫秒级响应

  • HTTP全开放:任何支持HTTP请求的编程语言均可调用

  • 私有化部署:支持纯局域网环境运行

  • 丰富控制命令:音量(0-9级)、音色(男/女)、语速(0-9级)、语调(0-9级)、内置铃声/提示音/警示音各5种

三、接口对接技术方案

3.1 接口架构

芯步采用标准的HTTP RESTful API设计,调用链路如下:

软件项目(后端服务)→ HTTP POST → 芯步API网关 → WiFi → 60W音柱

接口响应时间:80-120ms,满足自助设备的实时性要求

3.2 接口地址与鉴权

请求地址

http(s)://api.thingboot.com/{AppId}/device/control/?sign={sign}&ts={ts}

参数说明

  • {AppId}:应用ID,在芯步控制台获取

  • {ts}:当前Unix时间戳(秒)

  • {sign}:签名,计算方式为 md5(md5(AppSecret) + ts)

鉴权流程

  1. 将开发者密码(AppSecret)进行一次MD5加密

  2. 将上述结果与时间戳拼接

  3. 对拼接后的字符串再做一次MD5,得到最终签名

此双向MD5机制确保接口调用安全,防止重放攻击。

3.3 请求数据结构

Content-Typeapplication/json

请求体

  • device:目标设备ID,支持批量(用逗号分隔)

  • order:命令对象,核心播报命令为 play:gbk:16,值为要播报的文本

3.4 多语言代码示例

Java(Unirest)

Node.js

Python

cURL

3.5 高级控制命令

除基础播报外,60W音柱支持以下精细控制命令

命令格式示例说明
音量{"volume":7}0-9级,9为最大
音色{"voice":1}0男声/1女声
语速{"speed":5}0-9级
语调{"tone":5}0-9级
停止播报{"stop":1}立即中断当前播报
重复播报{"repeat":2}重复次数
播放铃声{"ring":1}1-5号内置铃声
播放提示音{"message":1}1-5号内置提示音

组合命令示例(先播提示音再播报):

四、自助设备场景集成方案

4.1 系统架构

┌─────────────────────────────────────────────────────────┐
│                    自助终端(前端)                      │
│  ┌─────────────┐  ┌─────────────┐  ┌─────────────┐     │
│  │ 触屏交互    │  │ 业务逻辑    │  │ 状态机      │     │
│  └──────┬──────┘  └──────┬──────┘  └──────┬──────┘     │
└─────────┼────────────────┼────────────────┼─────────────┘
          │                │                │
          │  事件触发       │  HTTP调用      │
          ▼                ▼                ▼
┌─────────────────────────────────────────────────────────┐
│                   后端服务(业务层)                      │
│  ┌─────────────────────────────────────────────────┐   │
│  │              语音播报调度模块                     │   │
│  │  - 事件-话术映射  - 防冲突队列  - 重试策略       │   │
│  └─────────────────────────┬───────────────────────┘   │
└────────────────────────────┼───────────────────────────┘
                             │ HTTP API
                             ▼
┌─────────────────────────────────────────────────────────┐
│                 芯步API网关                          │
└────────────────────────────┬───────────────────────────┘
                             │ WiFi
                             ▼
┌─────────────────────────────────────────────────────────┐
│              60W智能语音音柱(自助设备旁)               │
└─────────────────────────────────────────────────────────┘

4.2 核心引导话术场景映射

触发事件话术内容优先级备注
红外/雷达感应到用户靠近“欢迎使用自助服务终端,请按屏幕提示操作”避免频繁触发需加冷却
用户开始操作(点击屏幕)“请将身份证放置在感应区”视具体业务定制
操作超时(30秒无操作)“如您需要帮助,请按屏幕上的‘呼叫帮助’按钮”仅超时1次后触发
扫码识别失败“条码无法识别,请将条码对准扫描窗口,保持15厘米距离”含操作指引
支付成功“支付成功,请稍候,正在出票”-
出票/出货完成“请取走您的票据/物品,感谢您的使用”-
设备故障“设备暂时故障,请联系现场工作人员”最高同时通知运维

4.3 集成代码示例(Java后端)

4.4 防冲突与队列设计

由于自助设备操作流程连续,短时间内可能触发多个播报事件。设计语音播报队列:

五、部署与配置要点

5.1 设备网络配置

  1. 首次配网:音柱通电后,通过芯步App或小程序进行WiFi配置

  2. 多网络冗余:设备支持配置5组WiFi,自动选择信号最强的连接,确保网络稳定性

  3. 局域网模式:若需纯内网部署,可私有化部署API服务

5.2 安装位置

  • 60W音柱音量覆盖范围约200-300㎡,开阔场景效果更佳

  • 安装高度:2.5-3.5米,向下倾斜15-20度

  • 避免与自助设备麦克风过近(防止声反馈)

  • 户外安装注意防水接线(虽然设备已防水)

5.3 音量与环境适配

场景类型推荐音量说明
室内安静环境(政务大厅)3-5级避免干扰他人
半户外(快递柜区域)5-7级中等环境噪音
户外嘈杂(加油站、停车场)7-9级60W功率充足

六、故障处理与监控

6.1 常见问题处理

现象可能原因解决方案
无声音音量为0/设备离线/电源故障检查音量设置,ping设备确认在线状态
播报延迟>500msWiFi信号弱/网络拥塞检查WiFi信号强度,考虑有线版(以太网)
签名错误AppSecret错误/时间戳偏差校验AppSecret,确保服务器时间同步
播报内容乱码编码问题使用GBK编码,命令格式 play:gbk:16

6.2 设备状态监控

可通过芯步开放接口查询设备在线状态,集成至运维监控系统:

七、总结

  1. 极简接入:标准HTTP协议,任何语言均可调用,无需学习复杂协议

  2. 毫秒响应:80-120ms延迟,满足自助设备实时性要求

  3. 芯片级TTS:无需录音上传,文本直转语音,音质自然

  4. 灵活部署:WiFi直连无需网关,支持私有化局域网

  5. 高性价比:60W大功率覆盖广泛场景,一次部署长期使用

  6. 多维度控制:音量、语速、音色、语调均可精细调节

通过上述方案,开发者可在1-2天内完成60W远程喊话音柱与自助设备软件项目的对接,为用户提供流畅的语音引导体验。