CATALOG

芯步的5W壁挂音箱通过开放的HTTP接口,支持设备端直接完成TTS合成,无需上传录音文件。以下是完整的对接方案,涵盖技术原理、接口调用方法和典型场景实现。

1. 技术原理与准备工作

1.1 核心原理

该方案的核心在于“文本即命令”。你的业务系统(如ERP、POS、小程序后端)通过HTTP POST请求,将需要播报的文字内容发送到芯步的API接口。音箱接收到指令后,直接在本地通过芯片级TTS技术将文字合成为流畅的语音并播放出来

整个过程是实时的,典型的响应时间在80-120毫秒之间

1.2 硬件与网络准备

  • 硬件:芯步“智能语音壁挂音箱5W”(型号:UNI-YY-YX-BG-5W)

  • 网络:设备支持2.4G WiFi。需要为音箱配置好网络,使其能够访问公网(如果使用私有化部署方案,则需确保与服务器局域网互通)

  • 电源:DC 5-12V供电,确保安装位置有电源插座

1.3 账号与权限准备

在开始编码前,你需要提前准备好以下三个关键凭证:

  1. AppID:在芯步物联网控制台创建应用后获取,用于标识你的应用。

  2. AppSecret:开发者密码,用于生成接口签名,保障通信安全。

  3. Device ID:设备的唯一ID。可在控制台查看,或在设备配网成功后通过接口获取

  • 签名计算规则接口安全机制采用双层MD5加密。具体公式为:sign = md5( md5(AppSecret) + ts )其中 ts 为当前的Unix时间戳(秒)。你需要将 AppSecret 进行一次MD5加密,然后将结果与时间戳字符串拼接,再对整个字符串进行一次MD5加密

2. 接口对接详细步骤

2.1 接口地址与请求方法

  • URLhttp(s)://api.thingboot.com/{AppId}/device/control/?sign={sign}&ts={ts}

  • MethodPOST

  • Content-Typeapplication/json

2.2 核心参数解析

请求体(Body)是一个JSON对象,包含两个关键字段

  • device:支持字符串格式,如果要向多个音箱广播,可以用逗号分隔ID,如 "820720,820721"

  • order:命令对象。其中 play:gbk:16 是播报命令,GBK编码支持中文显示,16代表特定的音频输出通道。

2.3 代码接入示例

由于接口基于HTTP,任何支持网络请求的编程语言均可接入。以下是几个关键场景的示例:

第一种场景:基础播报仅改变请求体中的 order 字段内容。

  • 基础播报{"play:gbk:16":"欢迎光临,请佩戴口罩"}

  • 带数字优化的播报{"play:gbk:16":"您有一条新订单,金额是[金额]123.5元"}小贴士:音箱支持数字读法优化。为了让它正确读出金额而不是无聊的数字,在敏感数字前加上语义标记(如[金额]

第二种场景:设备状态控制你可以在播报前或单独调用以下命令来控制音箱。

  • 调节音量(0-9级){"volume":7}

  • 切换音色(男/女){"voice":"女声"}

  • 播放内置提示音(共5种){"message":1}

第三种场景:进阶播报控制

  • 立即停止播报{"stop":1}

3. 典型应用场景与解决方案

3.1 订单提醒系统(适用于餐饮、新零售)

当顾客在小程序下单,后端系统捕获订单事件后,立即调用API。

  • 实现逻辑

    1. 获取新订单,提取客人的姓氏和菜品信息。

    2. 拼接文本:{"play:gbk:16":"您有美团新订单,张先生请准备制作。需要10杯拿铁。"}

    3. 同时发送音量调节命令确保提醒有效:{"volume":9}

3.2 工业/办公自动警报

用于对接传感器或工控系统。

  • 实现逻辑:如果温湿度传感器检测到机房温度过高,服务端自动化脚本读取数据,发现异常则调用接口。

  • 拼接文本{"play:gbk:16":"[警示音]警告,机房温度已超过35度,请立即检查。[警示音]"} (利用内置警示音增强提醒效果)

3.3 生产报工

实现逻辑:工人操作PLC设备,设备完成一个工件,触发一次HTTP请求。

4. 最佳实践与排坑指南

4.1 关于多音字与数字读法

  • 多音字:系统内置了部分多音字库,但生僻字可能需要注音。在文本中用同音字替代或尝试标记法

  • 数字读法:系统默认识别连续性。

    • 普通数值:123 -> “一百二十三”。

    • 手机号:为了避免读出“一亿...”,最佳实践是在手机号前加空格或标记,系统会尝试智能分段,或者直接传递带空格的字符串如 138 0000 0000

4.2 局域网与断网重连

该设备支持纯局域网环境运行(私有化部署)

  • 配置项:在控制台开启私有化模式,并将API域名解析改为你的内网服务器IP。

  • WiFi漫游:设备支持设定5组WiFi,当一组信号断开时,自动搜寻并连接最强信号

4.3 声音被覆盖

如果同一台设备短时间内接收到多条指令(高频场景),默认行为是打断当前播报,直接执行最后一条指令。

  • 解决方案:如果你的场景是流水线报工,需要按顺序播报不能遗漏,需要在业务层做队列处理。先将指令存入Redis队列,消费端一条一条地发送给音箱(等待接收到“播报完成”的回调或通过延时发送下一条)。

通过上述步骤,你可以快速地将5W壁挂音箱集成到任何软件系统中,实现低成本、高效率的语音交互解决方案。