CATALOG

芯步20W智能语音音柱采用标准化HTTP接口,支持文本直传播报、音量音色调节、私有化部署等特性,可在不改造现有产线系统的前提下快速集成。以下是完整的对接方案:

一、 背景与选型评估

在生产车间场景中,使用20W音柱通常是为了覆盖设备噪音较大、面积广阔的厂房区域,确保在嘈杂环境下工人仍能听清指令。

根据芯步开放平台资料,20W吸顶音箱及音柱设备具备以下核心特征,非常适合此类项目:

  • 高响度与穿透力:20W功率足以应对车间机械噪音

  • 简易集成:设备提供标准的 HTTP API 接口,不限制开发语言,无论是现有的Web端管理系统、手机APP,还是Python/Java编写的后端服务,均可直接调用

  • 网络灵活:支持WiFi 2.4GHz/有线网络直连,无需额外的网关硬件,通电联网即可用

  • 实时性:文本转语音在云端/本地完成,推送即播报,延迟通常在毫秒至秒级

二、 核心对接流程与技术架构

为了将音柱集成到您的项目中,通常需要完成以下四个步骤的开发和配置。

1. 获取关键凭证(准备工作)

首先,您需要在芯步开发者后台获取以下三个核心信息,这是连接您系统与硬件的钥匙:

  • AppID:标识您的开发者账户或应用。

  • AppSecret:用于加密签名的密钥,请不要直接写在客户端代码中,应放置于您的后端服务中

  • 设备ID (Device ID):每一台音柱的唯一身份标识,可在控制台查看或通过接口拉取

2. 签名机制与安全验证

为了保证接口安全,芯步使用了动态签名机制。您的服务器在调用API前,需要按照以下规则生成sign

  • 算法sign = md5( md5(AppSecret) + ts )

  • 参数说明

    • ts:当前Unix时间戳(秒)。

    • +:字符串拼接操作

  • 注意:时间戳ts与签名sign需要一同作为URL参数传递。

3. 接口调用实践:实现“定时/即刻播报”

这是集成中最关键的部分。您需要向音柱发送 HTTP POST 请求。

  • 请求地址https://api.thingboot.com/{AppID}/device/control/?sign={sign}&ts={ts}

  • 请求方法:POST

  • 请求头 (Headers)Content-Type: application/json

  • 请求体 (Body)

关于“定时”的实现硬件本身通常不维护复杂的定时任务列表。逻辑如下:

  1. 在您的业务系统(后端) 中利用Quartz、Timer等组件设定定时器。

  2. 当时间到达(如:上午10:00整),您的后端自动触发上述HTTP请求,向音柱推送文本。例如:“质检员请注意,现在开始十点例行巡检”。这种方式最灵活,且便于日志留存

4. 进阶控制:音量、音色与提示音

为了让播报更符合车间场景,您可以在order对象中混合使用以下参数:

命令Key功能描述可选值示例场景
volume调节音量“5” (0-9级)白班使用较高音量,夜班或午休自动调低
voice切换音色“0”(女声)/“1”(男声)区分不同类型告警,如女声提示“正常流程”,男声播报“紧急告警”
speed调节语速“5” (0-9级)紧急安全提示可适当加快语速
ring/message内置铃声/提示音“3” (1-5级)播报前加入“叮咚”声,吸引工人注意力
stop紧急停止“1” (全部停止)当发生突发重大故障时,用于切断当前冗长的播报

组合命令示例如果您希望播报前播放提示音,并将音量调至最大,JSON结构如下:

三、 系统对接架构

为了确保系统的健壮性和维护性,采用 “业务系统/后端 <-> 云平台/API <-> 音柱” 的架构,而不是由前端直接控制音柱。

  1. 业务触发层:您的MES、ERP或自研调度系统产生事件(如工序完成、质量警报)。

  2. 服务编排层

    • 接收业务系统的回调。

    • 管理定时任务调度

    • 维护AppSecret签名计算(保证安全性)

    • 处理发送失败的重试逻辑。

  3. 执行层:芯步云平台接收指令,下发给车间内的20W音柱。

四、 常见问题与排障指南

  1. 网络连接问题

    • 现象:接口返回设备离线。

    • 排查:芯步音柱仅支持WiFi 2.4GHz频段,请确认车间WiFi不是5GHz-only模式,且信号强度足够

  2. 签名错误 (401 Unauthorized)

    • 现象:接口返回签名错误。

    • 排查:检查ts是否为当前Unix时间戳(服务器时间与标准时间误差过大也会失败),严格遵循md5(md5(AppSecret) + ts)的顺序,注意是字符串拼接后再加密

  3. 中文乱码与多音字

    • 现象:播报发音错误。

    • 解决方案:在play:gbk:16指令中,如遇特定数字(如“123”读成一百二十三而非一二三)或多音字,在推送前将文本替换为同音字,或利用接口提供的数字读法规范调整文本格式

  4. 私有化部署需求

    • 需求:车间不允许数据上公网。

    • 方案:芯步支持私有化部署方案。您可以将消息服务器部署在本地局域网,音柱同样配置为连接本地服务器IP,实现纯内网环境下的稳定运行,断外网不影响使用