CATALOG

一、概述

在户外场景(如停车场、景区、园区、工地、校园等)中,语音通知是重要的信息传递手段。芯步10W智能语音音柱是一款支持HTTP接口远程控制的户外广播设备,具备IP防护等级、真人TTS(Text-to-Speech)播报、音量远程可调等特性。通过调用其开放接口,开发者可将语音通知能力快速集成到现有的业务系统(如安防平台、停车场管理系统、工单系统等)中。

核心优势

  • 无需上传录音,直接推送文本即可实时合成语音播报

  • 支持远程音量、音色、语速、语调调节

  • 单次请求可同时控制多个设备

  • 开放平台永久免费,无额外接口调用费用

二、准备工作:设备配网与凭证获取

在进入接口开发之前,需要完成以下基础配置:

2.1 设备上电与配网

  1. 注册账号:前往芯步官网()注册开发者账号

  2. 创建工作台:登录后进入“物联网控制台”,创建工作台并安装“物联网控制台”模块

  3. 添加Wi-Fi信息:在控制台的“网络配置”中,录入现场2.4GHz Wi-Fi的名称和密码(音柱仅支持2.4G频段)

  4. 设备配网:长按音柱的配网按键,指示灯闪烁后,通过控制台或“芯步”小程序为设备配置网络

  5. 确认在线:配网成功后,设备会在控制台的设备列表中显示为“在线”状态,同时获取设备ID(如 1878),后续所有接口调用都需用到此ID

2.2 获取接口凭证

在控制台的“开发设置”页面,获取以下两个核心参数

  • AppID:应用唯一标识(如 qtyVWcgeMq

  • AppSecret:开发者密码,用于签名计算(请妥善保管,切勿暴露在前端代码中)

三、核心技术:接口签名机制

芯步开放平台采用双重MD5签名机制验证请求合法性。所有HTTP请求的URL中必须携带 sign(签名)和 ts(时间戳)两个参数

签名计算步骤

  1. 获取当前Unix时间戳(秒级,10位数字),记为 ts

  2. 计算 step1 = md5(AppSecret)

  3. 计算 sign = md5(step1 + ts)(字符串拼接后进行MD5)

公式sign = md5( md5(AppSecret) + ts )

示例(假设AppSecret为 abc123):

  • step1 = md5("abc123") = e99a18c428cb38d5f260853678922e03

  • ts = 1747212640

  • sign = md5("e99a18c428cb38d5f260853678922e031747212640") = c484eb97ee288572db7828c6071dd88f

注意事项

  • ts 必须为当前时间,误差过大会导致 5003 bad ts 错误

  • 服务端会检查时间戳有效性,每次请求重新计算

  • 如果开启了IP白名单,需将服务器公网IP添加到控制台

四、接口调用:语音播报核心实现

4.1 请求地址与格式

接口地址

POST https://api.thingboot.com/{AppID}/device/control/?sign={sign}&ts={ts}

请求头

Content-Type: application/json

请求体(JSON格式)

4.2 各语言代码示例

Python 3 示例

Node.js 示例

Java 示例

4.3 响应处理

接口返回标准JSON格式

  • code=200:请求成功,音柱立即开始播报

  • code=5006:签名错误,请检查签名计算逻辑

  • code=5008:IP不在白名单

  • code=5009:请求频率超限(限制1次/秒/设备)

五、进阶功能:远程参数调节

芯步音柱支持通过order字段下发多种控制指令,满足不同场景需求

功能order参数取值范围示例
音量调节volume0-9(数字越大音量越大){"volume":"7"}
音色切换voice0-女声,1-男声{"voice":"1"}
语速调节speed0-9{"speed":"5"}
语调调节tone0-9{"tone":"4"}
播放铃声ring1-5(内置5种铃声){"ring":"3"}
播放提示音message1-5{"message":"2"}
播放警示音alert1-5{"alert":"1"}
停止播报stop0-停止当前,1-全部停止{"stop":"1"}

组合下发示例

六、户外场景集成方案

6.1 典型架构

[业务系统] → [后端服务] → [芯步API] → [4G/Wi-Fi] → [户外音柱]
     ↑              ↓
[触发事件]    [签名+请求封装]

6.2 场景化应用示例

第一种场景:停车场车牌识别联动

当车牌识别相机识别到车辆进出时,系统自动调用音柱接口,播报车辆信息和停车时长:

POST /device/control/
{"order": {"play:gbk:16": "欢迎光临,车牌京A12345,剩余车位32个"}}

第二种场景:园区安防告警

红外对射或电子围栏触发告警时,播报警示内容:

{"order": {"alert":"3", "play:gbk:16": "周界报警,请立即前往3号区域查看"}}

第三种场景:定时语音提醒(广场/景区)

通过定时任务(Cron Job)在固定时间段播报:

  • 早间播报开园提示

  • 晚间播报闭园提醒

  • 整点报时或安全提示

6.3 可靠性

  1. 异步处理:语音调用放入消息队列(如RabbitMQ、Kafka),避免阻塞主业务流程

  2. 失败重试:接口调用失败时,采用随机间隔(或逐次增大间隔)策略重试3次(间隔1s、2s、4s)

  3. 状态监控:定期(如每5分钟)调用设备状态接口,及时发现离线设备

  4. 限流保护:单设备请求频率不超过1次/秒,多个设备可并行调用

  5. 内容缓存:高频播报内容(如固定提示语)可在本地缓存,减少重复拼接

七、常见问题与排查

错误现象可能原因解决方案
5003 bad ts时间戳偏差过大检查服务器系统时间,同步NTP服务
5006 bad sign签名计算错误确认签名公式:md5(md5(AppSecret) + ts),ts为10位秒级时间戳
设备无响应设备离线或Wi-Fi信号弱检查控制台设备状态,或重新配网
播报内容乱码编码问题使用URL编码,确保中文字符正确处理
播报延迟高网络问题考虑使用有线以太网版本,或部署本地私有化方案

八、总结

通过芯步开放平台的HTTP接口,开发者可以在30分钟内完成10W语音音柱的集成工作。整个方案的技术要点可概括为:

  1. 配网:2.4G Wi-Fi + 控制台配置

  2. 鉴权:双重MD5签名(AppSecret → md5 → 拼接ts → md5)

  3. 调用:POST请求 + JSON格式的device和order参数

  4. 播报{"play:gbk:16": "文本内容"} 实时TTS合成

该方案已广泛应用于停车场、园区、工地、校园等户外场景,具备防水防尘、音量大、可远程管理等特点。如需部署到无互联网环境,芯步还支持私有化部署方案,可将接口部署于局域网内,进一步提升响应速度和安全性