CATALOG

芯步的智能语音产品线通过统一的HTTP接口实现文本转语音播报,核心流程是:业务系统 → 签名鉴权 → HTTP请求 → 云端 → 设备,端到端延迟约80-300ms。以下是针对5W壁挂音箱的完整对接方案。

一、 产品核心特性与准备

在开始对接前,请确认您已具备以下硬件与账号权限。

1. 硬件确认

  • 设备型号:智能语音壁挂音箱Pro(5W/10W规格根据采购而定)。

  • 网络状态:设备已通过Wi-Fi或以太网联网,且在芯步控制台显示为“在线”状态

  • 优势:该音箱支持芯片级TTS,文本合成在设备端完成,无需上传录音文件,响应速度快

2. 账号准备在芯步开放平台获取以下三个关键参数:

  • AppId:应用唯一标识。

  • AppSecret:接口加密密钥(请勿泄露)。

  • Device ID:目标5W壁挂音箱的设备编号(可在控制台获取)

二、 对接架构与接口详解

芯步采用的是 HTTP API 调用模式,对接流程如下:

业务系统/服务器 -> 构造签名(Sign) -> 发起POST请求 -> 芯步云端 -> 推送指令 -> 5W壁挂音箱 -> 实时语音合成播报

核心接口信息:

  • 请求地址http(s)://api.thingboot.com/{AppId}/device/control/

  • 请求方法POST

  • 参数格式JSON

1. 鉴权参数签名规则

为了防止接口被恶意调用,每一次请求都需要携带动态签名的Sign。算法规则如下

  1. 将您的 AppSecret 进行 MD5 加密得到 Sign_A

  2. 获取当前的Unix时间戳(秒级,如 1715678900)作为 ts

  3. Sign_Ats 拼接成字符串,再进行一次 MD5 加密,得到最终的 Sign

    • 公式Sign = MD5( MD5(AppSecret) + ts )

2. Body 报文控制命令

请求体需包含 deviceorder 两个字段,控制音箱说话的核心在于 order 对象的构造

  • 基础播报

    注:gbk表示文本编码格式,16通常代表默认音量和语速。

  • 高级控制如果需要调整音色、音量或语速,可以通过其他命令参数实现。具体可用的键值对参数如下:

功能命令Key说明示例值
设置音量volume调节播报响度0-9 (9级最大)
切换音色voice改变发音人male(男声) / female(女声)
调整语速speed控制说话快慢0-9 (0最慢, 9最快)
播放铃声ring播报前先响铃提醒1-5 (内置5种铃声)
数字读法format处理金额、手机号money / phone

三、 实战代码示例

针对开发者的不同技术栈,这里提供 PythonShell (cURL) 两种对接示例。实际测试表明,从命令下发到设备响应的延迟约为80-120ms

示例一:Python 3 对接脚本

适合后端开发集成(如订单系统、监控系统)

示例二:cURL 命令行脚本

适合运维测试或嵌入式系统快速调用

四、 常见场景应用方案

结合5W壁挂音箱的特性(壁挂节省空间,适合室内近距离覆盖),以下是几种典型的应用方式:

1. 工业/仓储场景:异常警报与操作指引

  • 需求:当传感器检测到异常或AGV小车到达节点时,需要现场人员干预。

  • 方案:MES系统调用API。

    • 文本示例:“注意,A3生产线发生急停,请立即前往查看。”

    • 附加命令:在播报前插入 {"ring":1} 作为刺耳的提示音,强制吸引注意力

2. 零售场景:会员营销与生日祝福

  • 需求:结合CRM系统,当会员刷卡时进行个性化语音播报。

  • 方案:收银软件触发。

    • 文本示例:“尊贵的金卡会员王先生,生日快乐。今天消费可享双倍积分。”

    • 附加命令:设置 speed 为 5(适中),音色为女声,并使用 format=money 准确播报余额

3. 智慧办公/餐饮场景:后厨叫号与会议提醒

  • 需求:外卖平台有新订单,或会议即将开始。

  • 方案:SaaS系统API集成。

    • 文本示例:“您有一笔新的美团订单,请尽快处理。”

    • 技术细节:可以利用 device 字段数组的特性,向多个音箱同时下发命令,实现全区域广播。例如:{"device":"101,102,103", "order":{...}}

五、 注意事项与排障

  1. 字符编码play:gbk:16 中的 gbk 表示文本编码。如果发现中文播报乱码或不发声,请检查代码中的字符串编码格式是否为 GBKUTF-8(根据设备固件版本,通常使用GBK或标准中文字符)

  2. 播报打断:如果设备正在播报长文本,再次调用接口会立即打断当前播报,转而播放新指令

  3. 声音大小:5W音箱功率相对较小,在嘈杂环境中将 volume 参数设置为 8 或 9(最大值)以确保清晰度

  4. 私有化部署:如果您的服务器无法访问公网,芯步支持私有化部署方案,可将API接口部署在内网环境中

通过以上步骤,您可以快速完成芯步5W壁挂音箱与业务系统的对接,实现稳定、实时的云端文本转语音播报功能。