CATALOG

芯步的智能语音产品通过开放的HTTP接口,让开发者可以远程控制音量、音色、语速等参数,无需上传录音即可实时合成语音。以下方案涵盖接口原理、签名计算、多语言代码示例以及感应联动的应用场景。

一、 解决概述

芯步的智能感应语音提醒音箱(如智能语音喇叭3、智能语音壁挂音箱等)区别于传统的录音播放设备,其核心在于芯片级TTS(文本转语音) 技术。开发者无需预先录制音频文件,只需通过HTTP协议向指定的API接口发送JSON指令,设备端即可实时合成并播报文字内容

本方案的目标是指导开发者如何通过二次开发,利用其开放的HTTP接口,实现在不同编程环境(如Java、PHP、Shell)下对设备音量音色的动态调节。

二、 核心技术原理与接口准备

1. 接口架构

所有控制指令均通过 POST 请求发送至统一地址:https://api.thingboot.com/{AppId}/device/control/?sign={sign}&ts={ts}

  • AppId: 平台分配的应用标识。

  • sign: 接口调用签名,用于身份验证。

  • ts: Unix时间戳(秒),用于防止请求重放,通常有效期为5分钟。

  • Device ID: 目标设备的唯一标识

2. 鉴权机制(签名计算)

为了安全,所有请求必须携带动态签名。计算规则如下(伪代码逻辑):

  1. 将开发者密码(AppSecret)进行MD5加密。

  2. 将上一步得到的字符串拼接上当前的时间戳(ts)。

  3. 对拼接后的完整字符串再次进行MD5加密。

公式:sign = md5( md5(AppSecret) + ts )

注:时间戳 ts 需要作为参数传递,且必须与计算签名时使用的 ts 保持一致

三、 核心功能:音量与音色调节指令

在请求体中,order 参数是一个JSON字符串,承载具体的控制指令。针对音量、音色、语速、语调的调节,order 字段定义如下:

功能命令字段取值范围说明
音量调节volume0 - 9数字越大,音量越高。部分老款设备可能使用0-15或其他范围,参考具体设备文档
音色切换voice0 或 10:女声;1:男声。芯步采用真人发声,音质自然
语速调节speed0 - 90最慢,9最快。
语调调节tone0 - 9调节音调高低。
文本播报play:gbk:16字符串需要朗读的文字内容

四、 二次开发代码实现示例

以下提供几种常见开发环境的二次开发代码片段,演示如何构建请求并下发“音量和音色”指令。由于涉及到签名校验,请务将代码中的 AppIDAppSecret 替换为您在芯步控制台获取的真实值

1. Java 实现 (采用 Unirest 库)

此示例展示了如何在Java中构建动态签名并发起请求。适用于后端集成,例如对接ERP或订单系统。

2. PHP 实现

适合部署在Web服务器上,通过网页后端触发语音播报(如扫码支付成功提示)。

3. Shell Script (curl) 实现

适合系统运维场景,例如在自动化脚本中,当监测到磁盘满载或服务宕机时,通过音箱发出警报。

五、 感应联动与场景应用

以“智能语音感应壁挂音箱”为例,该设备具备人体红外感应功能。在二次开发时,可以利用这一特性实现更智能的联动

  1. 参数预设: 在感应触发前,先下发指令预设音量和音色。例如,白天营业时间音量设为8(高声),深夜模式音量设为2(低声),避免扰民。

  2. 动态内容: 感应到人经过时,接口推送不同的文本内容。结合 voice (音色) 切换,可以实现“男声欢迎光临”在入口, “女声温馨提示”在货架区的差异化效果。

  3. 独立控制: 由于接口支持传递不同的 device ID,你可以批量管理数百个音箱,针对每个音箱所在的物理位置(如车间A区、办公区C座)单独下发不同的音量和播报内容。

六、 总结

通过对芯步开放接口的二次开发,实现音量与音色调节非常便捷。开发者只需遵循 “动态签名认证 + 标准JSON指令” 的流程,即可将强大的语音能力集成到现有的任何系统中。这种即插即用的方式极大地降低了物联网语音提示功能的应用门槛,适用于从餐厅叫号、工业报警到智慧办公等多种场景。