芯步这款10W壁挂音箱的核心优势是——你不需要提前录好音频文件,直接发一段文字过去,它就能用AI语音读出来。下面说说怎么对接。
一、 为什么选它?这玩意儿到底能干啥?
简单说,这音箱支持 HTTP接口远程调用,你不需要是硬件专家,只要会写几行代码(甚至用现成的API工具)就能让它开口说话。核心功能如下:
“文本直发”模式:不用提前录音,直接发文字过去,它自动合成语音播报。
实时打断与覆盖:新任务来了,可以立刻停止当前播放,播报紧急内容。
参数随心调:支持远程调节音量(0-9级)、音色(男/女声)、语速等。
二、 对接前的“三板斧”(准备工作)
在敲代码之前,需要先把“门禁卡”领到手,也就是在芯步平台上注册并拿到以下三个关键凭证:
AppID:你的“用户名”。
AppSecret:你的“密码”,千万别把它写在网页前端代码里,容易泄露。
Device ID:音箱的“身份证号”。拿到设备后,在后台设备列表里就能看到。
三、 核心对接步骤(把文字变成声音)
芯步的接口设计遵循标准的 HTTP POST 请求,核心就是往音箱的“大脑”里塞指令。
1. 搞懂“敲门”的规矩(签名计算)
为了安全,芯步的接口需要携带一个动态生成的 sign。签名计算方法如下:
步骤:将你的
AppSecret进行一次 MD5 加密,得到的结果拼接上当前的时间戳ts,再把拼接后的字符串整体做一次 MD5。公式
sign = md5( md5(AppSecret) + ts )
举个栗子:假设你的密码是 abc123,当前时间是 1700000000。首先计算 md5(abc123) = xxxxx,然后计算 md5(xxxxx1700000000),最终得到的就是签名。
2. 第一个 Hello World(发送播报指令)
这是最常用的一招:让音箱说话。
接口地址
https://api.thingboot.com/{你的AppID}/device/control/?sign={你的签名}&ts={时间戳}请求方式:POST
请求头
Content-Type: application/json请求体参数
device:你的音箱设备ID(字符串)。order:这里是重点,JSON格式。基础播报
{"play:gbk:16":"你好,欢迎光临"}带数字优化
{"play:gbk:16":"到账[n2]200元"}([n2]是金额读法,不会念成“贰零零”)带提示音
{"play:gbk:16":"[message_3]你有新订单请注意查收"}(先响一声“叮咚”,再说话)
3. 进阶玩法(控制音量和音色)
除了播报,你还可以通过修改 order 参数来调节音箱状态:
调大音量
{"volume":"7"}(范围0-9,数字越大声越大)切换男声
{"voice":"1"}(0为女声,1为男声)停止播放
{"stop":"1"}
四、 落地场景代码示例(以 Node.js 为例)
我们假设一个实际场景:“当有新的用户下单时,自动播报订单号”。
五、 经验之谈
混合播报是精髓:在文本中插入
[message_1]这类标签