CATALOG

芯步的智能语音设备通过HTTP接口开放TTS能力,非常适合创客工坊中需要“按需生成语音”的场景。针对“自定义收款金额语音播报”这一需求,核心思路是:创客设备捕获金额 → 动态组合播报文本 → 调用芯步接口 → 语音音柱实时播报

下面按开发流程逐步拆解。

一、 整体架构与选型

在创客工坊中,我们追求的往往是“低成本、快速验证、灵活修改”。基于芯步的开放能力,推荐以下架构:

  1. 核心控制端ESP32/ESP8266树莓派 Pico W。这是工坊最主流的联网控制板。

  2. 播报执行端芯步智能语音音柱/喇叭。选择它的理由是它只需要 WiFi,无需额外网关,支持 HTTP 直控

  3. 触发输入端

    • 物理输入:旋转编码器 + OLED 屏幕(用于自定义输入金额)。

    • 无感输入:微信/支付宝收款码(需配合后台服务器轮询或使用微信回调,技术较深,工坊场景用物理输入模拟)。

  4. 网络环境:工坊内 2.4G WiFi 覆盖(设备不支持 5G)

二、 准备工作:设备注册与接口密钥获取

在编写代码前,需要先完成物联网平台的“握手”操作。根据芯步的开放机制,步骤如下

  1. 注册设备:在芯步开发者后台添加设备,获取设备的唯一标识 device(例如 820720)。

  2. 获取密钥:在控制台获取 AppIDAppSecret,用于生成动态签名,防止接口被恶意调用。

  3. 网络配置:通过设备配网工具,将音柱连接到工坊的 2.4G WiFi。

三、 核心技术:接口签名与 TTS 指令下发

这是集成的关键。芯步的接口安全机制要求每次请求都必须携带 动态签名,不能直接在代码里写明文密码。

签名算法(根据官方文档整理)在代码中需实现以下逻辑

  1. 获取当前时间戳 ts(单位:秒)。

  2. 计算 Secrets = md5(AppSecret)

  3. 计算 Sign = md5(Secrets + ts)

文本播报指令(JSON 格式)这是让音响说话的“咒语”。针对金额播报,利用接口的数字读法优化功能。

注:实际测试中,为了精准播报金额,最好将数字转换为字符串传给设备,并利用设备内置的金额数字读法(dollars参数)来避免将“101”读成“一百零一”还是“幺零幺”

四、 实战场景搭建:自定义金额输入与播报

我们以 ESP32 + 旋转编码器 + 芯步音柱 为例,搭建一个“DIY 收款助手”。

1. 硬件连接

  • ESP32 通过 GPIO 连接旋转编码器(CLK, DT, SW)和 OLED 屏幕。

  • 芯步音柱 上电并连接 WiFi(独立工作,只需在同个局域网或广域网即可,不直接与 ESP32 有线连接)。

2. 业务逻辑代码设计

在 ESP32 的代码中,主要逻辑为:读取旋转编码器数值 -> 按下确认 -> 拼接 URL -> 发送 HTTP GET/POST 请求。

代码执行流程(伪代码逻辑)

  1. 生成签名获取当前时间戳,按照 md5(md5(密钥)+时间戳) 的规则计算出 sign

  2. 组合 URLAppIDsignts 拼接成请求地址。

  3. 发送请求使用 HTTP Client 向该地址发送 POST 数据,Body 中包含设备 ID 和播报文本。

  4. 语音优化为了避免语音生硬,需对金额进行格式化。如果是工坊环境,还可以加入提示音。

3. 自定义金额的交互场景

场景:工坊成员制作了一个“爱心义卖箱”,来参观的人旋转旋钮选择捐款金额(如 5元、10元、50元),按下按钮后,音响大声播报。

  • 操作:用户旋转编码器,OLED 显示金额从 0 增加到 50。

  • 触发:用户按下编码器确认“收款 50 元”。

  • ESP32 处理

    • 生成请求头。

    • 构造播报内容:{"play:gbk:16":"恭喜你献出爱心,收款50元"}

    • 发送至芯步 API。

  • 结果:音柱发出“叮咚~恭喜你献出爱心,收款50元”。

如果在真正的无人售货工坊场景,可以接入传感器联动,例如:接入重力传感器或红外传感器,当检测到商品被拿走或投币时,自动触发 HTTP 请求,播报“创客套件已出货,收款199元”

五、 进阶技巧与“排坑”指南

为了让项目更专业,你可以在代码中调用芯步接口的高级参数:

  1. 音色与音量调节:工坊环境可能比较嘈杂。可以在 order 中增加 {"volume":9} 命令将音量调到最大,或者设置 {"voice":0} 切换男声/女声增加辨识度

  2. 解决“金额读法”问题:直接读“101”元,TTS 可能读成“幺零幺”。官方接口支持 金额专用模式,设置数字读法参数为 money 类型,它会自动读成“一百零一元”

  3. 离线语音的“彩蛋”:如果想脱离手机操作,可以参考某些创客方案,增加 SU-03T 等离线语音模块。当你说“我要付 20 块”时,主控解析关键词,再去调芯步接口播报确认

  4. 响应延迟测试:根据官方数据,从接口调用到发出声音通常在 80ms-300ms 之间,在工坊场景中人的听感是“即时的”,不用担心延迟问题

六、 总结

在“创客工坊”中集成芯步设备实现自定义收款播报,本质上是一个 “传感器输入 -> 逻辑判断 -> HTTP 接口触发” 的标准物联网控制过程。

核心价值在于:利用了芯步 “芯片级 TTS 合成”“极简 HTTP 接口” 的特点,让创客绕过了复杂的音频电路设计和语音合成算法,只需要专注在交互逻辑和金额输入方式上,就能在 1 小时内做出一个媲美商用收银台的专业语音播报装置。

语音播报器产品方案:
怎样对接40W 公共广播语音音柱以实现远程 TTS 语音播报
查看 >>
会议室预约状态语音提示场景:怎样将智能语音联动台卡集成到软件项目中
查看 >>
无人售货机语音提示场景:怎样把智能语音播报喇叭2集成到软件项目中
查看 >>
如何对接40W 远程 TTS 语音壁挂音箱来实现语音播放暂停控制
查看 >>
产线设备语音通知场景:如何将智能远程吸顶音箱20W集成到软件项目中
查看 >>
语音引导场景方案:
创客工坊设备操作语音引导场景:如何将智能 40W 语音壁挂音箱集成到软件项目中
查看 >>
创客工坊设备操作语音引导场景:怎么将20W 自动语音通知音箱集成到软件项目中
查看 >>
前台接待语音引导场景:如何把智能语音远程台卡对接到项目中
查看 >>
共享空间前台语音引导场景:如何把智能语音音柱|20W集成到项目中
查看 >>
创客工坊设备操作语音引导场景:怎么将10W API 接口语音音箱对接到项目中
查看 >>
金额用途方案:
怎样在培训教室上课下课语音提醒场景中对接智能硬件以实现自定义收款金额语音播报
查看 >>
怎么在创客工坊设备操作语音引导场景中集成智能设备来实现自定义收款金额语音播报
查看 >>
怎么二次开发智能语音播报台卡来实现自定义收款金额语音播报
查看 >>