一、场景需求概述
在餐厅、奶茶店等餐饮消费场景中,叫号取餐是影响顾客体验的关键环节。传统的人工喊号方式存在以下痛点:
噪音污染:员工长时间喊号易声嘶力竭,且影响用餐环境
效率低下:高峰期需专人负责叫号,人力成本高
覆盖不均:角落或嘈杂区域顾客听不清叫号
信息单一:无法灵活播报营销信息、取餐提醒等
芯步15W智能语音壁挂音箱Pro(型号:UNI-YY-YX-BG-PRO-15W)通过标准HTTP接口开放TTS语音合成能力,可无缝接入现有点餐/收银系统,实现自动化、智能化的语音播报。
二、方案整体架构
2.1 硬件选型
推荐设备:芯步智能语音壁挂音箱Pro 15W
关键参数:
功率:15W,适合30-80㎡的餐厅/奶茶店空间
安装方式:壁挂式,可固定在墙面或天花板
网络连接:WiFi 2.4GHz,无需网关,即插即用
外壳材质:铝合金,分隔式绝缘隔断,符合安规标准
外形尺寸:长150mm × 宽100mm × 高335mm
同系列可选规格:如空间较大(如美食城档口),可选用20W、30W规格
2.2 系统架构图
┌─────────────────┐ ┌─────────────────┐ ┌─────────────────┐
│ 点餐/收银系统 │─────▶│ 芯步云平台 │─────▶│ 15W壁挂音箱 │
│ (订单生成触发) │ HTTP │ (接口中转/签名) │ WiFi │ (TTS语音播报) │
└─────────────────┘ └─────────────────┘ └─────────────────┘
│ │ │
│ │ │
▼ ▼ ▼
订单事件触发 签名验证/命令转发 语音实时合成
(叫号/取餐/营销) 设备状态管理 (芯片级TTS)2.3 工作原理
触发:收银系统完成下单/出餐后,生成叫号指令
调用接口:业务后端调用芯步开放API,传入文本内容
云端处理:平台验证签名后,将指令推送到目标音箱
本地播报:音箱接收指令,在设备端完成TTS语音合成并播报
响应延迟:从指令下发到播报约80-120ms
三、接口对接技术方案
3.1 核心接口说明
芯步全系列语音播报设备开放统一的HTTP接口,任何支持HTTP请求的编程语言均可调用。
| 项目 | 说明 |
|---|---|
| 请求地址 | http(s)://api.thingboot.com/{AppId}/device/control/?sign={sign}&ts={ts} |
| 请求方式 | POST |
| 数据格式 | JSON / application/x-www-form-urlencoded |
| 核心参数 | device(设备ID)、order(播报命令) |
| 签名算法 | md5(md5(AppSecret) + ts) |
3.2 准备工作
对接前需在芯步开放平台完成以下配置:
注册账号:访问开放平台,完成企业/个人认证
获取凭证:在控制台「开发设置」中获取
AppID和AppSecret绑定设备:将15W音箱通电联网后,在控制台获取
device_id(设备唯一标识)网络配置:音箱支持配置5组WiFi,自动选择信号最强的连接
3.3 签名算法详解
为防止接口被恶意调用,所有请求需携带动态签名:
步骤1:计算 appSecretMd5 = md5(AppSecret) 步骤2:计算 sign = md5(appSecretMd5 + ts) // ts为Unix时间戳(秒) 步骤3:将sign和ts拼接在请求URL中
示例(假设AppSecret = abc123,ts = 1700000000):
appSecretMd5 = md5("abc123") = "e99a18c428cb38d5f260853678922e03"
sign = md5("e99a18c428cb38d5f260853678922e031700000000") = "8f3c2a1b..."3.4 播报命令格式
基础播报指令
字段说明:
play:gbk:16:固定命令,表示GBK编码的文本播报,16为默认优先级文本内容:支持中文、英文、数字,自动进行TTS合成
带前导提示音的播报
[message_3]表示内置的第3种提示音(共5种可选)
完整带设置项的播报
3.5 可配置参数全表
| 参数 | 命令格式 | 取值范围 | 说明 |
|---|---|---|---|
| 音量 | {"volume":"x"} | 0-9 | 9为最大音量 |
| 音色 | {"voice":"x"} | 0=女声,1=男声 | 真人发声,自然柔和 |
| 语速 | {"speed":"x"} | 0-9 | 5为标准语速 |
| 语调 | {"tone":"x"} | 0-9 | 5为标准语调 |
| 铃声 | {"ring":"x"} | 1-5 | 内置5种铃声 |
| 提示音 | {"message":"x"} | 1-5 | 内置5种提示音 |
| 警示音 | {"alert":"x"} | 1-5 | 内置5种警示音 |
| 停止播报 | {"stop":"x"} | 0=停止当前,1=全部停止 | 用于打断异常播报 |
| 灯带控制 | {"led":"x"} | 0=关,1=开 | 同时实现视觉提醒 |
3.6 多语言代码示例
JavaScript/Node.js
Java
Python
四、业务场景集成方案
4.1 叫号播报流程
以奶茶店为例,完整的叫号自动化流程:
顾客下单 → 收银系统生成订单号 → 订单状态变为「制作完成」
↓
业务系统捕获状态变更 → 调用TTS接口 → 音箱播报「请A032号顾客取餐」
↓
(可选)顾客取餐后扫描小票 → 系统标记已取餐 → 停止播报或播放感谢语4.2 对接点餐系统
方案A:直接对接现有API如果餐厅使用的是SaaS点餐系统(如美团收银、客如云等),可在其开放平台的「订单完成」回调中,增加调用芯步接口的逻辑。
方案B:中间层对接对于无法直接修改原系统的场景,可搭建一个轻量级Python/Node.js服务,轮询数据库订单状态变化,触发播报。
4.3 叫号规则设计
| 场景 | 播报内容示例 | 配置 |
|---|---|---|
| 首次叫号 | [message_3]请A032号取餐 | 音量7,女声,标准语速 |
| 二次叫号 | [ring_2][message_4]再次提醒,A032号请取餐 | 音量8,加快语速,加前导铃声 |
| 取餐完成 | [message_1]感谢您的光临 | 音量6,柔和语调 |
| 空闲时段营销 | 新品上市,杨枝甘露第二杯半价 | 音量5,女声,舒缓语速 |
4.4 多区域/多设备管理
对于有多台音箱的连锁奶茶店或多窗口餐厅:
可根据区域划分设备ID(如取餐窗口、堂食区、外带区),实现分区域精准播报。
五、高级功能应用
5.1 数字读法控制
TTS引擎智能识别数字场景,自动选择合适读法
| 输入文本 | 播报效果 |
|---|---|
请取餐号032 | 读作“零三二” |
您消费了128元 | 读作“一百二十八元” |
请拨打400-123-4567 | 读作“四零零一二三四五六七” |
5.2 多音字处理
对于有多音字的场景,可使用拼音标注:
{"play:gbk:16": "请取餐,cháng(肠)粉已做好"}5.3 播报队列与防冲突
当短时间内有多个播报请求时,音箱内置队列机制,按顺序播报,不会同时发声造成混乱。
5.4 局域网私有化部署
对数据安全要求高的连锁餐饮企业,支持私有化部署:将消息服务器部署在企业内网,音箱通过局域网IP直连,完全不经过公网。
六、项目实施要点
6.1 部署步骤
设备安装:离地2-2.5米壁挂,避免遮挡,朝向顾客等候区
网络配置:通过设备配网模式(长按按键或扫码)连接门店WiFi
接口调试:使用Postman测试单条播报指令,验证签名和设备连通性
系统集成:在点餐系统订单完成回调中嵌入接口调用代码
灰度测试:先覆盖1-2个窗口,验证稳定后全量上线
6.2 注意事项
网络要求:音箱需连接2.4G WiFi,不支持5G频段
音量设置:15W设备适合30-80㎡空间,更大空间选用更高功率
签名时效:ts时间戳有效期通常为5分钟,实时生成
错误处理:接口调用失败时,应有降级方案(如保留人工叫号)
6.3 成本估算
| 项目 | 费用 |
|---|---|
| 15W壁挂音箱 | 硬件一次性采购 |
| 云平台服务 | 按设备数/调用量计费(具体咨询商务) |
| 网络流量 | 仅消耗WiFi流量,文本指令极小 |
| 维护成本 | 几乎为零,设备即插即用 |
七、总结
芯步15W壁挂智能语音音箱通过标准化的HTTP开放接口,极大地降低了餐饮场景语音播报系统的集成门槛。核心优势总结:
| 维度 | 价值 |
|---|---|
| 开发效率 | 仅需HTTP POST调用,无复杂协议学习成本 |
| 语音质量 | 芯片级TTS合成,真人发声,支持男/女声、语速语调调节 |
| 部署灵活 | WiFi直连,即插即用,支持私有化部署 |
| 场景扩展 | 除了叫号,还可用于营销广播、员工通知、打烊提醒等 |
| 投资回报 | 节省人力成本,提升顾客体验和翻台效率 |
通过上述方案,餐厅和奶茶店可在1-3天内完成从设备采购到系统上线的全流程,实现现代化、智能化的语音叫号服务。