CATALOG

这是一个非常实际的需求。在无人值守门店场景中,语音提示是引导顾客、管理安全、提升体验的关键环节,但又不能增加人工成本。

芯步的 20W 云语音壁挂音箱 强项就在于它不需要录好固定的MP3文件,而是支持通过HTTP接口直接“扔文字过去”,它就能实时合成语音播报。

下面我整理了一份接入指南,稍微口语化一点,希望能帮你快速把这事儿搞定。

一、 我们先定个小目标

咱们先不管代码怎么写,先理清思路。在一个无人值守的场景里(比如深夜便利店、自助健身房、共享会议室),我们希望这套系统能做到:

  1. 有人进门:音箱自动说“欢迎光临,请寄存背包,本区域24小时监控”。

  2. 异常闯入:非营业时间有人进来,直接吼“警告,非法闯入,已通知保安”。

  3. 自助买单:顾客扫完码,音箱播报“支付宝收款15元,欢迎下次光临”。

  4. 设备联动:如果传感器检测到漏水/起火,音箱能发出警报声并提示逃生。

说白了,就是要让你的服务器或云平台,在发生特定事件时,能命令墙上的那个白盒子开口说话。

二、 选这个音箱的理由(为什么是它?)

你可能会想,我接个蓝牙音箱不就行了?还真不行。

  • 极简接入:传统方案需要录MP3、存设备、维护列表,很麻烦。芯步的方案简单粗暴:调API

  • 不需要录音:这音箱是“文生音”的。你发文字“请注意”,它就说“请注意”,连录音的功夫都省了

  • 音质与音量:20W的功率,在门店里绝对够用,覆盖几十平米的区域没问题,声音清晰不刺耳。

  • 灵活音色:支持男声、女声、语速、音调调节,甚至能处理多音字和数字读法(比如把“10086”读成“幺零零八六”)

三、 接入流程(开干!)

这个过程比较简单,不管你的后端用什么语言写(PHP、Java、Go、Python都行),核心就是发一条HTTP请求

第1步:准备工作

把音箱通电,连上WiFi(它支持2.4G WiFi或有线网络)。然后去芯步的后台,拿到三个关键凭证:

  • AppID:你的应用ID。

  • AppSecret:你的应用密钥(别泄露出去)。

  • Device ID:音箱的MAC地址或设备编号,贴在音箱背面或后台能看到

第2步:搞懂签名(Sign)机制

芯步为了安全,接口不是裸奔的,需要一个动态签名。其实很简单,就两句话的事:

  1. AppSecret 做一次MD5加密。

  2. 把加密结果 + 当前的时间戳(ts)拼接起来,再做一次MD5

公式:sign = md5( md5(AppSecret) + ts )

(稍微口语化解释:这就好比你的门禁卡,每次进门前刷一下,系统知道是你本人。时间戳保证了这张“门禁卡”每隔一会儿就会换密码,防止别人复制。)

第3步:发送“给我说话”指令

这才是主角!你需要发一个 POST 请求到芯步的服务器。

请求地址:https://api.thingboot.com/{你的AppID}/device/control/?sign={计算出的签名}&ts={当前时间戳}

请求体(Body):这是一个JSON格式的数据,告诉服务器让谁说话(device)说什么(order)

下面是一个让音箱说“你好,欢迎光临”的例子:

特别说明: 注意那个 play:gbk:16

  • play:表示执行播报动作。

  • gbk:表示编码格式(中文一般都支持,按文档来即可)。

  • 16:代表音量大小(范围一般是0-20,16算是比较响亮的)

如果你的系统检测到有人非法闯入,想播个警告,只需要把后面的文字改一下,甚至音量调大

第4步:场景联动是怎么实现的?

无人值守门店通常有传感器(比如雷达人体传感器、门磁)。

流程是这样的:

  1. 传感器检测:雷达传感器检测到有人经过或门被打开。

  2. 上报事件:传感器通过MQTT或HTTP上报数据给你的服务器。

  3. 业务判断:你的服务器代码判断“现在是凌晨2点,关门了,怎么还有人?”

  4. 触发指令:你的服务器主动调用上面第3步的API,命令音箱说话

不需要音箱去轮询,也不需要复杂的逻辑,你的服务器就是大脑