百度远场语音开发套件 2.hello world(mac)

妖精的绣舞 提交于 2019-11-26 10:46:15

点亮设备,插上usb线,我们即将进入环境配置阶段。

  • 本章节使用macOS majave 10.14.4做演示。

插入设备前,应当保证自己的系统内具备adb环境。在terminal内确认一下
adb确认

至于如何安装,可参考这位仁兄的博客

神奇传送门

然后我们第一步首先要帮助开发套件连接到我们的wifi中来。

根据《百度大脑-远场语音开发套件-RK3308开发平台使用说明.pdf》中所提到的wifi配置,可以顺利完成入网。这里我做一遍操作

使用数据线连接设备后,我们可以用
adb devices命令查询到开发套件

随后键入 adb shell,使用命令行调试设备

cd /data/cfg 进入到wifi配置文件的目录下

通过vi命令打开配置文件

默认情况下家用路由器的话,只需要修改ssid(wifi名称)和psk(password key)即可。
若wifi有特殊情况,自行添加

key_mgmt=WPA-PSK // 加密方式
# key_mgmt=NONE // 不加密

修改完成后保存配置

随后输入

wpa_cli reconfigure
wpa_cli reconnect

指令激活重新联网

此时此刻,我们就完成了设备入网了。

语音识别、合成都需要用到网络,所以一定要正确入网喔!

(蓝牙我目前用不到,所以暂时没有继续去配置)

接着我们来尝试启动语音识别的demo程序,来看一看环境是否正常

所有sdk资源及相关文件都在根目录oem文件夹内

根据产品说明书,我们需要先启动 alsa_audio_main_service服务。
启动它之前,我们需要对目录权限进行相关修改赋予权限后进行启动

multi_4_2 指的是使用4阵列板声卡2。&后台启动

然后使用 ps -A检查一下服务是否正确启动在后台中
启动及检查

启动了alsa服务后,我们就可以去前往中启动demo了

样例程序文件位于/oem/BDSpeechSDK/sample目录中, 运行时依赖lib、resources、extern目录中的库及资源文件。

所以我们需要在启动时共享库

关于共享库可以看这里

神奇传送门

我们运行指令

cd /oem/BDSpeechSDK/sample/wakeup
LD_LIBRARY_PATH=/oem ./e2e_wp_asr_test

试着喊一下"小度小度,今天天气怎么样"试试?

可以发现,这次套件采用了流式识别喔!附带中间结果的!

可能在英语方面还有待加强吧~
(也许是我的英语太散装了)

Can you speak english? Wow, you can.

关于语音合成

示例程序会将文本“456hello你好今天天气不错”传送给服务器,由服务器生成对应的语音,保存为pcm文件,用户可以进行播放体验。
在终端启动语音合成功能,生成文本“456hello你好今天天气不错”对应的语音。

cd /oem/BDSpeechSDK/sample/tts
LD_LIBRARY_PATH=/oem ./online_test

测试程序暂未提供用户传入合成文本生成语音的功能,用户可以参照样例程序自行开发。
运行结束后,会在当前目录下生成一个xxx.pcm,其中xxx是一个测试时的时间戳.在终端执行如下命令体验语音合成效果

aplay -t raw -c 1 -f S16_LE -r 16000 xxx.pcm
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!