百度远场语音开发套件 2.hello world(mac)

点亮设备，插上usb线，我们即将进入环境配置阶段。

插入设备前，应当保证自己的系统内具备adb环境。在terminal内确认一下
adb确认

至于如何安装，可参考这位仁兄的博客

然后我们第一步首先要帮助开发套件连接到我们的wifi中来。

根据《百度大脑-远场语音开发套件-RK3308开发平台使用说明.pdf》中所提到的wifi配置，可以顺利完成入网。这里我做一遍操作

使用数据线连接设备后，我们可以用
adb devices命令查询到开发套件

随后键入 adb shell，使用命令行调试设备

cd /data/cfg 进入到wifi配置文件的目录下

通过vi命令打开配置文件

默认情况下家用路由器的话，只需要修改ssid(wifi名称)和psk(password key)即可。
若wifi有特殊情况，自行添加

key_mgmt=WPA-PSK // 加密方式
# key_mgmt=NONE // 不加密

修改完成后保存配置

随后输入

wpa_cli reconfigure
wpa_cli reconnect

指令激活重新联网

此时此刻，我们就完成了设备入网了。

语音识别、合成都需要用到网络，所以一定要正确入网喔！

（蓝牙我目前用不到，所以暂时没有继续去配置）

接着我们来尝试启动语音识别的demo程序，来看一看环境是否正常

所有sdk资源及相关文件都在根目录oem文件夹内

根据产品说明书，我们需要先启动 alsa_audio_main_service服务。
启动它之前，我们需要对目录权限进行相关修改赋予权限后进行启动

multi_4_2 指的是使用4阵列板声卡2。&后台启动

然后使用 ps -A检查一下服务是否正确启动在后台中
启动及检查

启动了alsa服务后，我们就可以去前往中启动demo了

样例程序文件位于/oem/BDSpeechSDK/sample目录中, 运行时依赖lib、resources、extern目录中的库及资源文件。

所以我们需要在启动时共享库

关于共享库可以看这里

我们运行指令

cd /oem/BDSpeechSDK/sample/wakeup
LD_LIBRARY_PATH=/oem ./e2e_wp_asr_test

试着喊一下"小度小度，今天天气怎么样"试试？

可以发现，这次套件采用了流式识别喔！附带中间结果的！

可能在英语方面还有待加强吧~
(也许是我的英语太散装了)

Can you speak english? Wow, you can.

关于语音合成

示例程序会将文本“456hello你好今天天气不错”传送给服务器，由服务器生成对应的语音，保存为pcm文件，用户可以进行播放体验。
在终端启动语音合成功能,生成文本“456hello你好今天天气不错”对应的语音。

cd /oem/BDSpeechSDK/sample/tts
LD_LIBRARY_PATH=/oem ./online_test

测试程序暂未提供用户传入合成文本生成语音的功能，用户可以参照样例程序自行开发。
运行结束后，会在当前目录下生成一个xxx.pcm，其中xxx是一个测试时的时间戳.在终端执行如下命令体验语音合成效果

aplay -t raw -c 1 -f S16_LE -r 16000 xxx.pcm

来源：CSDN

作者：Impulseeee

链接：https://blog.csdn.net/qq709785786/article/details/102741235

标签