极客工坊

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 16117|回复: 4

Raspberry Pi实作项目 - 语音识别

[复制链接]
发表于 2012-9-25 13:38:14 | 显示全部楼层 |阅读模式
最近为大家介绍了不少Raspberry Pi的项目和如何实现它们,例如如何连接Arduino、远端操控Raspberry Pi和Raspberry Pi中如何读取传感器模组DrDAQ的数据等,籍此让大家累积更多使用Raspberry Pi的实际经验,而這一次是透過语音识别控制Maplin USB机械手臂,在Raspberry Pi这种相对便宜的平台下亦能够开发完善的语音识别系统。





项目简介

在这个Raspberry Pi项目中,会使用Julius 开源库实现语音识别,Julius是一个拥有大量词句的连续性语音解码程式,当中利用了主流的搜寻技术,要让Julius支援特定的语言,便要有语言模型和声学模型。以下是有关项目的示范影片:



1. 安装了Debian 的Raspberry Pi,建议连接上互联网;

2. Maplin USB机械手臂;

3. USB 麦克风;

4. 声学模型;

5. HTK工具

6. Julius解码程式



由于这个项目并不需要使用大量图形处理器(GPU)的资源,所以建议大家分配较少的记忆体到图形处理器中。这个项目主要以Debian中的命令行进行,以节省资源。



步骤1: 载入声效卡的驱动器

sudo modprobe snd_bcm2835




步骤2: 安装项目所需的软件和程式库,建议大家先连接到互联网再运行以下的命令,不然大家便要把封装包放到SD卡中再自行安装。

sudo apt-get install alsa-tools alsa-oss flex zlib1g-dev libc-bin libc-dev-bin python-pexpect libasound2 libasound2-dev




步骤3: 测试麦克风的运作,我们可以利用'arecord' (aksa-tools)录音大约10秒的时间,再播放并验证。第一行指令中的'-D plughw:1,0' 选项指派特定的录音设备,而Raspberry Pi的内置音效设备是'plughw:0,0' ,所以要留意你实际使用录音的接口。

arecord -d 10 -D plughw:1,0 test.wav

aplay test.wav




步骤4: 安装Julius,最新版本是4.2.1,而这个版本并不会正确地侦测ALSA接口,所以我们要从CVS的源代码中编译并安装Julius。

cvs -z3 -d:pserver:[email protected]:/cvsroot/julius co julius4

cd julius4

./configure --with-mictype=alsa

make

sudo make install




步骤5: 设置系统的环境变数以使用麦克风

export ALSADEV="plughw:1,0"



步骤6: 把预先准备好的语音和声效模型放到SD卡,并且执行Julius以进行语音识别,如果是依照voxforge网站的指引创建声效和语音模型,请在'voxforge/auto'路径中执行以下命令。

julius -input mic -C julius.jconf



后记:

要提升语音识别的准确度,可以把HMM 于Raspberry Pi上重新编译,而在Raspberry Pi编译和安装HTK的话可以使用以下的设置和指令

./configure --without-x --disable-hslab

make all

make install

在Raspberry Pi上实现语音识别功能能够让控制应用更多元化,除了机械臂的控制,把语音识别加入家居控制自动化的应用亦是实用性很强的项目,期望以后大家会发展有关的Raspberry Pi项目吧!


有图片的完整文章:http://www.designspark.com/zh-ha ... sp-pi-voice-control
回复

使用道具 举报

发表于 2012-9-25 13:54:31 | 显示全部楼层
这个东西不错,顶一下
回复 支持 反对

使用道具 举报

发表于 2012-10-1 22:21:18 | 显示全部楼层
htk啊……做声学的好工具!
回复 支持 反对

使用道具 举报

发表于 2012-10-3 15:05:30 | 显示全部楼层
我们之前做过某家语音产品的代理,主要是用语音技术指导工作操作。
使用前先让工人阅读指定的词汇,并进行记录,实际使用中将读到的语音和系统记录的语音进行比对,
系统并不能够识别这些词汇的具体含义,只是判断相似度。
这和市面上很多语音能转化为文字的软件应该是不同的。
不知道我这样理解是否正确。
回复 支持 反对

使用道具 举报

发表于 2013-3-18 15:51:17 | 显示全部楼层
老早就惦记这篇文章,今天总算扩展坞搞定了,实体界面操作下。。 哈哈哈
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 需要先绑定手机号

Archiver|联系我们|极客工坊

GMT+8, 2024-3-29 22:10 , Processed in 0.043728 second(s), 21 queries .

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表