LD3320语音识别模块

作者:hardihuang   hardihuang   

LD3320是针对非指定人员(无需针对指定人员)的语音识别芯片,即语音语音控制芯片。最多可识别 50 个预建命令。 

操作模式: #

LD3320(LDV7)语音模块可以工作在以下三种模式:

普通模式:直接说话,模块直接识别;

按键方式:按下触发ASR过程;

密码模式:需要一级唤醒词(密码);建议使用密码模式,以免在嘈杂的环境中出现故障。

应用场景: #

1.智能家居控制2. 智能车DIY设计3. 毕业设计的创新功能4.个人DIY设计5、语音控制嵌入式产品设计  

   我买的LDV7语音识别模块内置了单片机。LD3320语音识别芯片的驱动由模块上内置的STC11L08单片机驱动。我们可以修改模块自己项目的demo程序,修改里面的关键字,然后识别结果通过串口打印出来,我们用另外一个MCU和模块进行通信,分析收到的串口命令,然后做出响应命令动作。 例如我们说密码:当前时间(dang qian shi jian)》》 模块识别后串口输出: PrintCom(“{\”VoiceCommandCode\”:2}”);》》单片机接收到串口信息后,会解析串口命令(可以使用cJSON来解析这个字符串);》》 然后通过TTS文字转语音模块播放当前时间,完成语音识别控制过程。

  识别原理: #

也就是你说一个句子,模块用拼音和你的发音对比,找出哪些预设值的词更接近发音(假设50%),然后从一堆大于(50)的词中%) 最接近的是输出。 这样就会产生一个问题,容易造成过多的误识别。如果你只有一个关键词:时间然后你说:’moment’,他认出了’time’的发音,所以有50%以上的相似度,但是候选词中没有关键字’moment’比他更近,所以他会输出’Time’ ‘ 结果。他在这方面是错误的。如果设置了一些拟声词,可能会被随意触发。

 解决方案: #

设置好要识别的关键词后,为了进一步降低误认率,可以在识别列表中添加一些任意的词来吸收误认,从而达到降低误认率的目的。我们称此类关键字为“垃圾关键字”。 例如,在某个应用场景中,需要识别的关键词有4个,“前进”、“后退”、“开门”、“关门”。把这4个关键词设置到LD3320后,可以再设置10~30个字到LD3320,如“前门”、“后门”、“啊啊啊”、“呜呜”等。因此,最好将一些拟声词或容易混淆的词设置为垃圾关键词,即识别后不输出。 只有识别结果在4个关键词以内,才认为识别有效。如果识别结果为“垃圾关键词”,则说明误识别是由其他声音引起的,产品应重新启动识别过程。这样可以非常有效地降低误识别率。大大提升终端用户的主观体验。 

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注