听力

how to improve your English hearing

心已入冬 提交于 2020-02-29 11:29:55
#how to improve your English hearing not VOA not VOA special , so many words you don't know . for example here is a VOA special news: The U.S. Secretary of State John Kerry cited North Korea’s recent submarine-launched ballistic missile test as the latest example of North Korea’s continued pursuit of offensive and nuclear weapons in violation of United Nations Security Council resolutions.And he described Kim Jong Un as "grotesque and grisly" for reportedly ordering the public execution of his highest- ranking defense minister Hyon Yong Chol with an anti-aircraft gun. "Which makes his

设备故障检测,用计算机听觉人工智能

浪子不回头ぞ 提交于 2020-01-18 10:31:45
说过了计算机视觉,我们来说说计算机听觉。 如果说,视觉是人工智能的眼睛,那么听觉就是人工智能的耳朵。 有的问题,需要眼睛发现,有的问题,则要用耳朵发现,当然,更多问题是用“心”发现,机器之心。。。 笔者有位从事印刷设备研究的亲戚,当国内印刷厂高价从德国进口海德堡设备,但是不知道怎么用,或者出故障的时候,就要把他请去。 而他,则像一位老中医那样,先听声,后辨问题。 收费不菲。 就像耳熟能详的故事里说的那样,在问题处画个圈,收费1元,知道在哪里画圈,收费99元。 机器正常运转,它的声音一定是有某种规律的,而如果机器出故障了,声音也时常就伴随故障而变化。 这里可以用传统的模式识别方法,也可以用最新的人工智能,神经网络,深度学习的方法。 因材而异。 据美国电气与电子工程师协会《光谱》杂志报道,使用基于深度学习的人工智能可以听到机器或汽车的警告信号,并据此提前发现故障。 所谓深度学习,通常是指被称为人工神经网络的软件算法。这些神经网络可以经过多个人工神经元层过滤相关数据,以便更好地学习特定任务。目前流行的软件多以图像识别为主,侧重于语音和对话的声学识别也不少,但以机器运转发出的声音为深度学习对象的还不多见。上海速嵌的做法是,在每个客户端安装麦克风,开启物联网服务,将麦克风搜集的声音上传到云端,经过深度学习算法运算后,客户端可以使用连接了网络的智能手机等设备,监测声音来源设备的状态。

Mel倒谱系数到底是什么

会有一股神秘感。 提交于 2019-11-28 16:32:07
Mel倒谱系数(MFCC)是啥?跟频谱包络啥关系?跟语音的频谱有什么区别? 这里我们好好讲一讲。 在任意一个自动语音识别系统中,语音识别的第一步就是提取特征。换句话说,我们需要把音频信号中具有辨识性的成分提取出来,然后把其他的乱七八糟的信息扔掉,例如背景噪声啊,情绪啊等等。搞清语音是怎么产生的,对于我们理解语音有很大帮助。人通过声道产生声音,声道的形状决定了发出怎样的声音。如果我们可以准确的知道这个形状,那么我们就可以对产生的音素进行准确的描述。声道的形状在语音短时功率谱的包络中显示出来。而MFCCs就是一种准确描述这个包络的一种特征。 换句话说,Mel倒谱系数其实是来自于频谱包络的。 好,到这里,我们提到了一个很重要的关键词:声道的形状,然后知道它很重要,还知道它可以在语音短时功率谱的包络中显示出来。哎,那什么是功率谱?什么是包络?什么是MFCCs?它为什么有效?如何得到?下面咱们慢慢道来。 一、频谱图(Spectrogram) 我们处理的是语音信号,那么如何去描述它很重要。因为不同的描述方式放映它不同的信息。那怎样的描述方式才利于我们观测,利于我们理解呢?这里我们先来了解一个叫频谱图的东西。 这个图上面是时域的音频波形,下面是频域的音频频谱,也就是频谱图。在这里, 这段语音被分为很多帧,每帧语音都对应于一个频谱(通过短时FFT计算) ,频谱表示频率与能量的关系。在实际使用中