声音处理

Python学习笔记--语音处理初步

扶醉桌前 提交于 2020-02-26 22:28:10
python打开音频文件(IO) 语音音量大小与响度的相关计算 语音处理最基础的部分就是如何对音频文件进行处理。 声音的物理意义:声音是一种纵波,纵波是质点的振动方向与传播方向同轴的波。如敲锣时,锣的振动方向与波的传播方向就是一致的,所以声波是纵波。纵波是波动的一种(波动分为横波和纵波) 通常情况下对声音进行采样量化之后得到了声音的“时间—振幅”信息。 Python 打开wav文件的操作 wav文件 利用python打开一个wav音频文件,然后分析wav文件的数据存储格式,有了格式之后就能很方便的进行一些信号处理的操作。Wikipedia给出的wav文件的资料如下 Waveform Audio File Format ( WAVE , or more commonly known as WAV due to its filename extension - both pronounced "wave"‘)(rarely, Audio for Windows ) is a Microsoft and IBM audio file format standard for storing an audio bitstream on PCs . It is an application of the Resource Interchange File Format (RIFF)

码农录歌心得

寵の児 提交于 2020-01-28 00:36:11
这事写这里不知道会不会被打~ 最近喜欢上录歌,不是自己写歌编曲演奏演唱那么高段,也不是自弹自唱(这个后面可以有),也不是去录音棚交钱只管唱那么悠然。就是在自己的电脑上,翻唱一些自己喜欢的歌,自娱自乐一下。所以要做的事无非是:找伴奏+录唱+后期混缩=>输出。陆续录了一些,算是有了一些心得,分享一下。纯业余+新手向,恳请指教。 关于伴奏 网上能找到的伴奏,按品级从高到低我是这样排:原版伴奏>改编伴奏(含现场版)>卡拉OK版伴奏>去人声伴奏,结合音质的考量,这个排名不是那么绝对,比如实在找不到高质量的原版伴奏时,我会考虑换用高质量的改编或OK版伴奏。基本上低质量和去人声的我是不会考虑的,宁可不录也不将就。这里说的音质,我不想拿什么无损啊320/128K这些指标说事,就是一个字:感觉 原版伴奏。一首歌流传出来的版本可能有若干个,各版的编曲往往各不相同,例如不同人唱的(罗大佑和蔡国权的 《童年》 ) ,同一人在不同时期唱的(beyond《旧日的足迹》前后两版)、不同场合唱的(录音棚和各个演唱会之类),而编曲(我认为就是和弦、器乐、节奏),我觉得是一首歌最重要的东西了,它直接决定了一首歌的气质,或者说风格,最终影响的是听下来的感觉,同样的旋律,同样的人声,不同的编曲都会带出不同的感觉,当然同样的编曲,不同人唱也会有不同感觉,但相比之下,编曲造成的差异最甚

各种声音的基本频域成份介绍

旧街凉风 提交于 2020-01-25 11:40:38
1.地鼓((size)Kick Drum): 地鼓是一首歌曲里最重要的部分之一,因为它推动着节奏向前进行。这里我们讨论如何处理常见的三种地鼓:第一种我称之为“80年代蓬头地鼓”,你一定熟悉的:强而有力、富含中频、含有重击的“砰“声,想得到这种比较怀旧的地鼓声音,可以先过滤掉60Hz以下的 频率 ,然后根据情况在78-84Hz提升3到6dB((size)Q值大约为1),使之听起来象是敲在你的胸膛上。接下来在1.5-2.5kHz提升大约6dB来增加“砰“声((size)Q值在1.5-2.5比较适合),最后在120Hz降大约4dB((size)Q值1.0)。第二种是当今最流行的“Bonham“摇滚地鼓,我通常在120-240Hz提升4dB或更多来得到这种声音,还需要过滤掉1.5kHz以上的所有 频率 ,有时候可能需要在还有一种现在常用的地鼓:比较空、有摩擦声,想得到这种声音,你可以过滤掉100Hz以下的所有声音,在125Hz提升大约3dB,在250-350Hz提升大约4dB。然后过滤掉2kHz以上的所有 频率 。 2.军鼓: 目前有两种使用最广泛的军鼓类型:一种紧凑、有力,另一种松散、比较长((size)通常用于ballads风格的歌曲)首先,任何军鼓都不需要150Hz以下的声音,所以把它们过滤掉。军鼓的中心 频率 通常在1kHz附近数百Hz的频段内,所以在这一频段提升3

业务领域建模

百般思念 提交于 2019-12-05 15:07:47
领域建模 Collect application domain information focus on the functional requirements – also consider other requirements and documents Brainstorming listing important application domain concepts – listing their properties/attributes – listing their relationships to each other Classifying the domain concepts into: classes – attributes / attribute values – relationships association, inheritance, aggregation Document result using UML class diagram 1 Collect application domain information 我的工程实践题目是《 多人对话场景中音频分离 》,题目要求的任务即说话人区分(Speaker Diarization)任务。说话人区分是声纹识别领域中的一个任务,具体是指根据说话者身份将输入的音频划分为同类片段的过程

业务领域建模

放肆的年华 提交于 2019-11-25 20:34:54
领域建模 Collect application domain information focus on the functional requirements – also consider other requirements and documents Brainstorming listing important application domain concepts – listing their properties/attributes – listing their relationships to each other Classifying the domain concepts into: classes – attributes / attribute values – relationships association, inheritance, aggregation Document result using UML class diagram 1 Collect application domain information 我的工程实践题目是《 多人对话场景中音频分离 》,题目要求的任务即说话人区分(Speaker Diarization)任务。说话人区分是声纹识别领域中的一个任务,具体是指根据说话者身份将输入的音频划分为同类片段的过程