1.一种获取纯净语音的录音方法,其特征在于,所述方法包括以下步骤:
1)用户将需要录音的文本输入语音合成引擎TTS,并选定一个音色参数;
2)收到语音合成TTS引擎输出的合成音频,逐帧进行Fourier变换,生成频域系数;
3)计算该帧频谱能量,即频域系数平方求和;
4)基于能量系数对该帧进行清音浊音检测,如果是清音,则跳到步骤6),否则进行步骤
5);.
5)对浊音帧频谱能量的部分共振峰系数(F3、F4、F5)使用用户事先录制的用户自身的浊音频谱共振峰系数(F3、F4、F5)代替,得到修正的该帧频谱能量系数;
6)该帧频谱能量系数使用Griffin-lem算法处理生成频域系数;
7)对该帧频域系数进行反Fourier变换恢复成时域语音信号。
2.如权利要求1所述的一种获取纯净语音的录音方法,其特征在于,所述步骤1)中,选定的音色参数是使用录音室级的纯净采样合成语音的音色。