蓝牙耳机开发--提示音制作生成的方法
蓝牙耳机开发--提示音制作生成方法
- 提示音的作用
- 提示音生成方法
- 方法一:TTS语音合成技术
- 方法二:AI音色克隆的方法
- 方法三:录制电脑声音的方法
在蓝牙耳机的开发过程中,往往会使用到各式各样的提示音,这些提示音都发挥着重要作用。不少小伙伴会好奇这些提示音的来源,作为耳机软件工程师,除了在录音室进行实地录音外,还需掌握一套生成提示音的有效方法。本文将详细介绍蓝牙耳机提示音的制作与生成方式,列举几种常见的制作和生成方法,希望能为大家开发提供帮助。
提示音的作用
对于蓝牙音频软件开发者而言,蓝牙耳机中的提示音并不陌生。其主要功能是向用户传达耳机的状态和操作结果。
比如耳机开关机时播放的中文、英文等文字提示音。“开机”、“POWER ON”、“CONNECTED”等等。除此之外可能还会有些tone音(“叮咚”、“滴答”之类的)。
提示音生成方法
方法一:TTS语音合成技术
TTS技术(Text To Speech), 是一项语音合成技术, 使用TTS能够把文字智能地转化为自然语音流. 它通过模拟人类语言的产生过程,将输入的文字信息转换成可以听得懂、流利的汉语口语或其他语言的语音输出。目前国内做的比较好的有科大讯飞、百度语音、腾讯语音云合成、火山TTS引擎, 阿里cosyvoice等。这些公司有比较大的用户基数,可以很方便收集到用户的语音大数据来训练自家的大模型,语音合成相对比较准确。但大公司的TTS一般面向公司业务,这里博主经常会使用一些免费使用的网站进行语音合成。比如在线TTS网站。
使用方法非常简单,以下为例:
只需要在文本框中输入想要合成语音的文字,比如“开机”。
然后在选项框中选择使用的语言、音色、音调、音速等选项即可,设置完成之后点击在线播放或下载声音即可完成语音提示音的生成。如下图
方法二:AI音色克隆的方法
上面方法一所使用TTS技术生成的语音一般语调比较单一,且发音没有什么感情。或客户需要在原来语音的基础上加一个音色接近的新语音。以上情况一般会使用AI音色克隆的方法来生成提示音。
博主一般会使用免费的AI-TTS技术,比如F5-TTS,它结合了多种先进的技术和方法,实现了高性能的文本到语音转换。模型通过训练之后使得F5-TTS能够在没有额外监督的情况下, 通过零样本学习快速生成自然、流畅且忠实于原文的语音。这种AI TTS技术拥有很强的情绪复刻能力,可以完美还原原始人声。F5-TTS hugging face在线体验网站。
使用步骤也比较简单,上传原始音频或电脑现场录制想要克隆的声音,然后输入框填写想要生成的文本信息,点击生成即可。
方法三:录制电脑声音的方法
上面方法一和方法二只适用于文本合成语音的方式生成提示音。如耳机提示音需要使用tone音,这里推荐可以使用Cool Edit、Adobe Audtion等专业音频编辑工具录制电脑播放的声音来制作成提示音。比如音调的tone音很多可以去CSR的ROM Tool工具里面找,这个工具里面有很多的音调,但它只能播放试听,安装目录下没有找到音频源文件。这时我们就需要使用电脑音频录制的方法,将播放的提示音录出来形成文件,放到目标芯片提示音存储空间中。
需要录制电脑中的声音,首先需要设置录制音源的选择,右键进入声音设置->更多声音设置->录制->启用立体声混音。
进入Audition软件,新建一个音频文件后点击录音按钮开始录音。这里点击录音并选择采样率,通道设置等,如下图。
点击了录音进度条开始动了之后就表示已经在开始录制电脑的声音了,此时点击CSR工具上的play播放tone提示音,便能将电脑播放的提示音录制出来了,这时点击录音停止即可播放刚才录制出来的声音。