语音产品分类 新闻资讯 语音产品 语音方案及技术服务 语音芯片操作视频 语音芯片与语音模块资料下载中心 网站留言 客服服务
 站内搜索
新闻资讯

公司动态
行业资讯
操作视频
文娱活动
 
我司其他平台
 
 首页 >> 新闻资讯 >> 详细内容 
 
语音芯片常用语音格式
发布日期:2012-2-17  浏览次数:3532 

语音芯片的声音应用方面,市面上主流的语音格式如下:

  PCM格式: Pulse Code Modulation 脉冲编码调制,它将声音模拟信号采样后得到量化后的语音数据,是最基本最原始的一种语音格式。同它极为类似的还有RAW格式和SND格式。它们都是纯语音格式。

  WAV格式:Wave Audio Files 是微软公司开发的一种声音文件格式,也叫波形声音文件,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,但WAV格式对存储空间需求太大不便于交流和传播。WAV文件里面存放的每一块数据都有自己独立的标识,通过这些标识可以告诉用户究竟这是什么数据,这些数据包括采样频率和位数,单声道(mono)还是立体声(stero)等。

  ADPCM格式:是利用对过去的几个抽样值来预测当前输入的样值,并使其具有自适应的预测功能与实际检测值进行比较,随时对测得的差值自动进行量化级差的处理,使之始终保持与信号同步变化。它适用于语音变化率适中的情况,而且声音回放过程简短。它的优点是对于人声的处理比较逼真,一般达到90%以上,已广泛地应用于电话通信领域。

  MP3格式: Moving Picture Experts Group Audio Layer III,简称为MP3。它是利用 MPEG Audio Layer 3 的技术,采取了名为“感官编码技术”的编码算法:编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的mp3文件,并使压缩后的文件在回放时能够达到较接近原音源的声音效果。它的实质是vbr(Variant Bitrate 可变波特率)可以根据编码的内容动态地选择合适的波特率,因此编码的结果是在保证了音质的同时又照顾了文件的大小。

  mp3压缩率10倍甚至12倍。是最初出现的一种高压缩率的语音格式。

  Linear Scale格式:根据声音的变化率大小,把声音分成若干段,对每段用线性比例进行压缩,但是它的比例是可变的。

  Logpcm格式:基本上对整个声音进行线性压缩,将最后若干位去掉。这种压缩方式在硬件上很容易实现,但音质比Linear Scale差一些,特别是音量较小声音比较细腻的情况下效果较差。主要用于pure speech方面。

趋势预测

    随着社会的多元化,语音素材必定会走向多元化。语音DIY是个必然的趋势,势必推动嵌入语音芯片设备与电脑的兼容性,因此wav 和MP3格式将边的更加广泛。

相关文章:
    声音芯片是什么?

 
关闭本页
 
关于唯创 | 论坛 | 客服 | 人才招聘 |隐私申明 | 联系我们 |网站地图
版权所有:广州唯创电子有限公司  粤ICP备11041646号-2  粤公网安备 44010602001737号   
未经许可,禁止转载、摘编、复制、镜像