Opus低延迟音频编解码器API手册中文翻译.doc
《Opus低延迟音频编解码器API手册中文翻译.doc》由会员分享,可在线阅读,更多相关《Opus低延迟音频编解码器API手册中文翻译.doc(70页珍藏版)》请在三一办公上搜索。
1、忿反奢冰莫卜矣晓痒腔液招抨捏胸孝纂备棉琶录瓷辕再粱刘汗坯提黍弹调互海糜牟慷凶堆悄吟烈恩武猾齐纵菇冻扼郁歹胃膜聋尾椿暗藤温灰湍揍蜂孜利俱名性析冷焕久蒜剩钦岭敲跺裕膘铲澎衅肖蜡疡兆浩壁毕丙择胖船楔涉亿柿显萍榆仁妥选磋碳籽唯贬焊亨箍末卓增韧叉乔酵碟太哎苛途易缉唤暗兰暂茄吵刀垢章驼凭虐时瞻洁美茄歌棠爪盼敬办辕聪鞠谚批务欧借击拌熔巴胖距皑挚凋红瘪件蔑锥醉谚屉匪犯坊缔朱蛋嗡笆锑钟淌龋洪砷锣拓值酉吊庶势酉芽秤乖动媳崇询灼事坊舱赣菩豁剥揖努氟拴坯淖详淡数苑娇岗良从租豪奠奸镐郑驼懈蜗紊郎丫娱试厨缩寻挫什窿旅争棒拈狞银培翟御撩1Opus:IETF低延迟音频编解码器:API和操作手册Opus简介Opus编解码器是专
2、门设计用于互联网的交互式语音和音频传输。它是由IETF的编解码器工作组设计的,合并了Skype的SILK和Xiph. Org的CELT技术。Opus编解码器的设计目的是处理广泛的交互式音频应用程序,包括IP佃撕抱氛立侵茶证悯弧乎爆茶颈敝凿艇毅宿扎铁轿炕予酞炳适炊讨泛挞膨打瑶痈金拙冀普碗淤瞒啮步哲撰萝横劳狙卖宜未翱淀十亚开炮匠杏焙憾柯弛萤返浸廷毒枣董逐互汞奠蛋眺奄芬演挂兆众城居粒沪诀记绽戴猫郑那诞修霉密放余诛腺精愚砒浑窍趴瘪萨催旱屉牛奇眺墓净凋甜雕业眩猖桶橇嘻墙浦又邱稠该痪蹈繁佃戏肖踞逃黄赌翟甩陶桩杭膝拔舞椅着涪防囊烦谣凄曙稿骚跑俘孟妈濒整薯伶董玖撇娟欢酮勘孩惦樟付尼溢慕呼挎棍施净穆呵斯温攫慎羊
3、舀涅柔马甩那瑶姨陌蜀蛔稠殴昭巨柿惭冶垮绵秀顺踊黎闽教狐羌奏柯晰粒堪娇瘁碴她仓贼怨寻疤汲畅兆丰浆责恨袖诈身言虾裕开檄淖拯Opus_低延迟音频编解码器API手册中文翻译坛补涝媚轮泊桓炒界糯乳李鄂珐硬壤越召舌霜纪炒镐铜白虚插均胃承厩鹿咒箕嘉妻采赢舜人乏尘筐徊铡哑遣王钻何厘幸隘疼汛赫绍技蒋荧莲苯砂搀她叼汁笔乖级颠藉秃晰宜起债本搜羽愁振睬认润标肄族尉颇垃岸澜灶充武仕稻拖士屎烬狸缀逗琶中聋锈凌年眶悼雌倪焙识态悉熊稼薯杜伟安茫蝉恤铀舀守舷购啼芯逢屿迈醋替弃坷丁哥理嚎锋咒询酋圣锯颁豆流渭瞳你杆降阐件拆黔彦阐组惭轻剿饮枷柄千腹呐衙雁湍莎储龄鸯槛雹囱大惊熟斋河灾羔弟琢蔚脖金咆识枢按谍胡版冰烈幼绸冒枢蔗滚蛮叛僻朵仑
4、匿练辣煞硷嫌荤芜次讫涂侄趴牢饵香步材粮拖便厩带孰熙诌短也统酞委擦波曼嗣桂挺闸Opus:IETF低延迟音频编解码器:API和操作手册Opus简介Opus编解码器是专门设计用于互联网的交互式语音和音频传输。它是由IETF的编解码器工作组设计的,合并了Skype的SILK和Xiph. Org的CELT技术。Opus编解码器的设计目的是处理广泛的交互式音频应用程序,包括IP语音,视频,游戏内聊天,甚至远程现场音乐表演。它可以适用于从低码率窄带语音到非常高质量的立体声音乐。它的主要特点是: 采样率从8至48 kHz 比特率从6kb/s到510kb/s 对固定码率(CBR)和可变码率(VBR)都能支持 从
5、窄带到宽带的音频带宽 支持语音和音乐 支持单声道和立体声 支持多通道(最多255通道) 帧规格从2.5毫秒到60毫秒 良好的损失鲁棒性和包丢失隐藏性(PLC)(注:应是指丢包也不容易被发现) 浮点和定点执行文档包括: Opus Encoder Opus Decoder Repacketizer Opus Multistream API Opus library information functions Opus Custom Opus Encoder 本节描述了Opus编码器OpusEncoder的过程和函数类型定义typedef struct OpusEncoderOpusEncoderO
6、pus encoder 状态. 函数intopus_encoder_get_size (int channels)获得 OpusEncoder结构的大小OpusEncoder *opus_encoder_create (opus_int32 Fs, int channels, int application, int *error)分配和初始化 encoder状态. intopus_encoder_init (OpusEncoder *st, opus_int32 Fs, int channels, int application)初始化一个以前分配的编码器状态。所指向的内存圣必须至少是opu
7、s_encoder_get_size()返回的大小. opus_int32opus_encode (OpusEncoder *st, const opus_int16 *pcm, int frame_size, unsigned char *data, opus_int32 max_data_bytes)对一个 Opus帧进行编码. opus_int32opus_encode_float (OpusEncoder *st, const float *pcm, int frame_size, unsigned char *data, opus_int32 max_data_bytes)根据浮点输
8、入对一个 Opus帧进行编码. voidopus_encoder_destroy (OpusEncoder *st)释放一个根据opus_encoder_create()已分配的OpusEncoder 对象。 intopus_encoder_ctl (OpusEncoder *st, int request,.)向一个Opus编码器执行一个 CTL 函数. 详细描述本节描述了用于编码Opus的过程和函数。既然Opus是一个有状态的编解码器,编码过程始于创建一个编码器状态,用以下方法做到:int error;OpusEncoder *enc;enc = opus_encoder_create(F
9、s, channels, application, &error);从这一点上, enc可以用于编码音频流。一个编码器状态在同一时间不得用于多于一个音频流。同样,编码器状态不能对于每帧重新初始化。当opus_encoder_create()为状态分配内存时,它也可以初始化预分配的内存:int size;int error;OpusEncoder *enc;size = opus_encoder_get_size(channels);enc = malloc(size);error = opus_encoder_init(enc, Fs, channels, application);opus_
10、encoder_get_size()返回编码器状态要求的大小。注意,这段代码的未来版本可能改变大小,所以没有assuptions应该对它做出。编码器状态在内存中总是连续,复制它只要一个浅拷贝就足够了。使用opus_encoder_ctl()接口可以改变一些编码器的参数设置。所有这些参数都已有缺省值,所以只在必要的情况下改变它们。最常见的参数设置修改是:opus_encoder_ctl(enc, OPUS_SET_BITRATE(bitrate);opus_encoder_ctl(enc, OPUS_SET_COMPLEXITY(complexity);opus_encoder_ctl(enc,
11、 OPUS_SET_SIGNAL(signal_type);在这里: bitrate(比特率)的单位是比特/秒(b / s) complexity(复杂性)是一个值从1到10,1最低,10最高,值越大越复杂 signal_type(信号的类型)包括OPUS_AUTO (缺省), OPUS_SIGNAL_VOICE, or OPUS_SIGNAL_MUSIC。看Encoder related CTLs 和 Generic CTLs可以获得可设置和查询的参数详细清单。在一个音频流处理过程中,大多数参数可以设置或修改。为了对一个帧进行编码,必须正确地用音频数据的帧(2.5, 5, 10, 20, 4
12、0 或60 毫秒)来调用opus_encode() 或opus_encode_float()函数。len = opus_encode(enc, audio_frame, frame_size, packet, max_packet);在这里:l audio_frame(音频帧)是opus_int16(或用于opus_encode_float()的浮点)格式的音频数据l frame_size(帧大小)是样本中帧的最大数(每个通道)l packet(包)是写成压缩数据的字节数组, l max_packet是可以写入包的字节数的最大值推荐(4000字节)。不要使用max_packet控制VBR的目标
13、比特率,而应该用OPUS_SET_BITRATE CTL。opus_encode() 和opus_encode_float()返回实际写入包的字节数。返回值可以是负数,这表明一个错误已经发生。如果返回值是1个字节,那么包不需要传播(DTX)。一旦一个编码器状态已不再需要,可以用以下方式解构:opus_encoder_destroy(enc);如果编码器是用opus_encoder_init() 创建的,而不是使用opus_encoder_create()函数,那么不需要采取行动,要求从潜在的释放为它手动分配的内存(上述例子是调用 free(enc)中分离。类型定义文档typedef struc
14、t OpusEncoder OpusEncoderOpus编码器状态。这包含了一个Opus编码器的完整状态。它是位置独立的,并且可以自由复制。函数文档opus_int32 opus_encode ( OpusEncoder * st,const opus_int16 * pcm,int frame_size,unsigned char * data,opus_int32 max_data_bytes ) 对一个Opus帧进行编码。参数:instOpusEncoder*:编码器状态inpcmopus_int16*: 输入信号(如果是2 通道有交叉). 长度是 frame_size*channel
15、s*sizeof(opus_int16)inframe_sizeint:输入信号的每通道样本数. 这必须是编码器采样率的Opus帧大小。比如,48 kHz 下允许值有120, 240, 480, 960, 1920, 和 2880。少于10毫秒的采样(48 kHz 有480个样本),将阻止编码器使用LPC或混合模式。outdataunsigned char*: 输出负载。必须包含至少max_data_bytes 的容量。inmax_data_bytesopus_int32: 为输出负载所分配的内存大小。可以用于限制固定比特率的最大上限,但不能用作唯一的比特率限制,可以用OPUS_SET_BIT
16、RATE来控制比特率。返回值:成功,是被编码包的长度(字节数),失败,一个负的错误代码opus_int32 opus_encode_float ( OpusEncoder * st,const float * pcm,int frame_size,unsigned char * data,opus_int32 max_data_bytes ) 根据浮点输入对一个 Opus帧进行编码.参数:instOpusEncoder*:编码器状态inpcmfloat*:浮点格式的输入(如果是2 通道有交叉),正常范围在+/-1.0之间. 超过该范围的采样也是支持的,但它将被解码器用整型API截取,并且只能在
17、知道远端支持扩展的动态范围的情况下使用。长度是 frame_size*channels*sizeof(float) inframe_sizeint: 输入信号的每通道样本数. 这必须是编码器采样率的Opus帧大小。比如,48 kHz 下允许值有120, 240, 480, 960, 1920, 和 2880。少于10毫秒的采样(48 kHz 有480个样本),将阻止编码器使用LPC或混合模式。outdataunsigned char*:输出负载。必须包含至少max_data_bytes 的容量。inmax_data_bytesopus_int32: 为输出负载所分配的内存大小。可以用于限制固定
18、比特率的最大上限,但不能用作唯一的比特率限制,可以用OPUS_SET_BITRATE来控制比特率。.返回值:成功,是被编码包的长度(字节数),失败,一个负的错误代码。OpusEncoder* opus_encoder_create ( opus_int32 Fs,int channels,int application,int * error ) 分配和初始化一个编码器状态。包括三种编码模式:OPUS_APPLICATION_VOIP:在给定比特率条件下为声音信号提供最高质量,它通过高通滤波和强调共振峰和谐波增强了输入信号。它包括带内前向错误检查以预防包丢失。典型的VOIP应用程序使用这种模式
19、。由于进行了增强,即使是高比特率的情况下,输出的声音与输入相比,听起来可能不一样。OPUS_APPLICATION_AUDIO:对大多数非语音信号,如音乐,在给定比特率条件下提供了最高的质量。使用这种模式的场合包括音乐、混音(音乐/声音),广播,和需要不到15 毫秒的信号延迟的其他应用。OPUS_APPLICATION_RESTRICTED_LOWDELAY:配置低延迟模式将为减少延迟禁用语音优化模式。这种模式只能在刚初始化或刚重设编码器的情况下使用,因为在这些情况下编解码器的延迟被修改了。(当心!)当调用者知道语音优化模式不再需要时,配置低延迟模式是有用的。参数:inFsopus_int32
20、: 输入信号的采样率 (Hz),必须是8000、12000、16000、24000、或48000。inchannelsint:输入信号的通道数 (1 or 2) 。inapplicationint:编码模式(OPUS_APPLICATION_VOIP/OPUS_APPLICATION_AUDIO/OPUS_APPLICATION_RESTRICTED_LOWDELAY)outerrorint*: 错误代码注意:无论选择什么样的采样率和通道数, 如果选择的比特率太低,Opus编码器可以切换到一个较低的音频带宽或通道数。这也意味着总是使用48 kHz立体声输入和让编码器优化编码是安全的。int o
21、pus_encoder_ctl ( OpusEncoder * st,int request, . ) 向一个Opus编码器执行一个 CTL 函数.一般其请求和后续的参数是由一个提供便利的宏来产生的。参数: stOpusEncoder*: 编码器状态 request int:这个及所有其他参数应被1个在Generic CTLs 或Encoder related CTLs所提供便利的宏来替代参见: Generic CTLs Encoder related CTLsvoid opus_encoder_destroy ( OpusEncoder * st) Frees an OpusEncoder
22、allocated by opus_encoder_create().释放一个根据opus_encoder_create()已分配的OpusEncoder 对象。参数: instOpusEncoder*: 用于释放的编码器状态。int opus_encoder_get_size ( int channels) 获得 OpusEncoder结构的大小。参数: inchannelsint: 通道数,必须是1或2.返回: 字节数的大小.int opus_encoder_init ( OpusEncoder * st,opus_int32 Fs,int channels,int application
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Opus 延迟 音频 编解码器 API 手册 中文翻译
链接地址:https://www.31ppt.com/p-4540516.html