科技成果信息征集表“科创中国”平台科技成果产业化方案.docx
《科技成果信息征集表“科创中国”平台科技成果产业化方案.docx》由会员分享,可在线阅读,更多相关《科技成果信息征集表“科创中国”平台科技成果产业化方案.docx(12页珍藏版)》请在三一办公上搜索。
1、附件:科技成果信息征集表科创中国平台科技成果产业化方案成果简介本项目突破了远场复杂声学场景下语音交互的声学感知和语义理解关键技术,融合了基于经典阵列信号处理的模型驱动算法和基于深度学习的数据驱动算法,开发出具有自主知识产权的远场声学信息人机交互系统和平台,提高了远场人机交互质量和用户体验,促进了人工智能技术在声学信息交互领域的落地。本项目的推广应用产生了重大的经济效益和社会效益,技术成果在智能音箱、Al数字人红外测温与监管系统、智慧电梯与安全监管平台等多个领域获得成功应用,服务海内外包括中国移动、华为、百度、小米、阿里、腾讯等120家企业,拥有4000多万用户,产生直接经济效益超1.6亿。项目
2、成果应用于冬奥会和冬残奥会、冬奥测试赛、联合国COPI5大会、建党100周年、中国服贸会、中国科博会和中关村论坛等北京市和国家重点项目,为抗击新冠疫情作出了突出贡献,获得工信部突出贡献企业表彰,入选工信部Al助力疫情防控重点物资清单,有广阔的发展和应用前景,潜在经济效益巨大,并在公共安全、疫情防控、金融、教育等国计民生重要领域示范应用。技术亮点声学信息人机交互对人工智能产业发展具有重要战略意义,远场交互是声学信息人机交互产业的创新升级方向。从近场交互到远场交互,噪声、混响、回声等干扰带来了语音识别、语义理解等难题,亟需攻克。本项目面向声学信息人机交互产业落地的重大需求,突破了多项远场语音交互的
3、声学感知和语义理解关键技术,构建了阵列信号处理融合深度学习的先进声学模型和通用语义理解模型,形成了涵盖麦克风阵列、前端声学处理、语音唤醒、语音识另IJ、语义理解、语音合成等技术深度融合的端+云一体化系统,大幅提窗了系统泛化能力和识别精度,促使我国智能产品万物互联现象级产业直接对标超越欧美标杆企业。主要技术创新点:L提出了不同场景下低复杂度稳健的时领域自适应滤波算法,解决了高度依赖双端对讲检测、收敛速度慢等难题,实现了单通道和多通道回声抵消系统应用。2 .提出了基于麦克风阵列噪声消除和盲源分离等方法,建立了带噪语音的特征修复技术,去除了人声及背景噪声干扰,大幅提升了系统的识别性能。3 .提出了抗
4、混响、抗干扰的低复杂度声源定位方法,有效解决了复杂声学环境特别是电梯、家居、会议室等场景的声源定位问题。4 .提出了加权有限状态转换机解码图唤醒算法,实现了多个声学模型深度融合的在线语音识别引擎,提高了系统在各种环境下语音识别、唤醒的性能。5 .提出了基于用户对话交互历史的词汇-领域词库映射算法、领域感知的词向量训练算法,提高了领域识别精度,提升了信息交互的流畅度与准确性。应用前景本项目在国家科技支撑计划等课题支持下,开发出具有自主知识产权的全球领先的远场声学信息人机交互系统,技术成果形成了智能音箱、AI数字人红外测温与监管系统、智慧电梯与安全监管平台等产品在多个领域落地应用,占据了全球70%
5、以上的中文远场智能语音市场。本项目获授权发明专利44项、实用新型专利37项、软件著作权61项,发表论文135篇,参与制定国家标准15项、团体标准15项,产生直接经济效益超1.6亿。本项目促进了人工智能技术的推广应用,产品覆盖家居、会议、军工、医疗、交通等行业,服务120多家企业,拥有4000多万用户,数十亿次人机交互真实场景的规模验证,服务海内外客户包括中国移动、华为、百度、小米、阿里、腾讯等。实现了先进的智能交互体验,有力促进了北京建设具有全球影响力的科技创新中心。本项目产品在抗击新冠疫情期间作出了突出贡献,获得工信部突出贡献企业表彰,入选工信部Al助力疫情防控重点物资清单。团队概括声智是第
6、二批国家级“专精特新”小巨人企业、北京市中关村瞪羚企业、工信部抗疫突出贡献人工智能企业、国家高新和“双软”技术企业、中关村前沿技术和中关村高新企业、北京市知识产权示范和试点企业、人工智能知识产权百强企业、人工智能百强企业、AI最佳雇主企业、AAA信用和纳税A级企业等。声智核心团队以智能听觉技术为特色,建立了声学与人工智能两个核心研发团队,在声学信号处理与深度学习融合研究方面具有深厚积累,形成了以远场声学信息交互技术为核心的全球竞争优势,入选“科创中国”先导技术榜1项,荣获北京市科技进步奖和吴文俊人工智能奖,获得2项中国发明专利优秀奖和3项地区发明专利奖。具体核心人员如下:陈孝良,CEO,研究员
7、,中科院声学所博士,声学和人工智能技术专家。李良斌,CTO,负责核心技术研究,中科院声学所博士,语音与语言理解专家。常乐,CKO,负责知识产权建设,中科院声学所硕士。2017/2018福布斯亚洲30U30精英,2017/2018胡润30X30创业领袖。李智勇,CDO,负责开发框架研发与运营,北京大学硕士,曾任联想资深战略专家,奇虎360战略分析师。古擘,CGO,负责商务合作与市场开拓,北京大学硕士,曾任杜比实验室大客户销售总监。(一)陈孝良陈孝良,工学博士,研究员,男,汉族,出生于1980年6月,曾任中国科学院声学研究所副研究员和信息办主任,上海高等研究院客座副教授。现任北京声智科技有限公司创
8、始人、董事长兼CEO。现担任计算机学会语音对话与听觉专委会常务委员,中国声学学会声频工程分会委员,中国人工智能和大数据专家委员,计算机学会高级会员IEEEACWASA/AES会员。荣获自然科学奖励2项,发表文章35篇,主持或参与标准15项,获得国内外授权发明专利105件。2010年度获得中国科学院院长优秀奖,2017年度获得中关村高端领军人才称号,2020年进入中国商业最具创意人物100榜单。目前研究兴趣主要是结合声学、人工智能和计算机通信等交叉学科的成果和进展,开展多模态和多技能人工智能技术的研究和应用,包括声视频压缩感知、声纹语音识别和多技能语言理解等交叉学科的融合技术研究。目前共主持研究
9、项目5项,曾参加海军某重大项目、中科院重大创新项目、863课题、中国电科院重大项目等数项研究课题。(二)李良斌技术骨干,Al算法团队主管,中科院声学所博士,主要研究方向为语音及语言处理、机器学习算法、以及分布式大数据计算框架。曾任阿里巴巴机器学习平台(PAl)及iDST团队核心开发工程师,所研产品服务于阿里集团广告、搜索、推荐等数十个核心应用。曾参与国家863课题、国家自然科学基金青年基金项目等,发表SCI、El论文2篇,申请专利10项。产生的效益声智科技是国内自主原创远场语音技术的开拓者,作为全球领先的远场智能交互平台提供商,其基于远场声学信息人机交互技术开发的产品及解决方案,己广泛运用于智
10、慧城市、智能家居、智慧金融、智慧安防、智慧金融、智慧医疗、智慧零售、智慧教育、智慧交通等领域,己经过千亿次人机交互真实场景的规模验证,支持智能音箱、智慧电梯、智能耳机、智能屏、机器人、AI虚拟数字人、AI音视频会议、AI语音助理等百余个场景实例,提供高效的人机交互和智能决策能力,实现体现技术创新和管理创新的市场价值。在智能家居领域,累计装机2000多万台产品,系统调用近2亿次,占据全球70%以上中文远场语音交互系统,促使我国在智能音箱这一未来万物互联现象级人口产业直接对标美国亚马逊等企业。服务于小米、百度、阿里、华为、腾讯、中国移动、中国电信、中国联通、奇虎360、万科、宝洁、中央人民广播电台
11、、联想、创维、金蝶、浪潮、国美等数百家国内外知名客户,推动了国内智能家居智能产品的爆发。StrategyAnalytics和Canalys统计数据显示,2019年,全球智能音箱市场达到1.469亿台,较2018年增长70机根据奥维云网(AVC)推总数据,2020年一季度中国智能音箱市场销量为884.4万台,同比增长23.0%;销额为16.7亿元,同比增长21.9%。其中2020年一季度智能音箱市场主要品牌百度、阿里、小米中,小米AT音箱、小爱音箱mini、小爱音箱HD、阿里巴巴天猫精灵魔盒、百度智能音箱均采用该项目麦克风阵列模组及语音识别等技术。在行业应用领域,该技术成果已形成了AT数字人红外
12、测温与监管系统、智慧电梯与安全监管平台、多屏语音搜索与智能调度系统、AI外呼机器人、跟随式智能扩声机器人、智慧办公/医疗屏多数十种行业解决方案。该技术成果凭借在拓展性和架构上的优势,快速实现了测温系统的场景落地,形成了以智能语音为核心的AI数字人红外测温系统,可通过语音实现对话、通话、内容服务和IoT控制,支并且支持多台设备联网组成更大规模在线防疫系统,可广泛应用于闸机、考勤、前台、大厦、机场、车站和港口等公共场所场景。该成果还与疫情期间快速形成了智慧电梯系统,提供完整的AT语音模组开发板,内置针对电梯封闭场景的优化语音算法,简单连接开发即可与电梯系统形成联动,乘客无需触摸按键,即可语音呼叫、
13、控制电梯。AI泛化算法支持乘客使用方言及任意说法语音,呼叫与控制电梯升降楼层,且支持语音播报提醒、免唤醒多轮对话等功能,即使残障人士、老年人也能无障碍使用。转化方式该项目的联合创新和商业化布局使得声智科技迅速在行业内占据领先地位,成为全球最大的远场语音智能技术和平台服务商之一。在声学感知技术方面,项目团队拥有数十年的深耕和积累,面向新兴行业的智能化升级,针对实际应用场景快速升级优化关键技术,收集、存储数据,逐渐形成了极具优势的技术与数据壁垒。并通过制定合理的R&D资源配置体系,使得在人工智能关键源头技术领域可以早布局、早落地,完善远场声学人机信息交互技术产业链上下游协作,形成完整的技术系统与产
14、学研闭环生态链条,面向全球逐步构筑人工智能原创技术核心竞争力,支撑北京国家新一代人工智能创新发展试验区建设,累计带动产业链条经济效益超过百亿元。该项目促进在京科研院所与高科技独角兽企业联合科研攻关卡脖子技术;为小米、百度等北京市行业巨头提供了前沿技术研发支撑,带动北京市众多下游人工智能领域中小企业发展,对加强建设北京市全国科技创新中心作出了突出贡献。人才培养方面,中国科学院声学研究所与声智科技联合成立的“声学与人工智能联合实验室”,培养了一批在多传感器融合、深度学习、大数据、自然语音理解、声学等人工智能和物理声学交叉学科融合的高端技术专业人才。声智科技与百度联合推出的远场语音交互开发板Soun
15、dAT,已与清华大学等高校合作,提供智能硬件课程的教具,培养声学领域和人工智能领域的关键人才。北京建筑大学的“建筑全过程”国家级虚拟仿真实验教学中心,推动研发“厅堂混响时间互动”等建筑环境虚拟互动教学程序共计7项,培养本校学生460人次/年,协助各类线上教学平台教授超2200人次/年,在建筑相关专业教育领域中起到了较广泛的示范作用。“科创中国平台科技成果综合评价报告成果名称远场声学信息人机交互关键技术及其应用分类人工智能匕U屋MA北京市声智科技有限公司联系人潘贝贝电话成果简介本项目突破了远场狂杂声学场景下语音交互的声学感知和语义理解关键技术,融合了基于经典阵列信号处理的模型驱动算法和基于深度学
16、习的数据驱动算法,开发出具有自主知识产权的远场声学信息人机交互系统和平台,提高了远场人机交互质量和用户体验,促进了人工智能技术在声学信息交互领域的落地。本项目的推广应用产生了重大的经济效益和社会效益,技术成果在智能音箱、Al数字人红外测温与监管系统、智慧电梯与安全监管平台等多个领域获得成功应用,服务海内外包括中国移动、华为、百度、小米、阿里、腾讯等120家企业,拥有4000多万用户,产生直接经济效益超1.6亿。项目成果应用于冬奥会和冬残奥会、冬奥测试赛、联合国COPI5大会、建党100周年、中国服贸会、中国科博会和中关村论坛等北京市和国家重点项目,为抗击新冠疫情作出了突出贡献,获得工信部突出贡
17、献企业表彰,入选工信部AT助力疫情防控重点物资清单,有广阔的发展和应用前景,潜在经济效益巨大,并在公共安全、疫情防控、金融、教育等国计民生重要领域示范应用。创新水平关键共性技术O前沿引领技术现代工程技术C)颠覆性技术C)其他C)技术进度新设备或新装置原理样机C)工程样机。中试原型机。产业化新材料或新技术实验室阶段O工程化阶段C)产业化阶段技术成果国际专利口国家专利M专利编号1. 基于回声频谱估计和语音存在概率的立体声回声抵消方法ZL.72. 一种非平稳噪声环境下传声器阵列的语音增强方法ZL.23. 一种用于通信系统中的回声抵消方法ZL.74. 基于磁流体散热的双线圈单动磁体结构的惯性式激振器Z
18、L.75. 一种用于抑制啸叫的扬声器阵列扩声系统及方法ZL.36 .一种波达方向估计方法和装置ZL7 .语音唤醒方法、装置、电子设备及存储介质ZL.98 .在线语音识别引擎及识别方法ZL.89 .基于历史数据及机器学习自适应获取词库领域的方法及系ZL610 .一种智能设备的词向量训练方法及装置L.7国际奖项国家奖项IZI奖项名称北京市科学进步奖吴文俊人工智能科技进步奖中国专利优秀奖产品方向有多个应用方向有一个应用方向。没有应用方向C)无法判断C)市场空间需求前景巨大需求前景较大O需求前景一般C)无法判断C)成本竞争优势明显优势一般。没有优势。无法判断。政策影响政策鼓励政策限制C)政策淘汰O无法
19、判断C)市场周期进入期C)成长期饱和期C)衰退期C)无法判断O转化周期近期可控(1年内)v周期较长(2年内)。很难转化(3年起)。无法判断。科技成果的创新基因评价(不少于150字)陈孝良博士在2016年创建了声智科技,近三年营业收入复合增长率达到244.85%,纳税复合增长率达到316.58%,2021年净利7631万,近两年累计净利超过1千万,成为人工智能行业中的盈利企业。陈孝良博士是声学研究员和人工智能行业专家,主要研究领域是声信号处理、声视频压缩感知、阵列并行计算、声与人工智能融合,在国内较早提出基于GPU的声学信号并行计算研究方向,解决了远场声学信息交互技术在真实场景中的关键问题,推动
20、了远场语音交互技术在机器人和智能音箱的大规模商用。陈孝良博士带队突破了端边云高性能数据汇聚和异构数据融合计算技术,主导了多模态与多技能人工智能开发框架的研发,服务了北京冬奥会和冬残奥会、北京环球影城等国家重大项目,获得15封感谢信,同时支持了北京新冠抗疫和流调等平台,获得18面锦旗。陈孝良博士是中关村高等领军人才,获得中国科学院院长优秀奖、北京市科技进步奖、中国发明专利优秀奖、中国人工智能金雁奖等荣誉,带领公司入选科创中国先导技术榜单,获得吴文俊人工智能奖。陈孝良博士担任计算机学会、声学学会、人工智能学会、北京声学学会等理事和委员,以及北京海淀区工商联副主席等职务。声智是第二批国家级“专精特新
21、”小巨人企业、北京市中关村瞪羚企业、工信部抗疫突出贡献人工智能企业、国家高新和“双软”技术企业、中关村前沿技术和中关村高新企业、北京市知识产权示范和试点企业、人工智能知识产权百强企业、人工智能百强企业、Al最佳雇主企业、AAA信用和纳税A级企业等。声智核心团队以智能听觉技术为特色,建立了声学与人工智能两个核心研发团队,在声学信号处理与深度学习融合研究方面具有深厚积累,形成了以远场声学信息交互技术为核心的全球竞争优势,入选“科创中国”先导技术榜1项,荣获北京市科技进步奖和吴文俊人工智能奖,获得2项中国发明专利优秀奖和3项地区发明专利奖。具体核心人员如下:陈孝良,CEO,研究员,中科院声学所博士,
22、声学和人工智能技术专家。李良斌,CTO,负责核心技术研究,中科院声学所博士,语音与语言理解专家。常乐,CKO,负责知识产权建设,中科院声学所硕士。2017/2018福布斯亚洲30U30精英,2017/2018胡润30X30创业领袖。李智勇,CDO,负责开发框架研发与运营,北京大学硕士,曾任联想资深战略专家,奇虎360战略分析师。古擘,CGO,负责商务合作与市场开拓,北京大学硕士,曾任杜比实验室大客户销售总监。科技成果的装采亮点评价(不少于150字)创新点1:针对单通道和多通道回声抵消的不同应用场景,提出了一系列低复杂度稳健的时域、子带和频域的自适应流波算法。解决了以往的算法高度依赖双端对讲检测
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 科技成果 信息 征集 中国 平台 产业化 方案
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-2873309.html