智能庭审转写系统解决方案.docx
《智能庭审转写系统解决方案.docx》由会员分享,可在线阅读,更多相关《智能庭审转写系统解决方案.docx(20页珍藏版)》请在三一办公上搜索。
1、智能庭审转写系统解决方案目 录1 背景概述42 系统架构52.1 逻辑架构52.2 物理架构63 功能描述73.1 灵云智能庭审转写系统73.1.1创建庭审73.1.2关键词优化83.1.3庭审实时转写93.1.4历史庭审记录回听103.1.5庭审状态控制113.1.6庭审信息自动播报113.1.7导出/打印/保存123.2 灵云全智能能力平台介绍133.2.1语音合成143.2.2语音识别144 系统的益处与价值175 技术要求185.1 软硬件配置清单185.2 软硬件性能要求185.2.1软件参数185.2.2硬件参数191 背景概述当前,随着人工智能技术的不断发展和应用普及,针对多人连
2、续语音的识别应用已经十分成熟。将人工智能应用到庭审实时识别转写场景下,改变当前的庭审纪要模式,实现在庭审过程中对审判长、原告、被告、犯罪嫌疑人、证人等各方陈述的内容自动实时识别成文字,能够成倍提升庭审的效率,并将大幅减轻书记员的工作强度和压力。而且部分庭审信息量大、讨论问题多、庭审时间长等要素,人工记录很难做到完全保存庭审信息,这时灵云智能庭审转写系统能够做到记录整个庭审过程全量信息,从而体现出巨大的实用价值。2 系统架构2.1 逻辑架构灵云智能庭审转写系统的逻辑框架如下图所示。图1系统逻辑架构系统依托于灵云全智能能力平台提供的语音识别(ASR)和语音合成(TTS)能力,主要包括采音模块、业务
3、系统和存储模块三部分:1) 采音模块:主要通过麦克风及USB声卡等硬件采集庭审音频数据。2) 业务系统:该系统为书记员等提供实时的语音识别文本展现、相关资料展现和庭审流程中各种基础处理功能,便于相关人员便捷实用系统,提高工作效率。3) 存储模块:将业务相关数据存储于Redis数据库、Oracle数据库和文件服务器中,根据实际业务情况提供能力支撑和应用服务。2.2 物理架构灵云智能庭审转写系统的物理框架如下图所示。图2 系统部署架构系统物理框架首先需要在法院内网服务器上搭建语音平台,并且针对单个法庭需要新增一台专用采集设备和一台Windows电脑,Windows电脑要能够与语音能力平台服务器相连
4、接。具体系统流程如下:1) 法庭内的N个麦克风通过并线连接采音设备,采音设备实现将模拟信号音频转换为数字信号,通过USB连线与局域网内的Windows电脑相连接,将音频输出到台式机上。2) 在书记员电脑上安装录音软件负责把采音设备采集到的数字信号通过法院内网发送给后台语音识别服务器。3) 语音识别服务器负责将音频识别为文字,发送给书记员电脑上的网页端法庭系统。4) 书记员通过网页端法庭系统可以实时查看、编辑、修改识别出的文字内容。3 功能描述3.1 灵云智能庭审转写系统产品结构图:3.1.1创建庭审功能描述:书记员创建庭审的时候,在网页上选择法庭,系统会自动关联到对应法庭的麦克风,书记员即可对
5、麦克风的角色姓名进行编辑,从而在庭审转写的直播过程中来达到区分角色的效果。此外,在网页界面上支持对当前庭审的编号、名称、开庭时间、开庭地点等信息进行编辑设置,方便会后整理和查阅。业务流程图:界面效果图:3.1.2关键词优化功能描述:针对庭审转写过程中,某些个性化或者生僻的词语(例如人名、公司名、地名等)可能出现错误的情况,书记员可以提前输入一些关键词来优化语言识别模型,以便在后面的实时转写过程中,系统自动修正这些文字的转写结果,提高识别准确率,从而减少书记员修改识别结果的工作量,提高庭审效率。业务流程图: 界面效果图:3.1.3庭审实时转写功能描述:灵云智能庭审转写系统自动识别出来的文字内容虽
6、然具有很高的识别率,但仍可能存在小部分的错误问题,书记员通过网页可以进行实时的修订、保存操作,并且支持复制粘贴、删除替换等操作,实现庭审记录的快速修正、生成。具体提供以下功能操作:1) 普通修改:按照正常word操作习惯提供正常的增删改、复制、粘贴的功能、删除替换等。2) 个性化词汇添加/快捷替换:书记员可以通过庭审记录页面快速添加个性化词汇,增强识别效果,同时可以通过双击个性化词汇列表,可将对应的个性化词汇快捷地替换掉转写输出的错误文本。业务流程图:界面效果图:3.1.4历史庭审记录回听功能描述:书记员在庭审记录过程中,因记录不及时、陈述人语速过快的情况,通过转写过程中打点标记相应的位置,在
7、闭庭时,可以通过回听庭审音频,再快速修正记录内容。业务流程图:界面效果图:3.1.5庭审状态控制功能描述:书记员通过网页端能够实现对整个庭审节奏的控制,当前系统提供三种庭审状态:“开庭”、“休庭”、“闭庭”。界面效果图:3.1.6庭审信息自动播报功能描述:对于开庭需要宣读的法庭纪律、审判人员入庭、证人出庭等内容,能够通过网页端自动播报,并且支持播报速度调整及音色自由选择。业务流程图:界面效果图:3.1.7导出/打印/保存功能描述:书记员在整个庭审结束后,可以从系统的网页端将庭审生成的笔录导出为Word文档,也支持在网页端中直接进行打印操作,并且可以将庭审笔录保存至庭审记录管理系统。业务流程图:
8、界面效果图:3.2 灵云全智能能力平台介绍全智能能力平台是基于服务器硬件和软件,提供捷通华声科技股份有限公司最新的语音合成、语音识别、声纹识别等多项核心技术能力,并在此基础上构建语音应用。3.2.1语音合成语音合成(Text to Speech,TTS),是将文本信息转化为语音数据的技术。语音平台集成的语音合成引擎是业界领先的文语转化引擎,采用最先进的中文文本、韵律分析算法和大语料库的合成方法,合成语音已经接近真人的自然效果。其主要功能有:1) 高质量语音,将输入文本实时转换为流畅、清晰、自然和具有表现力的语音数据;2) 多语种服务,整合了多语种语音合成引擎,可提供中文、英文、粤语、维语等语音
9、合成服务;3) 多音色服务,提供丰富、风格多样化的音色选择,如浑厚淳正的男声,温柔甜美的女声,天真烂漫的童声等等;4) 多字符集支持,支持输入GB2312、GBK、Big5、Unicode和UTF-8等多种字符集,普通文本和带有CSSML标注等多种格式的文本信息;5) 多种数据输出格式,支持输出多种采用率的线性WAV,A/U率WAV和VOX等格式的语音数据;6) 语音调整功能,开发接口提供了音量、语速、音高(基频)等多种合成参数动态调整功能;7) 配置和管理工具,合成引擎提供了统一进行配置和管理的工具,完成了全局参数配置、用户词典、用户规则管理等功能;8) 效果优化,合成引擎提供了以定制资源包
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智能 庭审 转写 系统 解决方案

链接地址:https://www.31ppt.com/p-3877902.html