搜狗同传30上线AI同传首次实现“能听会看会思考”

中新网12月23日电 21日,首个具备多模态认知能力的同传系统——搜狗同传3.0在极客公园创新大会上使用。基于搜狗独创的“语境引擎”,搜狗同传3.0以“多模态”和“自主学习“为核心,加入视觉和思维能力,让机器同传不仅会听,还首次具备了会看、能理解会推理的能力,引领AI同传进入了多模态认知时代。

搜狗同传技术再升级,解锁两项“超能力”

“‘出云’级引进美国电磁弹射技术的难度不大,但‘出云’级改装电磁弹射的难度却比较大。主要是因为电磁弹射对载舰的发电能力要求很高,美国‘福特’级核动力航母发电量很大,但其配套设施有足够能力进行承载,但采用燃气轮机的‘出云’级,面对大发电量,其自身压力会比较大。不过,日本拥有世界一流的发电机和电池储能技术,在美国的支持下,要实现这一目标还是有可能的。但是个人认为滑跃起飞加上F-35B可能是‘出云’级最稳妥的改装方案。”彰海雄说。

但通过数千场机器同传的实际应用,搜狗发现,业内主流的语音同传系统无法稳定并且高质量的满足多样化的演讲场合需求,存在演讲内容中专业词汇的识别和翻译效果不佳的情况,这在很大程度上影响了机器同传的实用效果。

AI同传技术新突破,与演讲者一起“边看边思考”

而这次上线的搜狗同传3.0,运用搜狗独创的语境引擎,除了“能听”还能同时做到“边看边思考”,使得识别准确率和翻译正确率均获得大幅提升,AI同传行业由此也迎来了全新的“多模态认知”时代。

三年前,搜狗首次发布商业化AI同传,借助于搜狗领先的语音识别和机器翻译等技术,能够更加准确快速的将声音实时转换为相应的中英文字幕,与人工同传形成互补,彻底改变了各种行业大会只能依靠人工同传,容错率低的问题,打造全新品类的同时,也引领同传行业进入了AI时代。

与蒸汽弹射系统相比,电磁弹射系统具有跨越性的进步,是未来大国海军大型航母的最佳选择。但美国海军最新的“福特”号航母采用电磁弹射后却问题频出。那么,如果不考虑技术成熟度,“出云”级具备改造并安装电磁弹射的条件吗?

搜狗同传一直代表着AI同传领域顶级的水平。所以,每一次技术创新和产品更迭,都对行业有显著的引领作用。

基于搜狗语境引擎开发的搜狗同传3.0 为演讲者构建了个性化的认知语境,能够跟随演讲者一起“思考”,无疑是AI同传领域的又一大技术创新。特别是经过多重“感官”的调用,搜狗同传不仅可以做到翻译更加快速和准确,而且会更加自然,更加专业,更加智能。数据显示,在“听”“看”“思考”三位一体的作用下,搜狗多模态同传系统针对PPT内容的识别准确率提升21.7%,翻译正确率提升40.3%。未来,这一系统将会在大会演讲、视频翻译、实时直播字幕等场景得到应用,为人们带来准确流畅的同声传译服务。

有人认为,“出云”级直升机驱逐舰改造成航母已是板上钉钉之事,但如果采用美国通用原子公司的改造方案则显得有些明目张胆了,这无异于重新设计建造一艘轻型航母。“出云”级从设计之初就有改装为轻型航母的打算,所以不仅舰体大、机库大,并且采用了舷侧升降机,安装了更加广阔的直通飞行甲板。所以,“出云”级的改装的确有现实可能性。“不过,采用斜角飞行甲板和电磁弹射系统的改装方式确实比较激进,也会对舰体结构以及舰体内部的空间布局进行比较大的调整,难度会比较大。但和重新设计一艘航母相比,施工难度还是要低一些。”彰海雄说。

“能理解会推理”,则意味着同传具备了与人“共情”的能力。这归功于搜狗语境引擎的应用。该技术的原理是基于搜狗知识图谱和百科的知识推理能力,将通过OCR技术获取的演讲内容自动生成核心知识,并通过搜狗领先的知识图谱-搜狗知立方实时推理拓展,获取充分的背景知识,同时基于搜狗百科的中英术语库得到中英双语对照,实时优化同传识别和翻译的效果。

“会看”,意味着同传首次具备了视觉能力。基于搜狗OCR(光学字符识别)技术,搜狗同传可以实时准确“观看”演讲者的PPT内容,将PPT的图像内容转化为语言文字,充分获取到当前演讲的个性化信息。

“传统意义轻型航母无法起降F-35C舰载机,因为轻型航母吨位小、空间小,甲板长度和面积有限,无法实现F-35C的弹射起飞和拦阻降落,短距起飞的F-35B更适合轻型航母。”彰海雄表示,改装后的“出云”级可能不是轻型航母,而更趋近于准中型航母。因为日本号称‘出云’级的排水量只有26000多吨,但从各方披露数据和比较看,它的实际满载排水量肯定超过3万吨。按照通用原子公司的方案改装后,其排水量会进一步增加,所以它或许可能会装备F-35C舰载机。当然,如果真要配备这款舰载机,除了弹射器外,它还需要斜角飞行甲板和拦阻系统,并配备大型航母类似的舰载机着舰指控装置和系统。

电磁弹射技术对舰艇的发电、储能和电能管理要求很高。如果舰载供电系统供电能力不足,是无法搭载的。同时,如果储能装置性能不稳或电能管理不佳,也很难发挥电磁弹射的效率优势。“福特”号的电磁弹射系统尽管还需要进一步完善,但也经过了大量的试验,具备上舰能力。相信经过进一步优化后,是可以胜任弹射重任的。

总的来说,通用原子公司推出的这个比较激进的改装方案,主要是想赢得日本政府的瞩目,帮助日本“一步到位”拥有航母,这比相对保守的加装滑跃甲板的方案更符合日本期待。所以,这一设计可以说是凸显实力与兼顾商业价值的推销手段。不过,这个看起来“高大上”的方案改装难度相对较大,时间也会比较长,实际改装相比目前设想图的改装内容,其最终版本可能会更加务实。 (

为了解决上述问题,搜狗在AI同传领域首创“语境引擎”,使得搜狗同传在“能听”的基础上,又解锁了“会看”和“能理解会推理”两项新技能,不仅能够通过“观看”自主学习演讲者的报告内容,更能够通过“理解”和“思考”,做出高质量的识别和翻译,这再次引领了行业的技术进步。

从通用原子公司公布的设计图来看,其计划对“出云”级直升机驱逐舰的飞行甲板进行加宽,将直通甲板左侧增宽,作为着舰跑道的延伸。而改造后的“出云”级搭载的舰载机却不是日本看中的F-35B型,而是与美国海军未来航母舰载机相同的F-35C型。

但从设计图上看,改造后的“出云”级搭载的舰载机是与美国海军未来航母舰载机相同的F-35C型,这是为何呢?

搜狗再次引领AI同传进入新时代

对此,军事评论员彰海雄认为:“日本针对‘出云’级的航母化的改装如果比较成功,那么日本有可能将手头的‘日向’级也改装为轻型航母。可以说,这是一个很有潜力的军贸市场。只要贏得了第一艘的订单,那么后续的订单更加可观。所以,该公司当然会看重这一市场。”

AI同传一直是人工智能技术的重点领域。2016年,搜狗在“第三届乌镇互联网大会”上发布行业第一个商用AI同传产品——搜狗同传1.0,在打造了这一全新品类的同时,用AI技术助力同声传译行业,有效推动了跨语言的交流和表达。2018年发布的搜狗同传2.0,为用户提供了更丰富的个性化定制能力,能够基于用户实时定制识别和翻译。两代搜狗同传的核心能力都在于“听”,都是利用搜狗领先的语音识别和机器翻译等技术,将声音实时转换为相应的中英文字幕。

About Author


fxcsi.com