当前位置:主页 > 关于华镇 > 最新动态 >

不懂外语也能搞语音识别模块定跨国会议!声网

发布日期: 2020-03-10 20:25

  身处职场,每天都会面临各种各样的挑战。随着越来越多的中国企业走向海外,国际会议中的语言障碍成了很多职场人的一道新难题。

  试想一下这样场景:一次重要的跨国会议上,听外国同事发言,所讲内容刚开始还能听懂一些,随着信息量增加,听着听着就突然跟不上了。只好等对方讲完,用标准中式英语范儿弱弱的说一句“Pardon?”。然而,对方再说一遍还是只听懂30%,最终不得不求助身边英语好的同事进行人肉翻译。

  相信很多人都曾遇到过上述场面,不仅导致会议效率低下,而且让自己十分尴尬。明明自己的工作技能和业务能力都很好,却因“听不懂”耽误了重要工作进度。

  这时候大家会疑问,为什么平时我们看原版电影、美剧都没问题,可一到现实会议中就差之千里?那是因为,原版片中的双语字幕起到了至关重要的作用。

  而如果视频会议时也能像看原版电影一样带上双语字幕,即使听不懂,也完全可以看懂内容,那大部分职场人的难题就可以迎刃而解了。

  声网升级视频会议解决方案 联合搜狗推双向翻译转写功能

  近日,实时音视频云服务开创者和领导者声网Agora对其视频会议解决方案进行全新升级,推出视频双向翻译转写功能。将声网稳定可靠的实时音视频技术,融合搜狗知音(搜狗推出的以语音交互技术为核心的人工智能平台)先进的语音识别和机器翻译技术,实现在实时视频会议场景中“中译英”和“英译中”两种同传工作,让视频会议也能拥有双语字幕。

  视频双向翻译转写可以实时地对跨国会议过程中不同参会者的讲话内容进行识别并翻译,然后以中英双语字幕呈现在屏幕上,让多方参会者一目了然的理解来自不同国家和地区的其他参会者的发言内容,比传统的人工同传更加高效直观,打破国际会议语言沟通的障碍,大大提高信息传递效率。

  想要保证实时翻译准确率,首先要做到的就是对语音识别有较高准确率。数据显示,搜狗语音输入识别准确率达到98%,日均请求峰值达8.3亿次。技术层面,搜狗语音识别已全面引入了行业前沿的深度学习技术,其中基于DTSS(Deep Transformer-based Sequence to Sequence model)的端到端声学模型、神经网络语言模型和智能标点预测等技术,可有效推动搜狗语音识别的通用效果和体验,在行业中处于领先地位。而对于语音识别中常见的噪声、背景音等音质问题,声网还融合Agora语音引擎与AI音频降噪算法,可提供去除背景音、环境音之后的高音质音频源,在原来算法的基础上将语音识别准确率有效提高30%以上。

  除了实时视频双向翻译转写,声网视频会议解决方案,在让跨国会议变得更高效方面,还具备以下四个优势:

  高清流畅沟通体验

  在跨国会议这样的场景,常常会面对弱网环境的挑战,声网的实时音在视频清晰度、流畅度等关键体验上具备优势。清晰度方面,声网的SDK最高可支持1080P动态分辨率和超分算法,可以满足不同终端对视频清晰度的高品质显示需求;流畅度方面,声网针对抗丢包和低延时做了独家设计,具备优秀的弱网传输和抗丢包算法,在60%的丢包环境中仍然可以保障音视频流畅的实时互动体验。同时,声网在超低延时上也已经做到了业内领先水平,实现视频会议少于400ms延时。

  打破地缘 覆盖全球

  声网自建的全球虚拟实时通信网络SD-RTN?,在全球拥有200+核心节点,覆盖全球200+国家和地区,通过智能调度算法可把原生传输质量提升10倍以上。打破地缘限制,让跨国会议随处可开。

  接入灵活,兼容性强

  声网Agora的SDK可直接集成到企业办公协作系统中,30分钟即可完成接入,快速灵活、接口丰富可扩展性强。一个SDK就可以同时拥有实时音视频和双向翻译转写功能。除此之外,声网的视频会议解决方案可覆盖移动终端、办公桌面、会议室、培训室等多种场景,适配超过6000+终端型号,不受终端设备限制,让跨国会议真正做到零时差。

  支持屏幕共享、云录制,安全有保证

  除了沟通成本,跨国会议也同样面临会议记录复杂、文稿演示困难等问题,而声网的视频会议解决方案可以一一解决这些问题。声网的SDK支持本地、云端录制以及合流录制,并下载到本地。在重要会议场景下进行会议录制、回放,可满足会后整理、点播。同时,对会议内容进行智能备份,即使第三方存储节点出现故障也不用担心,真正做到安全可靠有保证。文稿演示则可以通过白板、屏幕共享等基础协作功能来实现。

  据悉,声网Agora已经联合V-cube、谈吧、柚子会议等多家视频会议Saas合作伙伴,为不同行业及业务场景提供具有针对性的实时视频会议解决方案,在保证远程会议更高效的同时,提供最佳用户体验,真正融入到业务中去,而不只是提供工具。

  在10月24日“未来·与声俱来”品牌发布会上,声网还Agora联合34家合作伙伴共同发布Agora云市场全球合作伙伴计划。通过整合合作伙伴业务能力,提供一站式实时音视频解决方案,帮助开发者加速集成开发,快速构建应用内实时互动能力。同时降低开发门槛,满足不同能力的开发者需求,创建一个RTC实时互联网生态。(来源:IT168)

13524859176、13296017858