解放语言的Pixel(英语语用学)
好酷屋教程网小编为您收集和整理了解放语言的Pixel(英语语用学)的相关教程:科技发展日新月异,随着谷歌实时翻译这项黑科技的发明,从前我们苦练外语的时代也许一去不复返了,也许以后很多学生就要大声高呼:我终于可以不用学英语啦!不同国别,不同人种之间,语言包袱真能甩掉吗?人之人之
科技发展日新月异,随着谷歌实时翻译这项黑科技的发明 ,从前我们苦练外语的时代也许一去不复返了,也许以后很多学生就要大声高呼:我终于可以不用学英语啦!不同国别,不同人种之间,语言包袱真能甩掉吗?人之人之间真能实现顺畅自然的交流吗?这也只是小编一个对未来的美好畅想,但谷歌Pixel Buds耳机实时翻译的新科技也让我看到了希望的曙光。下面小编就和大家共同探讨下谷歌实时翻译的黑科技奥秘。
这款无线耳机可以利用 Pixel 手机上的谷歌翻译 APP,帮你把你所说的和所听到的话在 40 种语言里随意翻译。实时语言翻译需要一系列技术的支持,而这些技术都在近几年里实现了极大的发展。从 Pixel Buds 听到语音的一瞬间,到被翻译好的语音从手机中播放出来,中间使用了哪些技术呢?
探秘黑科技
输入调节:Pixel Buds 耳机所“听到的”语音会包含大量的背景噪音,所以“除噪”是必须的。语音活性检测(VAD)则会让你的 Pixel Bud 只有在你说话时候才会响应,而不是对周围每个大声说“Ok Google”的人都有反应。触控则是用来提高 VAD 的准确度。
语言识别(LID):此系统会用机器学习,在几秒内识别所说的语言是哪一种。这很重要,因为 Pixel Buds 之后所听到的一切语音都会因为语言的不同而意义不同。而仅仅用发音来识别语言并不可靠,比如乌克兰语和俄罗斯语,以及乌尔都语和印地语的发音几乎一模一样。所以,谷歌必须全新发明一种声学模型来识别语言。
自动语音识别(ASR):ASR 会使用该声学模型把记录的语音转换成一个个音素,然后具体的语言模型会把这些音素数据转换为文字。通过口语语法、上下文、概率以及发音词典,ASR 系统可以自主补上句子中的空缺并且修改误认的音素。最终,ASR 将会推断出一段基本正确的文字。
自然语言处理(NLP):NLP 会使用机器翻译,把这段文字从一种语言翻译到另一种语言。虽然听起来简单,但这不仅仅是把每一个词翻译成对应的词,而是需要理解语音背后的意思,然后把这个意思用另外一种语言表达出来。而这段被翻译出来的文字在细微之处也需要符合其语言的习惯。
语音合成(TTS 系统):TTS 和 ASR 可以被视为同一个过程的逆操作。这个系统需要从一段文字中生成一段听起来十分自然的语音。以前的老 TTS 系统会用增添合成,也就是把许多个由人所说的音素按照正确的顺序排列好,合成出成品。而现代系统则会使用复杂的统计声学模型来产生听起来十分自然的声音。
当我们把这 5 个不同的技术放在一起的时候,实现实时翻译也就不难了。但是它们是如何具体的工作呢?让我们用一个中英翻译的例子来加以解释。
当 Pixel Buds 收到翻译的指令后,它会首先语音录下来,用 VAD 来判断这段话从哪开始、在哪结束。背景的噪音在语音被耳机记录的时候就会先被过滤一遍,然后在被传到手机上的时候再被过滤一遍。手机中的 APP 会对这段语音进行压缩,避免用太多的数据流量,然后在通过无线网或 4G 把它上传到谷歌的语音服务器。
谷歌的云端服务器会对这段语音进行解压,然后使用 LID 技术来判断所说的是汉语还是英语。
假设这段语音是汉语,那么汉语的 ASR 系统就会接手,将它转化为文字。之后,NLP 系统会把汉字翻译成英文文字,然后再发送给英语 TTS 软件,合成为英语语音。这段被压缩的语音会沿原路返回到手机和耳机中,并播放出来。
虽然这个过程听起来很复杂,但是在现实中仅需几秒钟就能完成。不过这几秒可以说是很关键的几秒,因为耳机和手机中的处理器并没有足够的能力来进行本地翻译,也没有足够的空间去存储各种语言和声学模型。就算谷歌开发出一款威力出奇的耳机或手机,这种程度的计算的能耗也会在几秒内将电池用空。
最重要的是,市面上包括谷歌、科大讯飞以及 IBM 在内的所有实时翻译产品都在无时不刻的进行着更新,努力的在提高性能和用户体验。而对自己的云端服务器进行更新很显然要比对无数个用户的耳机进行更新更容易。
看来要想短时间内研发出完美的实时翻译技术还是挺有难度的,实时翻译技术的研发传播之路任重而道远啊!
以上就是好酷屋教程网小编为您收集和整理的工作原理,耳机,语言相关内容,如果对您有帮助,请帮忙分享这篇文章^_^
本文来源: https://www.haoku5.com/shuma/671b1e15856d0972fa0c27c6.html
相关推荐
热门专题
平板电脑搜狗键盘怎么移动图片(怎么移动搜狗悬浮键盘)
1.怎么移动搜狗悬浮键盘3当出现键盘悬浮的情况,这是因为不小心开启了悬浮键盘的功能,首先在某个聊天界面点击输入框打开键盘。2/3点击键盘的左上角按钮,该按钮图案可能是键盘图案、工具箱图案、搜狗标志图电脑出现选择一个选项疑难解答(电脑出现只有一个选择)
1.电脑出现只有一个选择我的电脑右下角的选择输入法的图标没有了?怎么把它调出来?我的电脑右下角的选择输入法的图标没有了,怎么把它调出来,进入控制面板设置一下就可以了。如图示,在控制面板中进入区域和语电脑连接网络受限制是什么原因(电脑联网显示网络受限)
1.电脑联网显示网络受限如提示网络连接受限制或无连接,可按以下方法操作:1、打开电脑“控制面板”,点击“网络连接”,选择本地连接,右键点击本地连接图标后选“属性”,在“常规”选项卡中双击“Inter三环耳机插电脑(三接头耳机怎么插电脑)
1.三接头耳机怎么插电脑如图所示,电脑耳机插口有两个,每个插孔下面有标识。比如,粉色的下面是个话筒话标志,浅绿色的是耳机🎧,有的电脑上有三个插孔,也就是在中间位置有一个混音插孔,一般是黑色的,就是电脑全屏截图怎么弄(电脑上如何全屏截图)
1.电脑上如何全屏截图 方法一:直接使用键盘中的PrintScrSysrq键实现全屏截图PrintScreenSysRq截图键 使用方法非常简单,只需要按下该键后即可完成全屏截图,然后我们苹果电脑键盘电源(苹果电脑键盘电源灯闪烁是什么意思)
1.苹果电脑键盘电源灯闪烁是什么意思那可能是灯的问题,我的Mac键盘灯是白色的,你去售后问问呗。如果不是键盘脏的话,目测只能是灯的问题了吧,盖膜的应该没什么影响2.苹果电脑键盘指示灯一直闪如果您天天飞车电脑壁纸(天天飞车电脑壁纸超清)
1.天天飞车电脑壁纸超清汉字中隔壁的壁字是一个常用字,是墙体和陡峭的山涯、某些物体的表面,可以可以组成的词语有:1、墙壁,一堵墙体的表面。2、戈壁,戈壁滩寸草不生,全是沙石。3、壁画,是在墙壁、山涯电脑怎么抓屏(联想电脑怎么抓屏)
1.联想电脑怎么抓屏截图方法有多种:1、按“PrintScreenSysRq”,(在F12右边)全屏截图,就是抓整个屏幕;2、按Alt+PrintScreenSysRq,截取当前电脑保修期一般多长时间(机械革命电脑保修期一般多长时间)
1.机械革命电脑保修期一般多长时间按国家规定整机保一年,配件三年保修2.机械革命电脑保修期一般多长时间啊第1步,查询电脑过没过保修期的方法是:第2步,1、翻转电脑,查看底部铭牌上的主机编号并索尼s39h连接电脑(索尼手机s39h)
1.索尼手机s39h索尼手机摄像头在中间的型号大概有索尼LT25I、索尼LT26I(LT26II)、索尼L35H、索尼M35H(M36H)、索尼S39H、索尼S50H,或许还有我不清楚的,但是我选出