最牛资源
当前位置: 史上最牛 > 中国最牛 > 科技 >

Google 机器学习应用分享:基于机器学习并持续进化的翻译

2017-05-10 14:26 来源于:未知
热搜标签:
史上最牛网导读: 近期因为 Alpha Go 持续在围棋领域击败各界好手,人工智慧议题又开始获得关注,当然人工智慧并非新技术,但在机器学习技术于硬体、演算法双方面逐趋成熟后,人工智慧发展获得飞跃

近期因为 Alpha Go 持续在围棋领域击败各界好手,人工智慧议题又开始获得关注,当然人工智慧并非新技术,但在机器学习技术于硬体、演算法双方面逐趋成熟后,人工智慧发展获得飞跃性成长, Google 为了让媒体对机器学习的应用有更多了解,也预计规画一系列定期讲座,每一季以一个相关议题进行探讨,而今天则首度以 Google 翻译为议题,探讨导入机器学习后带来的效益。

Google 机器学习应用分享:基于机器学习并持续进化的翻译

Google 台湾总经理简立峰表示,人工智慧并非新议题,早就开始被应用在各项领域,早期像是垃圾信辨识就已经导入人工智慧,然而过去在演算法与硬体发展限制下,人工智慧发展一度碰壁,但随著 Google 开始导入机器学习后,停滞的齿轮又开始转动, Google 也将 TensorFlow 演算法开放,促进人工智慧与机器学习的发展。

Google 机器学习应用分享:基于机器学习并持续进化的翻译

简立峰表示,目前人工智慧虽获得大幅成长,不过仍仅限于特定领域,人工智慧能达到的领域在于能够被预测并且可学习的领域,例如垃圾邮件、围棋等,但像是难以被预测、难以判断知识领域,例如哲学、思考逻辑、感官等,就无法以人工智慧实现。

目前人工智慧以人类能力区分可简单分为三个层级,包括透过各种感测器达到超人类的超人级,与人类能力近似如影像辨识的类人级,以及低于人类能例如翻译的次人级。

Google 机器学习应用分享:基于机器学习并持续进化的翻译

在简立峰作为简短的人工智慧发展论述后,接著由 Google 在美国总部份负责 Google 翻译的产品经理 Julie 针对目前 Google 翻译如何应用人工智慧作介绍; Julie 表示,翻译服务是相当重要的功能,因为目前高达五成的网页内容是以英文撰写,但使用英文作为主要语言的使用者却不到两成,是故 Google 在推出翻译服务后也获得好评。

不过不知道在初期就开始使用 Google 翻译的使用者有没有发现, Google 翻译在 2015 年下半年后,精确度开始变高,更像是自然翻译的结果,这是因为在 2015 年 9 月开始导入机器学习( NMT )取代原本的片语式架构,且目前导入的成果超过预期,在 13.5 个月内达到当初预期 3 年才能提供的服务水淮,截自今年 4 月已经能提供 26 种翻译语言。

Google 机器学习应用分享:基于机器学习并持续进化的翻译

目前 Google 翻译透过机器学习,约可在 2 到 3 周训练一个模型基础,学习内容超过一亿个案例,现阶段已经提供 103 个平方组的模型;同时 Google 翻译也为了加速模型产生,透过多语言模型交叉训练学习,把不同语言、相同语意归纳,使翻译训练能在两周内由 10 秒缩减到 0.2 秒。在透过机器学习后,最关键的是能够判断前后文的关系选择正确词彙,也因此能够提供更接近人工翻译的水淮。

另一个结合多重机器学习应用的翻译,就是 Google 的即时镜头翻译,即时镜头翻译透过影像辨识、分析文字、翻译后再于萤幕上显像;为了提升文字图像辨识能力, Google 刻意提供与真实情况相同的模糊印刷文字、污渍、尘点等文字作为学习基础,也因此能达到高精确的即时镜头翻译品质。

Google 机器学习应用分享:基于机器学习并持续进化的翻译

Google 目前也打算在几项 Google 翻译领域持续强化,包括数字与日期,如人名等特殊名词以及简短与罕见查询字串等,尤其像是人名与特殊名词也是目前 Google 翻译常遇到但却无法正确翻译的情境;至于口语化语句目前难以翻译的主因,仍是因为无法提供充裕的学习样本,毕竟口语化语句平常较少用于常规网页内容撰写,当遇到此类特殊用法时,目前还是无法提供正确的翻译结果。

其次目前简体、繁体中文(包括台湾与香港用语)仍归纳在相同的模型中,最主要的考量还是因为资料量,毕竟越充裕的资料量也能够获得越正确的结果,虽然各地的名词还是有所不同,不过藉由机器学习的前后语意判断,在显示简体或是繁体语言时,也能更正确的显示简体或是繁体的翻译结果。


更多福利关注《十点看笑》,微信号:zuishi68

你懂的福利,关注微信公众号:zuishi68

相关内容
网友评论
推荐文章