以技术为驱动力的网易有道最近开始在AI领域频繁发力。早在7月,网易有道正式上线了面向企业的“有道智云”平台,将以有道神经网络翻译(NMT)为主的自然语言翻译和文字识别扫描(OCR)等技术全部集成在平台上,供给第三方厂商使用。
有道智云针对各类行业客户,提供NMT、OCR等众多技术的集成解决方案。客户可以通过有道智云调用翻译API在线接口,实现联网翻译。上线五个月来,有道智云也实现了离线SDK在神经网络翻译(NMT)以及文字识别(OCR)方面的应用。其中,SDK技术更强调深度学习技术在移动客户端的实现,使得速度更快,翻译准确率更高,也能获得更广泛的应用。
离线NMT技术,翻译效果更流畅
在自然语言翻译网易有道离线SDK中,目前采用的是神经网络翻译模型,翻译效果高于在线SMT(统计机器翻译)。
在有道离线NMT与同类竞品的横向对比中,离线NMT翻译质量也优于国内外竞品,翻译质量可媲美专业八级英语翻译人员。小编选取了BBC news的一条导语,原文是:“More than a century ago, an antiquities dealer from Jerusalem claimed he had discovered an ancient version of the book of Deuteronomy. But was it a fake?”,让网易有道与国内外竞品的离线NMT对其进行翻译成中文,通过对比显示,有道离线NMT翻译结果更符合人类语言习惯,而且对于特殊地名、人名有道离线NMT也都能精准翻译。
(有道与竞品离线NMT翻译结果对比.英译中)
为了对比检测的准确性,小编又选择了一条比较长的中文句子,原文是:“这几年关于人工智能的讨论不绝于耳。人们一边早已习惯了种种“黑科技”对生活潜移默化的影响,一边对让世界翻天覆地的人工智能技术叹为观止。”让三款离线NMT进行翻译成英文,结果也显示出,网易有道离线NMT的翻译结果更加流畅、长短句断句清晰、时态翻译也更符合英文的语法习惯。
(有道与竞品离线NMT翻译结果对比.中译英)
离线OCR识别技术,翻译准确度更高
在有道神经网络翻译基础之上的有道自主研发的文字识别OCR技术,可以直接对文字进行识别,其中,图片标准文字寻找和识别率达97%以上,对于图片中特殊文字寻找和识别率也可达90%以上。
(日文识别结果)
(倾斜角度离线OCR扫描翻译)
有道智云,AI翻译技术的集大成者
有道是国内最早进入翻译服务市场的互联网公司,聚焦中文与其他语言之间的翻译,通过不断提升机器翻译的质量,从而为用户带来高质量的翻译体验。自从今年4月有道上线神经网络翻译之后,网易有道提供的翻译质量提升是过去十年的总和。
根据网易有道的BLEU(双语评估研究-Bilingual Evaluation Understudy)评估指标显示,在中英互译、日、韩测评中,有道神经网络翻译的翻译准确度均高于国际同类产品。其中,在中英互译的新闻和英语学习类语料方面并且BLEU值最高超出对手近10个百分点。
(有道神经网络翻译(中英互译)BLEU值测评结果)
从2008年做翻译服务至今,有道已经走过十年的历史,从有道词典、有道翻译官、有道人工翻译,再到有道智云,拥有十年语言翻译领域技术积累的网易有道智云平台或成为有道AI技术的集大成者。
作为网易有道的技术出口,有道智云将持续为行业客户提众多技术接口与服务。据悉,截至目前有道智云已经成为支付宝、微信、360、掌阅、网易邮箱、华为荣耀Magic手机、今日头条海外版、智联招聘等知名机构及产品的技术合作伙伴。广州丝足会所