导语:自有道文档翻译系统上线以来,在翻译质量和格式还原度上受到了众多用户的认可。在已有功能的基础上,有道AI团队不断更新和优化,进行更深度的开发,近日,有道文档翻译系统全面升级,针对图像型PDF文档也能实现一键翻译。

日常工作生活中,我们经常会碰到很多PDF格式的文件,有的PDF文件是文本型的,比如用Word导出的PDF格式,此类PDF虽然不能修改内容,却可以进行文字复制或者进行内容的检索。还有些PDF是图像型的,此类PDF的内容不能修改,文字因为存在在图片里,自然也无法复制,扫描件就是其中一种,转换的时候就需要用到OCR技术,把图像识别出来变成文字。
在遇到大量PDF文档需要翻译时,一般的做法是将PDF复制到Word文档中或者用第三方软件将文档转化,然后再利用翻译网站上进行翻译。在转化过程中会遇到识别准确率和格式不一致等问题,要完成一篇文档的翻译,有时需要花上几个小时,对于一个几十页或者上百篇文档而言,这样操作显然不是很高效。
有道文档翻译系统基于深度学习的NMT(神经网络机器翻译)和OCR(文字识别)技术,不断进行深度开发,目前可快速准确将文本型PDF、图像型PDF类文档转换成可编辑的格式进而进行翻译。文档的识别准确率高达99.8%,能识别几乎所有含公式、表格、图片等复杂布局的文档类型。
(1)首先我们打开有道文档翻译系统,将需要翻译的PDF文档直接上传,然后在语言方向中选择需要翻译的语种;
(2)选择语种后,右边窗口即可显示出PDF文档翻译的内容,最后点击【导出文档】即可!
下图是翻译前后的文档对比,可以看出完成度非常高。

从有道智云·AI开放平台上线开始,我们一直关注用户体验,不断丰富平台的产品内容。无论是在使用方面还是用户二次开发方面,都希望能够为用户提供更加便捷高效的服务。针对文档翻译系统,有道AI团队将会不断增加该产品的功能,未来将支持更多文档格式和语种。如果大家在使用过程中遇到任何问题,都可以通过邮件(AIcloud_Business@corp.youdao.com)/公众号(有道智云平台)内留言,我们都将在第一时间回复并解决。
网友评论