当前位置：网站首页 > 百万个冷知识 >

@科学研究党，这约莫是最合适用的学术论文写作宝物了，还完全免费

2022-10-02 来源：admin 分类：百万个冷知识阅读(218)

鱼羊丽翔凹非寺

物理位 | 社会公众号 QbitAI

那位老佛，无人知晓嗑盐半路上，你与否也有写作英文学术论文工作效率低落的苦恼？

做为两个arXivK75A的英文渣，本蒟蒻再说是在发掘学术论文写作宝物的高架道路上无法自拔。

这不前段时间，就又被网民们果树了这款图形界面译者应用软件。

浅试试，译者PDF的效用是酱婶的：

除了细读仔细分析机能：

假如而已想看一看全文，顺手截图就OK，反之亦然有中文仔细分析：

爸爸非但不必害怕我删quarterfinal删到手抽筋（全自动濶濑）。

△PDF中间接造出的文档有累赘转义，负面影响译者效用

这样的机能，来自前段时间更新升级的网易有道词典9。有一说一，一看看去效用确实有点顶~

进一步翻翻有道词典官网，就会发现此番进化，这个工具强调的就是提高学术生产力。

至于究竟是不是那么回事，咱们不妨一起仔细试上一试。

从学术论文检索到学术论文写作全流程可用

读英文文档，译者PDF是刚需。

此前，学术好帮手谷歌译者就有PDF文档译者机能。

不过，谷歌的文档译者总有那么点小毛病。

比如，容易出现版面错乱的问题，导致你似乎每个字都能看懂，凑一起就无人知晓道啥意思了。

举个例子，原文的表格长这样：

用谷歌译者，你会得到这样两个文字错位、多少有点负面影响理解的结果：

相比之下，有道给出的结果长这样：

可以说在版面保持这方面，有道词典明显胜过一筹。

而比谷歌译者更加方便的是，有道词典除了直观的双语仔细分析机能。

毕竟虽然机翻能够提高写作工作效率，但完全脱离英文原文看学术论文还是不太现实的。

相比两个文档来回倒这样手忙脚乱的操作，间接同屏仔细分析方便许多。

更妙的一点是，有道词典此次学术进化，对计算机、医学、金融经济学等专业领域进行了针对性优化，能够提升术语译者的准确性。

还支持自定义术语表。

比如说，你发现文章self-attention这个词没有译者出来，可以间接选中这个词并选择术语矫正，将其加入到术语库。应用术语库之后，有道词典再遇上反之亦然的术语，就都能保持一致的译者。

除了把本职的译者工作整得更加方便准确，与其他译者工具不同的是，有道词典9这回甚至还打算包办科学研究党的写学术论文全流程。

他们间接和ReadPaper、Aminer合作，内置学术论文检索服务，官方说法是：

覆盖40种以上专业领域，包含3亿文献资料。

△亮点自寻

搜索的过程中，也可以打开双语仔细分析按钮，快速写作全文。

就这还没完，甚至在你写学术论文的时候，有道词典9也能派上用场：其AI英文写作批改机能，能够智能识别语法错误、提供例句参考、母语级句子润色，还能自动标注引用来源、生成参考文档信息……

学术词典背后的技术秘籍

有道词典9这一条龙学术服务，说得上是直奔科学研究党心巴而来。

而这些紧贴学术需求的机能背后，技术挑战也很值得说道说道。

PDF文档译者：基于视觉技术的PDF解析算法

先说说最亮眼的PDF文档译者机能。

PDF文档译者本身是两个比较复杂的问题，涉及多个处理环节，包括PDF文档解析、Word文档渲染、译者策略、译者结果回填等等。

尤其对于不可解析的PDF（扫描PDF）而言，页面中的文字、矢量、图片等要素其实都包含在同一张图片内，无法间接解析获得。

这时，就需要先通过OCR技术，识别出其中的各种基本要素，再转换得到可编辑的文档。

这里面的难点在于，相较于单纯的文字识别，OCR识别学术论文文档任务会更重。因为不而已文字，学术论文中表格、图像、公式，假如不能被精准识别出来，会很容易出现内容丢失、排版错乱的问题。

此外，为了让版面与原文保持一致，页面的单栏、多栏、页眉、页脚等信息，AI都需要准确判断出来，这样才可能在可编辑文档中恢复出原有版面和内容。

针对不可解析PDF，有道主要从两个方面进行了改进。

文字识别方面，有道自研的OCR算法集成了业内领先的文字检测和识别模型，能达到更高的文字召回率，同时能覆盖几十种主要语种。

版面识别方面，采用分而治之的策略。

具体而言，在通过版面分析模型得到版面基本信息之后，AI会根据不同的组成结果，采取不同的提取策略。

举个例子，在遇到以文字为主、富含表格的常见版面时，有道词典会主要采取文字组段算法和表格分析算法来处理文档。

而以图像为主、背景构成复杂的特殊版面，则原样保留原有版面的所有要素，集中注意力处理文字，最后进行多层叠加渲染。

除此之外，在许多细节上，有道也进行了优化，以使最终呈现给用户的版面更加准确规整。

比如文档框的透明化处理、转义符的插入规则处理等。

专业领域译者模型

前面提到，除了通用译者，在有道词典9中，用户还可以选择医学、计算机等专业领域，来进一步提高译者的准确性。

每两个专业领域背后，其实都对应着两个独立译者模型。

具体而言，技术团队收集了大量不同专业领域的数据，对神经网络译者模型进行了定制化训练和增强。

这样一来，即使是Pneumonoultramicroscopicsilicovolcanoconiosis这样的术语，也能够被准确译者出来。

除此之外，一般在线机器译者算法都是以句子为单位译者的，而针对文档译者的需求，有道词典9这次引入了篇章算法。也就是说，AI在进行译者时，会联合上下文句子来改进译者质量。

如此看来，网易有道词典9这波号称最强图形界面译者应用软件，并不是瞎吹牛，而是有备而来。

事实上，除了技术细节上的新尝试，有道词典化身科学研究宝物背后，也有着更长期的技术积累。

比如在神经网络译者技术方面，网易有道在2016年已着手自研神经网络译者模型YNMT，是国内最早开展自研机器译者技术的团队之一。

在OCR技术方面，2017年，网易有道就上线了卷积神经网络 + 循环神经网络的OCR引擎，到现在已经能支持100多语种的识别，还具备语种自动判别和混合识别的能力。

当然啦，对咱们来说，最关键的还是完全免费好用，入股不亏。

9月13号开始，文档译者完全免费版面向所有用户上线。

最后的最后，假如你除了什么别的宝藏科学研究宝物，评论区大力果树走起呀~

— 完 —

物理位 QbitAI · 头条号签约

未经允许不得转载：百万个冷知识 » @科学研究党，这约莫是最合适用的学术论文写作宝物了，还完全免费

标签：

热门推荐

百万个冷知识带给你想要内容

联系我们