为了加速自然词汇处置数学模型能应用于多种的词汇,facebook开放源码正式发布跨词汇语句向量排序辅助工具LASER(Language-Agnostic SEntence Representations),该辅助工具全力支持超过90种词汇,让自然词汇处置数学模型能单纯地切换到另两个词汇上,包涵这些体能训练统计数据极少的词汇,像卡巴德语、哈萨克族语,甚至连吴语也包涵其中,不光的是,LASER是将大部份词汇内嵌到两个协力向量内部空间,而非每一语言有分立的数学模型。
LASER辅助工具会将每一语句完全相同词汇的统计数据,通通引入高层次的内部空间中,目地就是让完全相同原意的语句能在同两个邻近地区地区,输入的统计数据能被视作两个在语法向量内部空间中通用型的词汇,facebook研究项目组发现,在向量内部空间中的距,与语句的语法相似某种程度有两极化的互有关连。
facebook选用的方式即是通过目前的脊髓用例控制技术Seq2seq,将大部份词汇输入至5层的单向长implantation(bidirectional LSTM)互联网,再用两个协力的记忆卡产生词汇的输入结论,完全相同的是,facebook是用1,024层次一般来说大小不一的向量,来则表示输入的语句,这样一来,能较为语句的记法并将其间接送进预测器中。
facebook则表示,LASER是第两个能在两个数学模型中,处置多种词汇的C#,该科研成果能帮助facebook合作开发自然词汇处置有关的机能,像在两个词汇中,将影片赞扬分成正评和负评,再加速重新布署到其他100多种词汇。