谷歌发布大型数据集合Wikilinks Corpus
| 来源:【字号:大 中 小】
2013年3月,谷歌公司发布了一个大型数据集合——Wikilinks Corpus,它将帮助开发人员构建能准确解释人类语言的软件。Wikilinks Corpus包含了来自各大网页及维基百科文章的4000多万条个人链接,它们被称为“提及”(mention)。开发人员通过分析每一条mention的内容以及目标文章的内容,来确定一些模棱两可的单词的意思。
Wikilinks Corpus的规模大于以往的数据集合,而且它是免费的。
来源:中文业界资讯网站
© 1996 - 中国科学院网信工作网 中国科学院科技基础能力局主办
京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000033