词频,一部隐秘的历史
早在2002年,谷歌就有了一个类似“全世界无产阶级联合起来”的理想,这个理想就是把全世界的数字图书馆项目统一起来,谷歌由此诞生了GooglePrint项目.
到2010年,谷歌已经扫描了1 500万册书,这时谷歌决定将已经扫过的书的某些统计结果公开,这便是Google BooksNgrams.也就是说,书的内容不一定公开,但关于书的词频统计结果可以公开,只要输入任何词语,都会出来一个像股票价格一样的词频走势曲线图.
2015-07-20(万方平台首次上网日期,不代表论文的发表时间)
共1页
40