安云网 - AnYun.ORG | 专注于网络信息收集、网络数据分享、网络安全研究、网络各种猎奇八卦。
当前位置:安云网 > Tag > 余弦相似性
  • TF-IDF模型关键词抽取 日期:2018-01-22 17:28:55 点击:213 好评:0

    模型:gensim工具包TF-IDF模型 维基百科语料数据(30万词条) 利用jieba分词,加入行业词,去除停止词 下面用维基百科中文数据来做测试 1.数据预处理 1.1 数据集采用分好词的维基百科中文数据,训练之前...

  • TF-IDF与余弦相似性的应用(三):自动摘要 日期:2018-01-22 16:47:06 点击:64 好评:0

    作者: 阮一峰 日期: 2013年3月26日 有时候,很简单的数学方法,就可以完成很复杂的任务。 这个系列的前两部分就是很好的例子。仅仅依靠统计词频,就能找出 关键词 和 相似文章 。虽然它们算不上效果最好的方法,但肯定是最...

  • TF-IDF与余弦相似性的应用(二):找出相似文章 日期:2018-01-22 16:45:49 点击:156 好评:0

    作者: 阮一峰 日期: 2013年3月21日 上一次,我用 TF-IDF算法 自动提取关键词。 今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,Google新闻在主新闻下方,还提...

  • TF-IDF与余弦相似性的应用(一):自动提取关键词 日期:2018-01-22 16:34:42 点击:157 好评:0

    作者: 阮一峰 日期: 2013年3月15日 这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。 有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到?...

    共1页/4条
推荐内容
安云广告位等待您的光临
安云广告位等待您的光临