作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文对中文信息处理中的文本相似度计算方法进行了研究和比较,提出了分词和特证词计算的关键算法.在相似度计算中,利用各个特征在特征提取时的权值,对TF-IDF算法做了改进.
推荐文章
一种PST_LDA中文文本相似度计算方法
词性标注
LDA模型
PST_LDA模型
文本相似度计算
基于中文分词的文本相似度动态规划算法
文本相似度
动态规划
最长公共子序列
中文分词
基于词汇语义信息的文本相似度计算
文本相似度
词向量
词频—逆文档频率
基于VSM的文本相似度计算的研究
文本相似度
特征选择
词频-逆文档频率法
向量空间模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向中文的文本相似度计算方法研究
来源期刊 网络财富 学科 工学
关键词 文本相似度计算 向量空间模型 词频一逆文档频率法
年,卷(期) 2010,(10) 所属期刊栏目 理论探讨
研究方向 页码范围 165
页数 分类号 TP3
字数 1853字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 马军红 西安外事学院工学院 14 59 3.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (7)
参考文献  (1)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本相似度计算
向量空间模型
词频一逆文档频率法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
网络财富
半月刊
1672-5441
12-1392/G2
大16开
北京市
1987
chi
出版文献量(篇)
7882
总下载数(次)
13
论文1v1指导