原文服务方: 西安交通大学学报       
摘要:
针对现有中文词汇语义倾向性计算方法存在较少考虑深层语义影响因素的问题,提出了一种利用词汇分布相似度的中文语义倾向性计算方法.该方法分2个步骤完成:①利用依存句法分析和统计工具获取词汇在语料库中的分布相似度,并综合知网(HowNet)和汉语连词特征信息优化语料库统计结果,计算中文词汇间的语义相似度;②采用无向带权图划分的聚类方法来实现中文词汇语义倾向推断.由于获取最优聚类结果是一个NP难问题,所以采用贪心算法求解近似最优值.通过在自建的语料库上进行测试,并与利用语料库统计信息、利用HowNet等2个词汇语义倾向性计算系统进行比较,结果是所提方法的准确率达到了80%,表明在提高中文词汇语义倾向性计算的准确性方面是可行、有效的.
推荐文章
基于词汇语义信息的文本相似度计算
文本相似度
词向量
词频—逆文档频率
改进的基于知网词汇语义褒贬倾向性计算
语义相似度
倾向性识别
知网
褒眨基准词
情感词汇Ontology驱动的话题倾向性计算
舆情
话题倾向性
情感词汇Ontology
中文词语倾向性分析处理
意见挖掘
词语倾向
二元语法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 利用词汇分布相似度的中文词汇语义倾向性计算
来源期刊 西安交通大学学报 学科
关键词 中文信息处理 词汇分布相似度 语义倾向 依存句法分析 知网
年,卷(期) 2009,(6) 所属期刊栏目
研究方向 页码范围 33-37
页数 5页 分类号 TP39
字数 语种 中文
DOI 10.3321/j.issn:0253-987X.2009.06.008
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 蔡皖东 西北工业大学计算机学院 157 1423 21.0 28.0
2 李慧贤 西北工业大学计算机学院 38 466 14.0 20.0
3 樊娜 西北工业大学计算机学院 6 89 3.0 6.0
4 赵煜 西北工业大学计算机学院 12 128 5.0 11.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (289)
参考文献  (5)
节点文献
引证文献  (14)
同被引文献  (8)
二级引证文献  (15)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(2)
  • 参考文献(2)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(2)
  • 引证文献(2)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(3)
  • 引证文献(3)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(3)
  • 引证文献(3)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(5)
  • 引证文献(0)
  • 二级引证文献(5)
2018(5)
  • 引证文献(1)
  • 二级引证文献(4)
2019(6)
  • 引证文献(0)
  • 二级引证文献(6)
研究主题发展历程
节点文献
中文信息处理
词汇分布相似度
语义倾向
依存句法分析
知网
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西安交通大学学报
月刊
0253-987X
61-1069/T
大16开
1960-01-01
chi
出版文献量(篇)
7020
总下载数(次)
0
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导