基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了改善自然语言处理应用中长期存在的主题漂移和词不匹配问题,本文首先提出一种加权项集支持度计算方法和基于项权值排序的剪枝方法,给出面向查询扩展的基于项权值排序的加权关联规则挖掘算法,讨论关联规则混合扩展、后件扩展和前件扩展模型,最后提出基于项权值排序挖掘的跨语言查询扩展算法.该算法采用新的支持度和剪枝策略挖掘加权关联规则,根据扩展模型从规则中提取高质量扩展词实现跨语言查询扩展.实验结果表明,与现有基于加权关联规则挖掘的跨语言扩展算法比较,本文扩展算法能有效遏制查询主题漂移和词不匹配问题,可用于各种语言的信息检索以改善检索性能,扩展模型中后件扩展获得最优检索性能,混合扩展的检索性能不如后件扩展和前件扩展,支持度对后件扩展更有效,置信度更有利于提升前件扩展和混合扩展的检索性能.本文挖掘方法可用于文本挖掘、商务数据挖掘和推荐系统以提高其挖掘性能.
推荐文章
基于项权值变化的矩阵加权关联规则挖掘
文本挖掘
矩阵加权关联规则
频繁项集
知识发现
基于U-P2P元组空间知识协作模式的中越跨语言查询扩展
元组空间
知识协作
跨语言
扩展查询
对等网络
基于网络的跨语言信息检索中OOV译文挖掘研究
跨语言信息检索
OOV
查询翻译
多词单元抽取
译文挖掘
基于完全加权正负关联模式挖掘的越-英跨语言查询译后扩展
自然语言处理
信息检索
文本挖掘
模式挖掘
查询扩展
推荐系统
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于项权值排序挖掘的跨语言查询扩展
来源期刊 电子学报 学科 工学
关键词 自然语言处理 文本挖掘 信息检索 跨语言检索 查询扩展 推荐系统
年,卷(期) 2020,(3) 所属期刊栏目 学术论文
研究方向 页码范围 568-576
页数 9页 分类号 TP311
字数 7378字 语种 中文
DOI 10.3969/j.issn.0372-2112.2020.03.021
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 蒋曹清 广西财经学院信息与统计学院 11 25 4.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (91)
共引文献  (27)
参考文献  (10)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1988(5)
  • 参考文献(1)
  • 二级参考文献(4)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(5)
  • 参考文献(0)
  • 二级参考文献(5)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(12)
  • 参考文献(0)
  • 二级参考文献(12)
2010(15)
  • 参考文献(1)
  • 二级参考文献(14)
2011(4)
  • 参考文献(0)
  • 二级参考文献(4)
2012(6)
  • 参考文献(0)
  • 二级参考文献(6)
2013(12)
  • 参考文献(0)
  • 二级参考文献(12)
2014(7)
  • 参考文献(2)
  • 二级参考文献(5)
2015(10)
  • 参考文献(1)
  • 二级参考文献(9)
2017(8)
  • 参考文献(3)
  • 二级参考文献(5)
2018(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
自然语言处理
文本挖掘
信息检索
跨语言检索
查询扩展
推荐系统
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子学报
月刊
0372-2112
11-2087/TN
大16开
北京165信箱
2-891
1962
chi
出版文献量(篇)
11181
总下载数(次)
11
总被引数(次)
206555
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导