基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在线挖掘可比语料是构建大规模可比语料库的可行途径之一,在线可比度计算是语料挖掘过程中的关键环节.本文提出一种融合词汇重合度和主题模型的在线可比度计算方式,主题模型选择能够进行在线学习的Online LDA,利用词对齐工具GIZA++进行主题映射,融合方式为加权求和.在下载的中英新闻语料上的测试结果表明,两种计算方式融合后的准确性比两种都要高.
推荐文章
融合链接文本的增量联合主题模型
主题模型
增量学习
链接—概率隐含语义分析
自适应非对称学习
自适应增量链接—概率隐含语义分析
融合主题与语言模型的蒙古文信息检索方法研究
蒙古文
语言模型
主题模型
Gibbs采样
信息检索
基于LDA主题模型的中医药方剂相似度计算
LDA主题模型
古布斯采样
中医药信息
方剂相似度
基于WMF_LDA主题模型的文本相似度计算
词语语义
词语合并
词性筛选
文本相似度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 融合主题模型的在线可比度计算研究
来源期刊 现代信息科技 学科 工学
关键词 可比语料库 可比度 主题模型 主题映射
年,卷(期) 2019,(14) 所属期刊栏目 信息技术
研究方向 页码范围 1-4
页数 4页 分类号 TP391.1
字数 3163字 语种 中文
DOI 10.3969/j.issn.2096-4706.2019.14.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 谷琼 湖北文理学院计算机工程学院 51 250 9.0 13.0
2 赵永标 湖北文理学院计算机工程学院 20 35 4.0 4.0
3 张其林 湖北文理学院计算机工程学院 29 63 4.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
可比语料库
可比度
主题模型
主题映射
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
现代信息科技
半月刊
2096-4706
44-1736/TN
16开
广东省广州市白云区机场路1718号8A09
46-250
2017
chi
出版文献量(篇)
4784
总下载数(次)
45
总被引数(次)
3182
论文1v1指导