基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文本分割在信息检索、摘要生成、问答系统、信息抽取等领域发挥着重要作用.在总结现有的国内外文本分割方法的基础上,提出了一种基于领域本体对文本进行线性分割的方法.该方法利用初始概念自动获取结构化语义概念集合,并根据获取的概念、属性及属性词在文本中出现的频次、位置和关系等因素为段落赋予语义标签,挖掘文本的子主题信息,将拥有相同语义标注信息的段落划分为相同语义段落,实现了文本不同子主题之间的分割.实验结果表明,该方法对于特定领域的文本分割的准确率、召回率以及F值分别达到了85%,90%和88%,分割效果能够满足实际应用需求,并优于现有的无需训练语料的文本分割方法.
推荐文章
采用并行遗传算法的文本分割研究
中文信息处理
文本分割
遗传算法
基于领域本体的文本分类方法
领域本体
文本分类
本体概念
信息量
推理
语义关联
基于重要事件的文本分类方法研究
文本分类
文本表示
重要事件
SVM
面向审计领域的短文本分类技术研究
审计问题分类
审计领域
信息增益
SVM决策树
短文本分类
审计报告
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于领域本体的文本分割方法研究
来源期刊 计算机科学 学科 工学
关键词 文本分割 领域本体 语义标注 语义段落
年,卷(期) 2018,(1) 所属期刊栏目 第十六届中国机器学习会议
研究方向 页码范围 128-132,156
页数 6页 分类号 TP391.1
字数 7960字 语种 中文
DOI 10.11896/j.issn.1002-137X.2018.01.021
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘耀 23 129 7.0 10.0
2 黄毅 7 26 3.0 5.0
3 帅远华 1 4 1.0 1.0
4 龚幸伟 1 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (16)
共引文献  (30)
参考文献  (6)
节点文献
引证文献  (4)
同被引文献  (32)
二级引证文献  (2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(3)
  • 参考文献(1)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(5)
  • 参考文献(1)
  • 二级参考文献(4)
2006(2)
  • 参考文献(1)
  • 二级参考文献(1)
2007(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(1)
2018(2)
  • 引证文献(1)
  • 二级引证文献(1)
2019(4)
  • 引证文献(3)
  • 二级引证文献(1)
研究主题发展历程
节点文献
文本分割
领域本体
语义标注
语义段落
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
论文1v1指导