基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
社会标注是一种用户对网络资源的大众分类,蕴含了丰富的语义信息,因此将社会标注应用到信息检索技术中有助于提高信息检索的质量.研究了一种基于社会标注的文本分类改进算法以提高网页分类的效果.由于社会标注属于大众分类,标注的产生具有很大的随意性,标注的质量差别很大,因此首先利用文档间的语义相似度以及标注间的语义相似度来对标注的质量进行量化评估.在此基础上对标注进行质量过滤,利用质量相对较好的标注对文档向量空间模型进行扩展,将文档表示成由文档单词以及文档标注信息组成的扩展向量.同时采用支持向量机分类算法进行分类实验.实验结果表明,通过对标注进行质量评估并过滤质量差的标注,同时结合文档内容以及标注来对文档能提高分类的效果,同传统的基于文档内容的分类算法相比,分类结果的F1度量值提高了6.2%.
推荐文章
一种基于语义标注特征的金融文本分类方法
文本分类
金融文本
语义标注
词汇—语义模式
有限状态机
基于fcmpCNN模型的网络文本情感多分类标注
情感分析
情感多分类标注
卷积神经网络
基于发现特征子空间模型的文本分类算法
发现特征子空间
文本分类
模式
基于隶属度限幅特征VSM的文本分类模型
模糊函数
隶属度限幅
类期望向量
文本分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于社会标注质量的文本分类模型框架
来源期刊 计算机应用 学科 工学
关键词 社会标注 向量空间模型 文本分类 信息检索 数据挖掘
年,卷(期) 2012,(5) 所属期刊栏目 人工智能
研究方向 页码范围 1335-1339
页数 分类号 TP311|TP91.3
字数 7043字 语种 中文
DOI 10.3724/SP.J.1087.2012.01335
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 辜希武 华中科技大学计算机科学与技术学院 21 338 9.0 18.0
2 李劲 湖北民族学院信息工程学院 37 219 8.0 13.0
4 向军 湖北民族学院信息工程学院 30 126 6.0 10.0
5 张华 湖北民族学院信息工程学院 21 143 6.0 11.0
8 吴浩雄 湖北民族学院信息工程学院 3 70 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (21)
参考文献  (2)
节点文献
引证文献  (8)
同被引文献  (13)
二级引证文献  (2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(2)
  • 引证文献(2)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
社会标注
向量空间模型
文本分类
信息检索
数据挖掘
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导