基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
电子文档的飞速增长为自动文本分类提供了巨大的机遇和挑战.在现有的众多方法中,关联分类以其较高的准确率和较快的训练时间而成为一种重要的自动文本分类方法.为实现基于关联的文本分类,首先需要将无结构的文本转换为结构化的事务数据,本文提出的prefix-hsh-tree是针对汉语的特殊性而设计的一种数据结构,利用它可以方便地将中文文本转化为事务数据,实验证明利用该数据结构相应的查找、插入和重构算法都具有较好的效率.
推荐文章
中文文本的LZSS算法实现及研究
数据压缩
LZSS算法
压缩比
字典
中文文本分类系统的设计与实现
文本分类
向量空间模型
特征项选择
权重
中文文本分类研究
文本分类
k 近邻
支持向量机
最大熵
中文文本抄袭检查技术的研究
抄袭检查
中文文本
中文分词
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 利用prefix-hash-tree实现从中文文本到事务数据的转换
来源期刊 计算机科学 学科 工学
关键词 中文文本分类 prefix-hsh-tree 事务数据
年,卷(期) 2005,(5) 所属期刊栏目 人工智能与图像处理技术
研究方向 页码范围 167-169,184
页数 4页 分类号 TP3
字数 5748字 语种 中文
DOI 10.3969/j.issn.1002-137X.2005.05.046
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王元珍 华中科技大学计算机学院数据库与多媒体技术研究所 86 1120 18.0 30.0
2 钱铁云 华中科技大学计算机学院数据库与多媒体技术研究所 3 48 2.0 3.0
3 冯小年 5 38 3.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (22)
共引文献  (132)
参考文献  (4)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(3)
  • 参考文献(0)
  • 二级参考文献(3)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(4)
  • 参考文献(2)
  • 二级参考文献(2)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2007(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
中文文本分类
prefix-hsh-tree
事务数据
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
论文1v1指导