作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
生物医学领域信息量的飞速增长,极大地促进了人们的交流和研究,同时也使人们在海量的信息面前无所适从:这就提出了对信息进行分类筛选的需求。词库对于文本分类的结果有着至关重要的作用,只有能实时更新新词的词库才能适应使用的需要。该文章提出并实现一种基于频繁序列的新词挖掘算法,能够正确提取出中文文本中的新词,从而及时更新维护词库,使文本分类更为准确。
推荐文章
一种基于哈夫曼树的最大频繁序列挖掘算法
数据挖掘
序列模式
最大频繁序列
哈夫曼树
采用填充字符的频繁序列模式挖掘算法
序列模式挖掘
填充字符
固定间隔
Apriori属性
基于不确定数据的可能频繁闭序列模式挖掘
不确定数据
可能频繁闭序列模式
概率频繁
不确定数据挖掘
闭序列模式
序列模式增长
基于频繁活动序列挖掘的过程改进机会分析
质量管理过程
改进机会
工作流
频繁活动序列
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于频繁序列的新词挖掘算法
来源期刊 电脑知识与技术:学术交流 学科 工学
关键词 分词 文本分类 频繁序列
年,卷(期) 2006,(5) 所属期刊栏目
研究方向 页码范围 98-99
页数 2页 分类号 TP391
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 孙啸 东南大学生物电子学国家重点实验室 71 488 12.0 20.0
2 周俊 东南大学生物电子学国家重点实验室 56 304 10.0 16.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
分词
文本分类
频繁序列
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电脑知识与技术:学术版
旬刊
1009-3044
34-1205/TP
安徽合肥市濉溪路333号
26-188
出版文献量(篇)
41621
总下载数(次)
23
总被引数(次)
0
论文1v1指导