基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了一种基于网络蜘蛛的新词发现算法,通过该算法可以快速有效地搜集互联网资料,并从中自动发现新词。实验表明,该方法可以从网上快速搜集新词,获得的词典在分词能力上较传统方法有很大提高。
推荐文章
基于互信息改进算法的新词发现对中文分词系统改进
新词识别
未登录词
互信息
PMI改进算法
中文分词
网络新词识别算法研究
社交网络
新词识别
准确率
基于Trie树的词语左右熵和互信息新词发现算法
新词发现算法
左右熵
互信息
Trie树
算法设计
对比验证
基于网络蜘蛛的搜索引擎自动发现
元搜索引擎
自动发现
网络蜘蛛
元信息
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于网络蜘蛛的新词自动发现算法研究
来源期刊 长春工程学院学报:自然科学版 学科 工学
关键词 中文分词 词典 新词发现 网络蜘蛛
年,卷(期) 2011,(3) 所属期刊栏目 信息技术及应用
研究方向 页码范围 83-85
页数 分类号 TP391.1
字数 2427字 语种 中文
DOI 10.3969/j.issn.1009-8984.2011.03.024
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张素莉 长春工程学院电气与信息工程学院 30 85 5.0 8.0
2 潘欣 长春工程学院电气与信息工程学院 17 28 3.0 4.0
3 吕静波 6 8 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (3)
同被引文献  (0)
二级引证文献  (0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(2)
  • 引证文献(2)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
中文分词
词典
新词发现
网络蜘蛛
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
长春工程学院学报(自然科学版)
季刊
1009-8984
22-1323/N
大16开
长春市红旗街2494号
2000
chi
出版文献量(篇)
2446
总下载数(次)
14
总被引数(次)
7520
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导