基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
流行的Segmenter分词算法是开放的java源代码,它是一个很好的分词工具。但是,在全文检索系统中对分词有特殊的要求,例如歧义包客、专业词典等。所以在这里将Segmenter词典和算法都进行了改选,建立了树状词典,在匹配算法中使用了歧义包容法则、分支处理、动态规划和词库预载入。以适应电子商务案例全文检索系统。
推荐文章
中文全文检索系统中基于分词技术的研究
中文全文检索
中文分词
字索引
CAD电子图管理系统中全文检索的研究
电子图管理系统
全文检索
中文分词
基于最大熵算法的全文检索研究
全文检索
最大熵模型
分词
多站点信息发布平台的全文检索技术
全文检索
中文分词
索引维护
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于全文检索的Segmenter分词算法改进
来源期刊 电脑知识与技术:学术交流 学科 工学
关键词 分词 全文检索 树形词典 歧义包容 分支处理 动态规划 词库预载入
年,卷(期) 2009,(1) 所属期刊栏目
研究方向 页码范围 202-205
页数 4页 分类号 TP391
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 赵远东 南京信息工程大学信息与控制学院 38 265 8.0 15.0
2 陈建华 南京信息工程大学信息与控制学院 5 83 3.0 5.0
3 陈康 南京信息工程大学信息与控制学院 5 14 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (9)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
分词
全文检索
树形词典
歧义包容
分支处理
动态规划
词库预载入
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电脑知识与技术:学术版
旬刊
1009-3044
34-1205/TP
安徽合肥市濉溪路333号
26-188
出版文献量(篇)
41621
总下载数(次)
23
总被引数(次)
0
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导