基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在机器翻译、自动分类、搜索引擎等技术中,彝文分词具有很重要的作用,同时也是彝文信息处理至关重要的环节.本文以当前的彝文分词技术为基础,通过构建彝文词库,并用彝文网页获取平台抓取彝文网页文本,结合彝文特有的优势,从分词词库、分词算法、结构流程、系统界面和模块、实验结果等方面进行了详细的分析,最终实现彝文网页文本分词平台.最后的结果表明,本平台分词准确率较高,实用性和通用性也较好.
推荐文章
基于文本分类的网页排序算法
网页排序算法
网页类型
网页年龄
网页点击率
LD A模型下不同分词方法对文本分类性能的影响研究
文本分类
LDA主题模型
语料度量
分词方法
融合LSI和支持向量聚类的网页文本分类算法
特征提取
潜在语义索引
网页文本
语义聚类
支持向量聚类
面向彝文网页的敏感内容分级系统研究
彝文网络
敏感信息
内容分级
舆情分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 彝文网页文本分词平台
来源期刊 计算机系统应用 学科
关键词 彝文网页 词典分词 词库 彝文分词 分词平台
年,卷(期) 2016,(11) 所属期刊栏目 研究开发
研究方向 页码范围 243-246
页数 4页 分类号
字数 3925字 语种 中文
DOI 10.15888/j.cnki.csa.005399
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王嘉梅 云南民族大学电气信息工程学院 57 177 7.0 9.0
2 李炳泽 云南民族大学电气信息工程学院 7 12 2.0 2.0
3 胡刚 云南民族大学电气信息工程学院 5 13 2.0 3.0
4 孙善通 云南民族大学电气信息工程学院 4 14 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (8)
共引文献  (16)
参考文献  (8)
节点文献
引证文献  (3)
同被引文献  (8)
二级引证文献  (0)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(4)
  • 参考文献(1)
  • 二级参考文献(3)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
彝文网页
词典分词
词库
彝文分词
分词平台
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
总被引数(次)
57078
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导