基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
没有语言ID的维、哈、柯文部分字母在Unicode代码区域中共享字符代码,因此在信息交换、自动分词和检索应用中,很难区分维、哈、柯文字母.存在语言上的二义性.另外,该区域中字母的顺序符合阿拉伯字母表,维、哈、柯文字母的顺序非常混乱,这对于维、哈、柯多文种数据的索引、排序和查询处理带来了很大困难.针对以上问题,研究了一种内部Unicode编码方法和基于词根的多文种索引技术.研究结果表明,这种方法完全解决了多文种信息的存储、排序等数据库管理问题,大大简化了索引技术及实现难度.
推荐文章
维、哈、柯文显示及排版技术研究
维哈柯文
显示及排版
字母选形
文本断行
字母拉长
基于语义的多文种编码方案SemaCode
多文种编码方案
语义
层次结构
词编码
维、哈、柯多文种全文搜索引擎的设计与实现
多文种搜索引擎
检索词预处理
到排索引
字符编码标准化
维、哈、柯多文种考试系统的设计
考试系统
数据库
多文种
Unicode
Delphi
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于重定位的维、哈、柯文Unicode 编码及多文种索引技术研究
来源期刊 郑州大学学报(理学版) 学科 工学
关键词 Unicode RuniForm MD5 倒排索引
年,卷(期) 2009,(1) 所属期刊栏目
研究方向 页码范围 48-51,55
页数 5页 分类号 TP181
字数 1808字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吐尔地·托合提 新疆大学信息科学与工程学院 19 115 7.0 10.0
2 维尼拉·木沙江 新疆大学信息科学与工程学院 36 127 6.0 9.0
3 吐尔洪·吾司曼 新疆大学信息科学与工程学院 3 11 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (26)
参考文献  (4)
节点文献
引证文献  (4)
同被引文献  (12)
二级引证文献  (8)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(2)
  • 引证文献(0)
  • 二级引证文献(2)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(3)
  • 引证文献(0)
  • 二级引证文献(3)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
Unicode
RuniForm
MD5
倒排索引
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
郑州大学学报(理学版)
季刊
1671-6841
41-1338/N
大16开
郑州市高新技术开发区科学大道100号
36-191
1962
chi
出版文献量(篇)
2278
总下载数(次)
0
总被引数(次)
9540
论文1v1指导