基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
经济户口数据匹配是将经济户口中包含的企业名称和驻址等基本信息通过地名地址的规范化和一系列匹配算法,得到最佳匹配坐标并定位到电子地图上的过程,是我国推行全面数字化建设的重要举措。本文系统分析了经济户口数据的组织形式,深入研究了中文匹配的原理特点,并以潍坊市奎文区9000多条经济户口数据作为训练集,设计构建了基于双字哈希和数组三层数据结构的经济户口语料库,总结制定了涵盖500种行业类型的三级编码规则,并根据中文词条的文字相似性和行业之间的相关关系,设置文字和类型相似度值,采用动态加权方法求得复合相似度指标,建立了基于经济户口语料库的相似度匹配方法。文章最后以潍坊市潍城区8000多条经济户口数据作为测试集,对本文提出的匹配方法进行实验验证。试验结果表明,利用本文设计的经济户口语料库和相似度匹配方法能够高效地完成经济户口数据的唯一性匹配和相似度匹配,极大地提高了检索效率和匹配成功率,具有良好的实际可操作性。
推荐文章
基于Web检索的陕北民歌语料库设计
语料库
陕北民歌
频度统计
Web检索
关于旅游英语语料库的运用
旅游英语
语料库
标示语翻译
运用
面向事件的多语平行语料库构建研究
语料收集原则
标注规范
可控多语语料库
基于语料库的“有点”和“稍微”的多维辨析
“有点”
“稍微”
语料库
近义词辨析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于经济户口匹配的语料库建设
来源期刊 测绘与空间地理信息 学科 地球科学
关键词 语料库 经济户口 相似度匹配
年,卷(期) 2016,(4) 所属期刊栏目 3S 技术与应用
研究方向 页码范围 131-134
页数 4页 分类号 P208
字数 3295字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李云岭 山东科技大学测绘科学与工程学院 36 426 11.0 20.0
2 韩帅 山东科技大学测绘科学与工程学院 10 21 3.0 4.0
3 郭丰堂 山东科技大学测绘科学与工程学院 3 4 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (19)
共引文献  (109)
参考文献  (6)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1965(1)
  • 参考文献(0)
  • 二级参考文献(1)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(5)
  • 参考文献(1)
  • 二级参考文献(4)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
语料库
经济户口
相似度匹配
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
测绘与空间地理信息
月刊
1672-5867
23-1520/P
大16开
哈尔滨市南岗区测绘路32号
14-5
1978
chi
出版文献量(篇)
11361
总下载数(次)
46
总被引数(次)
45485
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导