基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
左右熵在自然语言处理领域有着广泛应用,但目前尚无有效方法实施大规模语料中海量模式的左右熵快速计算.提出了一种计算方法,对于某长度字串计算熵,首先按长度提取语料中的全部字串,使用外部排序和归并获取字串的出现频率,然后分别剔除首尾字符构造待计算字串的频率提供文件,最后使用文件记录频率对比来计算右熵和左熵.分析和实验表明,该方法的计算量同语料规模成线性关系,适于大规模语料中海量字串的左右熵计算.
推荐文章
基于高斯声束模型的快速声场计算方法
鱼雷
高斯声束
BELLHOP
声场计算方法
基于GaBP 算法的快速潮流计算方法
潮流计算
PQ分解法
稀疏线性方程组
GaBP算法
GMRES算法
Steffensen加速迭代法
基于树型结构的三维快速等距面计算方法
移动截面
重定距
水平集
自适应网格剖分
快速等距方法
基于WSEIAC的复杂系统效能计算方法
效能
最小路集
可靠度
维修度
可用度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于外部排序的字串左右熵快速计算方法
来源期刊 计算机工程与应用 学科 工学
关键词 自然语言处理 左右熵 统计特征 新词检测
年,卷(期) 2011,(19) 所属期刊栏目 博士论坛
研究方向 页码范围 18-20
页数 分类号 TP391
字数 4760字 语种 中文
DOI 10.3778/j.issn.1002-8331.2011.19.006
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 彭成 新疆师范大学计算机科学技术学院 9 8 2.0 2.0
2 栾静 新疆师范大学计算机科学技术学院 27 159 4.0 12.0
3 张海军 新疆师范大学计算机科学技术学院 23 155 5.0 12.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (14)
共引文献  (17)
参考文献  (4)
节点文献
引证文献  (4)
同被引文献  (7)
二级引证文献  (16)
1962(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(3)
  • 参考文献(0)
  • 二级参考文献(3)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(3)
  • 参考文献(2)
  • 二级参考文献(1)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(4)
  • 引证文献(0)
  • 二级引证文献(4)
2015(4)
  • 引证文献(1)
  • 二级引证文献(3)
2016(2)
  • 引证文献(0)
  • 二级引证文献(2)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(3)
  • 引证文献(0)
  • 二级引证文献(3)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
自然语言处理
左右熵
统计特征
新词检测
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导