基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
经过统计发现在中文词组语料中具有字词重复特性的词组具有较高的错字率。对词组的字训重复模式进行了分类统计,统计了不同重复模式的出错率。了解到高错字率的重复模式。比如重复字词出现在词组尾部,或者出现连续性重复,则出错概率较大。基于字词重复模式的出错率数据,推荐了两种对人肌模词组语料进行人工校对的优化策略。
推荐文章
基于混合聚类的中文词聚类
词聚类
层次聚类
概念聚类
混合聚类
基于分布的中文词表示研究
分布表示
语义相似度
逐点互信息
中文词表检索技术研究
中文信息处理
电子词表
哈希函数
泊松分布
利用词汇分布相似度的中文词汇语义倾向性计算
中文信息处理
词汇分布相似度
语义倾向
依存句法分析
知网
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于字词重复模式及错字率的中文词组语料校对策略
来源期刊 教学与科技 学科 工学
关键词 中文词组语料 校对策略 字词重复模式 错字率
年,卷(期) 2014,(4) 所属期刊栏目
研究方向 页码范围 38-42
页数 5页 分类号 TP301.6
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王云 33 33 4.0 5.0
2 杨存榜 21 56 5.0 6.0
3 陈红素 4 4 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
中文词组语料
校对策略
字词重复模式
错字率
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
教学与科技
季刊
四川省绵阳市科学城工学院
出版文献量(篇)
1153
总下载数(次)
9
总被引数(次)
0
论文1v1指导