作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着计算机技术的普及,基于机器语言的文本处理方法开始应用到各个领域,如何结合统计方法和机器方法的优势并将其应用于文本自动处理自然成为国内外语料库语言学研究的重点.和国外相比,国内对中文文本处理领域的研究相对落后一些,因此基于机器语言的中文文本处理成为一项非常有意义的研究课题,特别是对于汉语编码以及词语切分问题都具有极其现实的意义.基于HSK动态作文语料库中,母语为英语的汉语学习者汉语等级水平考试作文语料及自建的中国大学生汉语作文语料库,针对汉语语料库加工问题进行探讨和研究.通过动宾搭配研究中的分词赋码、高频词提取、句法分析等主要环节,深入观察语料,发现相比汉语本族语者,母语为英语的汉语学习者显著较少使用动宾搭配,为下一步的研究提出展望.
推荐文章
中文文本分类研究
文本分类
k 近邻
支持向量机
最大熵
基于语义列表的中文文本聚类算法
文本聚类
文本表示
语义列表
相似度计算
聚簇表示
基于Python的中文文本分类的实现
Python
中文
文本分类
实现
中文文本抄袭检查技术的研究
抄袭检查
中文文本
中文分词
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Python语言的中文文本处理研究
来源期刊 南昌工程学院学报 学科 工学
关键词 Python语言 中文文本 语料库
年,卷(期) 2018,(3) 所属期刊栏目
研究方向 页码范围 70-75
页数 6页 分类号 TP391.1
字数 4832字 语种 中文
DOI 10.3969/j.issn.1006-4869.2018.03.015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 温珍 南通大学外国语学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (101)
参考文献  (6)
节点文献
引证文献  (3)
同被引文献  (21)
二级引证文献  (0)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Python语言
中文文本
语料库
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
南昌工程学院学报
双月刊
1006-4869
36-1288/TV
大16开
江西省南昌市天祥大道289号,南昌工程学院学报编辑部
1982
chi
出版文献量(篇)
2353
总下载数(次)
9
论文1v1指导