基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
商品评论文本对消费者和商家的决策都有重要参考价值.用户在评论中使用的语言较为随意,语法结构不规则,给文本分析带来很大难度.正确的句子切分是文本信息抽取和挖掘工作的基础.为解决商品评论中用户省略标点情况下的句子切分问题,基于上下文特征,提出使用机器学习的方法对评论长句进行切分.根据大规模评论语料的统计特征选取候选句子切分点,对每一个候选句子切分点提取其上下文特征,并根据语料的统计特征,使用逻辑回归对候选切分点进行分类.实验结果表明,该方法能够有效解决商品评论中用户省略标点情况下的句子切分问题.
推荐文章
基于光谱上下文特征的多光谱舰船ROI鉴别方法
多光谱遥感图像
舰船ROI鉴别
光谱特征
梯度方向
SVM分类
图像分辨率
基于觉察上下文计算的降低服务成本方法
服务成本
觉察上下文计算
资源发现与交互
普适计算
基于用户兴趣的局部上下文分析方法
信息检索
查询扩展
局部上下文分析
用户兴趣
一种基于上下文的语义映射方法
本体
本体映射
语义
上下文
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于上下文特征分类的评论长句切分方法
来源期刊 计算机工程 学科 工学
关键词 句子切分 标点省略 机器学习 上下文特征 N元文法 逻辑回归
年,卷(期) 2015,(9) 所属期刊栏目 人工智能及识别技术
研究方向 页码范围 233-237,244
页数 6页 分类号 TP311
字数 5912字 语种 中文
DOI 10.3969/j.issn.1000-3428.2015.09.043
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 岳丽华 中国科学技术大学计算机科学与技术学院 98 866 15.0 24.0
2 金培权 中国科学技术大学计算机科学与技术学院 52 467 12.0 19.0
3 胡玉娟 合肥师范学院公共计算机教学部 35 124 7.0 9.0
4 殷凤梅 合肥师范学院公共计算机教学部 31 29 4.0 4.0
5 陈鸿 合肥师范学院公共计算机教学部 11 5 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (41)
共引文献  (351)
参考文献  (10)
节点文献
引证文献  (2)
同被引文献  (4)
二级引证文献  (9)
1989(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(4)
  • 参考文献(0)
  • 二级参考文献(4)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(8)
  • 参考文献(1)
  • 二级参考文献(7)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(5)
  • 参考文献(2)
  • 二级参考文献(3)
2007(7)
  • 参考文献(1)
  • 二级参考文献(6)
2008(5)
  • 参考文献(2)
  • 二级参考文献(3)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(5)
  • 参考文献(2)
  • 二级参考文献(3)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(2)
  • 引证文献(1)
  • 二级引证文献(1)
2019(7)
  • 引证文献(0)
  • 二级引证文献(7)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
句子切分
标点省略
机器学习
上下文特征
N元文法
逻辑回归
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
论文1v1指导