基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文介绍了一个SQL数据库支持下的、基于C#正则表达式的英汉翻译对抽取方法,待抽取的资料均来自网络,包括机读电子词典和多种含英汉翻译对的网页,它们具有固定的正则表达式模式.抽取工作用到两个用C#开发的Windows应用程序:网页爬虫和翻译对抽取应用程序.下载的网页和抽取的翻译对都存在SQL数据库中,可供进一步研究使用.结果显示,这种方法抽取的翻译对准确率非常高,能很快收集大量翻译对建成生英语平行语料库.
推荐文章
网页清洗系统基于静态正则表达式的实现
网页清洗
,静态正则表达式
Xpressive
基于Bloom filter的高效正则表达式匹配算法
正则表达式
确定有限自动机
布鲁姆过滤器
比特向量
确定字符串
匹配概率
匹配速率
基于正则表达式的协议行为审计技术研究
协议行为审计
正则表达式
协议解析
安全审计
信息安全
面向网络流的自适应正则表达式分组匹配算法
深度包检测
正则表达式
分组
有限自动机
伸展树
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于C#正则表达式的英汉翻译对抽取
来源期刊 科技信息 学科 工学
关键词 英汉翻译对 抽取 正则表达式 语料库
年,卷(期) 2011,(26) 所属期刊栏目 博士·专家论坛
研究方向 页码范围 1-2
页数 分类号 TP312
字数 4632字 语种 中文
DOI 10.3969/j.issn.1001-9960.2011.26.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 宋兰 解放军信息工程大学理学院外语系 2 1 1.0 1.0
2 严灿勋 解放军信息工程大学理学院外语系 7 43 4.0 6.0
3 刘慧敏 解放军信息工程大学理学院外语系 7 43 4.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (7)
参考文献  (2)
节点文献
引证文献  (1)
同被引文献  (33)
二级引证文献  (2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
英汉翻译对
抽取
正则表达式
语料库
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
科技信息
旬刊
1001-9960
37-1021/N
大16开
山东省济南市
24-72
1984
chi
出版文献量(篇)
124239
总下载数(次)
249
总被引数(次)
255660
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导