东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

汉英机器翻译中趋向动词处理研究

ISSN号：1000-8608
期刊名称：《大连理工大学学报》
时间：0
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术] H087[语言文字—语言学]
作者机构：[1]大连理工大学计算机科学与工程系,辽宁大连116024
相关基金：国家自然科学基金资助项目（60373095,60373096）.

关键词：机器翻译, 中文趋向动词, 词典, machine translation, Chinese directional verbs, dictionary

中文摘要：

在大规模语料的基础上，对趋向动词的用法和上下文信息进行了统计和分析，得到了趋向动词在谓词后面作趋向补语的概率、小概率作趋向补语（即趋向动词在谓词后面作补语的概率介于两个阈值之间）时的上下文信息；建立了一个基于趋向动词在谓词后面作趋向补语的概率统计模型来识别趋向动词用法，同时，根据趋向动词与谓词搭配后词义变化情况，对词典进行了补充．封闭测试识别精确率达99．01％，召回率达96．67％；开放测试识别精确率达98．14％，召回率达96．19％．

英文摘要：

The usages and the contexts of Chinese directional verbs in large-scale corpus are analyzed, and the probabilities of directional complements behind verbs or adjectives are obtained. Also, the context information is achieved when the probabilities of directional complements are between two thresholds. Then a Chinese directional verb processing system is set up, which is built on statistical models. It is used to identify the different usages of Chinese directional verbs. At the same time, according to the word senses of Chinese directional verbs as directional complements, the dictionary is reinforced. The experiments have achieved 99.01% precision rate and 96.67% recall rate in close test, and 98. 14% precision rate and 96.19% recall rate in open test.

同期刊论文项目

具有相同路径层矩阵的图、应用及算法研究

期刊论文 34 会议论文 3

WEB文本挖掘中知识模式的抽取和评价机制

期刊论文 86 会议论文 8

同项目期刊论文

基于SVM的组块识别及其错误驱动

SVM与规则相结合的中文地名自动

汉语自动分词中中文地名识别

基于段落匹配和分布密度的偏重摘

基于概念和统计的问答系统实现机

关键词密度分布法在偏重摘要中的

基于用户聚类的电子商务推荐系统

信息自适应过滤的效用指标优化方

基于用户向量扩展的协同推荐方法

开放式汉语自动分词的学习机制

用支持向量机进行中文地名识别的

生物医学文献分类方法的比较

基于PageRank和锚文本的网页排序

基于词典法和机器学习法相结合的

基于语义理解的文本倾向性识别机

基于问句相似度的中文FAQ问答系

基于改进编辑距离和依存结构的句

中文文本信息的自动抽取和相似检

基于概念和关联扩充的文本标题分

基于ONTOLOGY的个性化推送系统

文本分类中多分类器的综合机制

基于完全二阶隐马尔可夫模型的汉

一种与分词一体化的中文人名识别

粒子群优化算法的收敛性分析及其

中文文本中外国人名与中国人名同

基于动态规划的最小代价路径汉语

中文地名的自动识别

基于支持向量机的中国人名的自动

基于N-level VSM在web信息检索中

基于Internet的军事演习信息抽取

基于网页框架和规则的网页噪音去

基于矩阵划分和兴趣方差的协同过

中文文本体裁的自动分类机制

基于AdaBoostMH算法的汉语多义词

基于How-net的话题跟踪及倾向性

基于内容计算和链接分析的Web话

可视化文本分类树浏览机制

基于段落匹配和分布密度的偏重摘要实现机制

基于编辑距离和多种后处理的生物实体名识别

基于动态规划的最小代价路径汉语自动分词

中文文本的信息自动抽取和相似检索机制

基于锚信息的生物医学文献双语摘要句子对齐

基于矩阵划分和兴趣方差的协同过滤算法

文本挖掘中的知识模式表示、评价及检索机制

搜索引擎发展阶段研究及热点发现

基于半监督学习的蛋白质关系抽取研究

分布式检索中基于主题的语言模型集合选择策略

一种与分词一体化的中文人名识别方法

中文文本中外国人名与中国人名同步识别方法

基于AdaBoost.MH算法的汉语多义词消歧

基于混合模型的中国人名自动识别

SVM与规则相结合的中文地名自动识别

基于SVM的组块识别及其错误驱动学习方法

基于ChunkCRF的观点持有者识别及其在观点摘要中的应用

基于高斯混合模型的生物医学领域双语句子对齐

基于语义结构的科技论文抄袭检测

情感词汇本体的构造

基于文本挖掘机制的区域经济关系分析

中文情感常识知识库的构建

我国知识管理领域研究热点问题及发展趋势预测

基于支持向量机的人物属性抽取

基于语义特征和本体的语篇情感计算

人际网络关系抽取和结构挖掘

基于结构和链接扩展的中文网页分类研究

基于词典法和机器学习法相结合的蛋白质名识别

基于文档语义图的中文多文档摘要生成机制

On (a,d)-antimagic labelings o

Extremal graphs without three-

On the domination number of ge

The planar Ramsey number PR(K4

The crossing numbers of Cartes

The crossing number of Knodel

Super edge-magic labelings of

New lower bounds on the multic

The graphs C7t are graceful fo

The graphs C9t are graceful fo

The least possible diameter fo

On the three color Ramsey numb

The crossing number of C(mk;{1

The value of the Ramsey number

The crossing number of C(n;{1,

三色Ramsey数 r（Cm1,Cm2,Cm3）

汉语自动分词中的中文地名识别

The graphs C5t are graceful fo

Some 3-connected 4-edge-critic

The graphs C11t are graceful f

On harmonious labelings of the