东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

动态多文档文摘模型

ISSN号：1000-9825
期刊名称：软件学报
时间：2012
页码：289-298
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]教育部-微软语言语音重点实验室（哈尔滨工业大学）,黑龙江哈尔滨150001, [2]东北林业大学信息与计算机工程学院,黑龙江哈尔滨150040
相关基金：国家自然科学基金（60736014,60773069,61073130）;国家高技术研究发展计划（863）（2006AA010108）
相关项目：基于迁移学习的自适应信息抽取技术研究

关键词：多文档文摘, 差异性分析, 矩阵模型, 相似度累加, 动态演化, multi-document summarization, otherness analysis, matrix model, similarity cumulative, dynamic evolvement

中文摘要：

从网络信息的动态演化性出发，对同一话题不同时序阶段的文档集合进行识别和分析，在度量演化内容差异性的基础上实现动态性，给出了两种实现动态多文档文摘的模型，即基于矩阵子空间分析和基于文本相似度累加的动态多文档文摘模型．在此基础上，提出了高效的动态句子加权方法．TAC2008的Update Summarization测试数据上的实验证明了所提出的动态多文档文摘模型的有效性．

英文摘要：

This paper introduces two models to describe dynamic evolution of network information： identify and analysis the document collection on the same topic in different stages. In order to construct dynamic of evolution content differences, two dynamic multi-document summarization models are presented, which are matrix subspace analysis model, text similarity cumulative model. Based on these models, some efficient dynamic sentence weighting algorithms are implemented. Experiments on the test data of Update Summarization in TAC 2008 and comparative results between new models and TAC 2008 evaluation, shows the effectiveness of the models.

同期刊论文项目

基于迁移学习的自适应信息抽取技术研究

期刊论文 15 会议论文 24

英汉动词次范畴化对应关系自动获取研究

期刊论文 21 会议论文 10

融合语言知识与统计模型的机器翻译方法研究

期刊论文 77 会议论文 94 专利 4 著作 2

同项目期刊论文

动词次范畴化形式描写的语义与句法

汉英动词次范畴化对应关系的形式描写

动词次范畴英汉论元对应关系获取

汉英动词次范畴化对应关系自动获取

双语词典在统计机器翻译中的应用

Chinese Word Segmenter Based on Discriminative Classifiers Integration

头驱动句法分析中的直接插值平滑算法研究

基于加权子序列核函数的次范畴论元分析

基于无向图序列标注模型的中文分词词性标注一体化系统

English and Chinese Verb Subcategorization Lexicon Construction

基于网络的动态多文档文摘系统框架

汉语动词次范畴化的形式描写

基于特征组合的中文语义角色标注

一种快速网页检索结果聚类策略

头驱动句法分析中的直接插值平滑算法

以机器翻译技术为核心的多语信息处理研究

Dynamic Incremental Event Sub-topic Detection and Tracking

基于 Deep Belief Nets 的中文名实体关系抽取

基于网络的动态多文档文摘系统框架

基于相似度线性加权方法的检索结果聚类研究

基于浅层句法特征的评价对象抽取研究

Dynamic Multi-Document Summarization Research Based on Matrix subspace Analysis Model

网络信息抽取技术分析与比较

Research on Opinion Feature Extraction with Unsupervised Learning and Heuristics

Research on search results optimization technology with category features integration

Automatic English-Chinese Parallel Corpus Acquisition and Sentences Extraction

基于Deep Belief Nets的中文名实体关系抽取

基于Deep Belief Nets方法的中文名实体分类研究

对数线性翻译模型的判别式训练综述

基于序列标注模型的分层式依存句法分析方法

词汇相似度约束的短语抽取

汉英双语命名实体识别与对齐的交互式方法

基于网络的动态多文档文摘系统框架

汉英词语对齐规范

基于短语模糊匹配和句子扩展的统计翻译方法

英汉术语翻译中的组合性不对称现象

统计机器翻译中多分词结果的融合

Joint decoding of multi-confusion-network in MT system combination

基于WordNet词义消歧的系统融合

Improve the Statistical Machine Translation Performance by Refining the Word Alignments

Improvement of Machine Translation Evaluation by Simple Linguistically Motivated Features

基于句法的统计机器翻译模型与方法

口语对话中冗余词汇识别方法研究

基于特征组合的中文语义角色标注

Improvement of machine translation evaluation by simple linguistically motivated feaures

Chinese-English Translation of Company Names and Addresses in a Large –Scale Database

中文词法分析与句法分析融合策略研究

一种考虑对齐不一致的短语翻译概率估计方法

维吾尔语中汉族人名的识别及翻译

基于最大熵短语重排序模型的特征抽取算法改进

题录信息的机器翻译方法

利用依存限制抽取长距离调序规则

面向移动终端的统计机器翻译解码定点化方法

模糊匹配在树到串翻译模型中的应用

多策略的增量TER指导系统融合

基于Web的双语平行句对自动获取

RM-structure alignment based statistical machine translation model

基于句法的统计机器翻译综述

基于信息检索方法的统计翻译系统训练数据选择与优化

基于双语约束的蒙古语无监督依存分析

蒙古语有向图形态分析器的判别式词干词缀切分

最大熵和规则相结合的藏文句子边界识别方法

面向形态丰富语言的多粒度翻译融合

基于结构对齐的统计机器翻译模型

基于同步树序列替换文法的机器翻译模型

机器翻译研究新进展

基于统计语言模型的蒙古文词切分

基于短语相似度的统计机器翻译模型

一种基于短语的汉蒙统计机器翻译与调序模型

一种基于同步树替换文法的统计机器翻译模型

人机互助的交互式口语翻译方法

层次短语翻译中基于Markov随机场的层次切分模型

头驱动句法分析中的直接插值平滑算法

机器翻译系统融合技术综述

统一语言学中的类几何变换函数

多语言机译系统中高质量语义单元库形成方法

Lucene的全文检索的研究与应用

相似度质心多层过滤策略的动态文摘方法

基于Bagging算法和遗传BP神经网络的负荷预测

英汉语义对应中弯曲现象实证研究

机器翻译及其评测技术简介

遗传算法在多目标柔性Job—Shop调度中应用

基于遗传算法和模糊聚类的文本分类研究

基于Tabu搜索的粗糙集属性约简算法

基于模糊粗糙集的Web文本分类

关于模糊C-均值（FCM）聚类算法的改进

基于禁忌搜索的自适应粒子群算法

英语人体隐喻的识别与汉译

第十二届机器翻译峰会和NIST2009机器翻译评测研讨会简介

Web日志挖掘中数据预处理技术的研究

基于混沌神经网络的股票分析及其预测

面向层次短语翻译的词汇化调序方法研究

异种语料融合方法：基于统计的中文词法分析应用

以机器翻译技术为核心的多语信息处理研究

依存树到串模型中引入双语短语的三种方法

期刊信息

《软件学报》
北大核心期刊（2011版）

主管单位:中国科学院
主办单位:中国科学院软件研究所中国计算机学会
主编：赵琛
地址：北京8718信箱中国科学院软件研究所
邮编：100190
邮箱：jos@iscas.ac.cn
电话：010-62562563

国际标准刊号：ISSN：1000-9825
国内统一刊号：ISSN：11-2560/TP
邮发代号:82-367

获奖情况:
2001年入选中国期刊方阵“双百期刊”,2000年荣获中国科学院优秀科技期刊一等奖

国内外数据库收录:
俄罗斯文摘杂志,美国数学评论（网络版）,波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:54609