东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

并列复句的自动识别初探

ISSN号：1001-3695
期刊名称：《计算机应用研究》
时间：0
分类：TP301[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
作者机构：[1]南京大学计算机软件新技术国家重点实验室,南京210093
相关基金：国家自然科学基金资助项目（60673043）

作者：周文翠[1], 袁春风[1]

关键词：并列复句, 知网, 支持向量机, complex sentences with coordinating relation, Hownet, support vector machine （SVM）

中文摘要：

从《人民日报》语料库中抽取4万多个句子作为训练集和测试集,选取其主语、谓语等相关特征并根据《知网》将特征量化,然后使用支持向量机进行训练,获取判别并列复句的模型。在开放测试中获得了84%的准确率。

英文摘要：

This paper extracted nearly 40 000 sentences as training data and testing data from People＇ s Daily newspaper. And then chose some main features such as subject, object and used Hownet to quantify these features. Finally trained these data with support vector machine （SVM） to get the model. The proposed method had about 84 % precision on the test data. The result of experiment indicates that this approach is feasible.

同期刊论文项目

基于统计关系学习的汉语指代消解研究

期刊论文 23 会议论文 10 专利 1

同项目期刊论文

基于混合模型的交集型歧义消歧策略

基于SVM-Adaboost的中文组块分析

一种基于潜在语义分析和直推式谱图算法的文本分类方法LSASGT

一种错误敏感的词对齐评价方法

一种基于随机森林的多视角文本分类方法

Dirichlet过程及其在自然语言处理中的应用

基于有监督关联聚类的中文共指消解

基于大间隔方法的汉语组块分析

一种基于图划分的无监督汉语指代消解算法

基于大规模语料库的句法模式匹配研究

一种基于关联聚类的汉语共指消解方法

中心词驱动的汉语统计句法分析模型的改进

一种命名实体翻译等价对的抽取方法

基于优势关系粗糙集的规则生成算法

基于重复模式的自动Web信息抽取

基于中文宾州树库的浅层语义分析

医药信息检索中的用户多兴趣处理技术

基于话题要素相似度计算的报道关系识别方法

文本情感分析中褒贬分类的分界点确定

一种数据库汉语查询接口的设计与实现

一种基于共坐标上升算法的人名识别方法

期刊信息

《计算机应用研究》
北大核心期刊（2011版）

主管单位:四川省科学技术厅
主办单位:四川省计算机研究院
主编：刘营
地址：成都市成科西路3号
邮编：610041
邮箱：arocmag@163.com
电话：028-85210177 85249567

国际标准刊号：ISSN：1001-3695
国内统一刊号：ISSN：51-1196/TP
邮发代号:62-68

获奖情况:
第二届国家期刊奖百种重点科技期刊,国内计算技术类重点核心期刊,国内外著名数据库收录期刊

国内外数据库收录:
俄罗斯文摘杂志,波兰哥白尼索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:60049