东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

自动提取含字母词语的领域新术语的研究

ISSN号：1000-3428
期刊名称：《计算机工程》
时间：0
分类：TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]大连理工大学系统工程研究所,大连116024
相关基金：国家自然科学基金资助项目（70271046）

关键词：专指语义串, 长串优先, 字母词语, 中文信息处理, Special semantic strings, Matching longer string first, Lettered-words, Chinese natural language processing

中文摘要：

新术语的提取是中文信息处理领域的一个重要研究课题。针对现有提取方法的不足和很多专业术语表现为字母词语的特点，该文提出了一种综合统计技术和规则筛选的方法：基于长串优先和串频统计的思路进行文本切分，得到共现字符串，利用词语搭配规则进行过滤，经过领域词典及评价函数的筛选，提取出领域新术语。该方法可发现包含字母词语、专业术语等未登录词在内的频率大于等于2的任意长度的专指语义串、短语和词。实验表明了该方法的有效性及新术语的准确率分布特征。

英文摘要：

Extraction of new domain-specific terms is one of the important topics in Chinese natural language processing. Aiming at the limitation of the current methods and the specialties of many domain-specific terms are lettered-words, a novel approach combined with statistic technique and rule is proposed to extract new special semantic strings. Co-occurrence of character strings is formed by text segmentation based on matching longer strings first combined with frequency statistics. No-meaningful character strings are trimmed by collocation rules. Filtered by domain lexicon and membership degree, new domain-specific terms are extracted finally. This method can extract new special semantic strings, phrases and words, including unknown words like lettered-words and domain-specific terms, their frequency is larger than 2. Experiments show that this extraction technique is effective and indicate new domain-specific terms＇ distribution characteristic of precision ratio.

同期刊论文项目

项目管理中项目关联分析与立项决策支持系统研究

期刊论文 19

同项目期刊论文

无词典抽词的RMMFS和BMMFS方法及其比较研究

无词典中英文混合术语抽取及算法研究

基于长度递减与串频统计的文本切分算法

项目关联分析与宏观知识挖掘

一种基于加权超网络模型的组织知识搜索定位方法

基于规则与统计的本体概念自动获取方法研究

文本分类中粗分类数据噪声修正的网络算法

基于加权超网络模型的组织知识存量表示方法

基于改进线图分析算法的浅层汉语句法分析器的设计与实现

无词典中文特征词自动抽取的桥接模式滤除算法

基于加权知识网络的个人知识存量表示与度量方法

期刊信息

《计算机工程》
北大核心期刊（2014版）

主管单位:中国电子科技集团公司
主办单位:华东计算技术研究所上海市计算机学会
主编：游小明
地址：上海市桂林路418号
邮编：200233
邮箱：ecice06@ecict.com.cn
电话：021-64846769

国际标准刊号：ISSN：1000-3428
国内统一刊号：ISSN：31-1289/TP
邮发代号:4-310

获奖情况:
1999～2000、2001～2002年度信息产业部优秀期刊奖,2003-2004、2005-2006年度信息产业部电子精品科技...,2007-2008、2009-2010年度工业和信息产业部电子精...,012年度中国科技论文在线优秀期刊一等奖,2013年度中国科技论文在线优秀期刊二等奖

国内外数据库收录:
俄罗斯文摘杂志,美国化学文摘（网络版）,波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:84139