东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

词汇计量研究与常用词知识库建设

ISSN号：1003-0077
期刊名称：中文信息学报
时间：2015.6
页码：16-20
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]北京大学计算语言学研究所计算语言学教育部重点实验室,北京100871, [2]语言能力协同创新中心,江苏徐州221009
相关基金：国家重点基础研究发展计划（2014CB340504）; 国家自然科学基金（61272221,61170163）
相关项目：隐喻识别与理解的理论与方法研究

作者：俞士汶|朱学锋|

关键词：汉语常用词知识库, 《中国语言生活状况报告》, 综合型语言知识库, 《现代汉语语法信息词典》, 部件词, knowledge base of Chinese commonly used words, Language Situation in China, comprehensive lan-guage knowledge base, Grammatical Knowledge base of Contemporary Chinese , component word

中文摘要：

面向自然语言处理的词汇语义研究应该以词汇的计量研究为基础。该文在评述汉语词汇计量研究的主要成果以后,提出一个汉语常用词知识库的建设任务,并给出常用词表的构造性定义、词表常用性的定量评价方法以及＂部件词＂的概念,最后介绍现代汉语常用词知识库的总体设计和已经做的工作。期望常用词知识库的建设能为汉语词汇语义学研究、为中文信息处理事业的发展做出贡献。

英文摘要：

Natural language processing oriented lexical semantics researches should be based on quantitative study of the lexicon. After a brief suvey on the main achievements of the quantitative Chinese lexicon, this paper proposes a project to build a knowledge base of commonly used words, for which we describe 1） a constructive definition of commonly used words list, 2） a quantitative method to measure the coverage of a given word list over an annotated corpus, and 3） the concept of ＂component word＂. We also introduce the overall designs of the knowledge base and the current progress of this project. It is expected that the construction of such a knowledge base can contribute to the Chinese lexical semantics researches and the development of Chinese information processing.

同期刊论文项目

隐喻识别与理解的理论与方法研究

期刊论文 19 会议论文 15

汉语全文词义标注关键技术研究

期刊论文 22

同项目期刊论文

面向汉语教学的常用动词计量研究

纪念《汉语拼音方案》颁布55周年笔谈

自然语言处理及其教育应用

面向语言能力提升的成语知识库建构及扩展

综合型语言知识库及其在语言教学中的应用

前人栽树,后人乘凉

后人乘凉——纪念《汉语拼音方案》颁布55周年笔谈

汉语成语及典故知识库在语文学习中的应用

自然语言处理与语言深度计算

Literal and Metaphorical Sense DiscriminationLiteral and Metaphorical Sense Discrimination: ACompara

综合语言知识库及其在国际汉语教育中的应用初探

A Comparative Study of Metaphor Recognition and Word Sense Disambiguation

现代汉语多级标注语料库的建设及其应用

自然语言处理技术与语言深度计算

面向语言能力提升的汉语成语知识库及其扩展

面向隐喻识别的词语抽象性度量

汉语语义选择限制知识的自动获取研究

基于统计学习模型的句法分析方法综述

综合型语言知识库及其在语言教学中的应用

自然语言处理技术与语言深度计算

面向语言能力提升的汉语成语知识库及其扩展

基于认知属性库的原型范畴研究

基于多源知识的中文微博命名实体链接

基于S VM与RNN的文本情感关键句判定与抽取

基于词典信息和网络百科的下位词获取

基于语义解析的中文GIS自然语言接口实现研究

汉语语义选择限制知识的自动获取研究

基于多源知识和Ranking SVM的中文微博命名实体链接

现代汉语虚词用法知识库建设综述

基于深度学习的微博情感分析

多语料库中汉语四字格的切分和识别研究

汉语虚词用法在依存句法分析中的应用研究

自然语言句子抽象语义表示AMR研究综述

基于重用检测的微博垃圾用户过滤算法

基于空间短文本对象的检索策略

基于《现代汉语语义词典》的未登录词语义预测研究

基于极性转移和LSTM递归网络的情感分析

大规模汉语词汇语义知识库的构建

期刊信息

《中文信息学报》
北大核心期刊（2011版）

主管单位:中国科学技术协会
主办单位:中国中文信息学会中国科学院软件研究所
主编：孙茂松
地址：北京海淀中关村南四街4号中科院软件所
邮编：100190
邮箱：jcip@iscas.ac.cn
电话：010-62562916

国际标准刊号：ISSN：1003-0077
国内统一刊号：ISSN：11-2325/N
邮发代号:

获奖情况:

国内外数据库收录:
日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:9136