位置:成果数据库 > 期刊 > 期刊详情页
洛特卡现象在汉语词汇句法功能分布复杂度中的呈现
  • ISSN号:1000-0135
  • 期刊名称:《情报学报》
  • 时间:0
  • 分类:TP303[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]南京大学信息管理系,南京210093
  • 相关基金:项目支持:本文系教育部人文社会科学重点研究基地重大项目“基于智能信息处理的知识挖掘技术及应用研究”(项目批准号:08JJD870225)和南京大学研究生科研创新基金资助项目“基于网络的英汉/汉英平行语料对自动获取”(项目编号:2010CW02)的研究成果之一.
中文摘要:

本文基于大规模清华树库,从中统计了汉语词汇在句法结构中充当的句法成分,获取了汉语词汇的句法功能分布,并给出了汉语词汇句法功能分布复杂度的定义。在对汉语词汇按照汉语词汇句法功能分布复杂度的高低排序后,本文发现两者之间呈现洛特卡现象。本文的这一发现一方面揭示了汉语词汇在句法结构中的分布规律,对于汉语的研究具有重要的促进作用;另一方面对于中文信息处理中的词性标注、自动消歧和句法分析等研究具有重要的影响。

英文摘要:

The Chinese word syntactic constituents in the syntactic structure are calculated based on large-scale Tsinghua Treebank, and the Chinese word syntactic function distribution is gained in the paper. The definition of Chinese word syntactic function distribution complexity is given in this paper. The Lotka's phenomenon presents between Chinese word syntactic function distribution complexity and Chinese word amount after the Chinese word is sorted according to the Chinese word syntactic function distribution complexity. On the one hand, the discovery in the paper reveals Chinese word distribution law which will promote the Chinese researches in the syntactic structure, on the other the discovery will influence the researches of part-of-speech tagging, automatic disambiguation and syntactic analysis in the Chinese information processing.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国科学技术情报学会 中国科学技术信息研究所
  • 主编:戴国强
  • 地址:北京复兴路15号
  • 邮编:100038
  • 邮箱:qbxb@istic.ac.cn
  • 电话:010-68598273
  • 国际标准刊号:ISSN:1000-0135
  • 国内统一刊号:ISSN:11-2257/G3
  • 邮发代号:82-153
  • 获奖情况:
  • 1992年全国优秀科技期刊评比二等奖,1997年中国科协优秀科技期刊三等奖,被国外4种检索工具录用
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:19778