位置:成果数据库 > 期刊 > 期刊详情页
“一X就Y”格式的多词表达敏感特征提取和选择
  • ISSN号:1008-5475
  • 期刊名称:《苏州市职业大学学报》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]苏州市职业大学计算机工程学院,江苏苏州215104
  • 相关基金:国家自然科学基金资助项目(61272259);苏州市云计算智能信息处理高技术研究重点实验室开放基金资助项目(SXZ201303);苏州市职业大学青年教师基金资助项目(2011SZDQ11)
作者: 郭翠珍[1]
中文摘要:

主要研究如何选择和动态使用各自的敏感特征来抽取"一X就Y"结构的MWEs.分析了多词表达研究的现状,参考汉语言学相关专家的研究对"一X就Y"格式进行大致分类,针对该格式采用分词的方法提取特征集,并在训练集中按类别进行敏感特征的选择.

英文摘要:

The NLP community has increasingly become aware of the problems that multiword expressions(MWEs) pose.This paper studies how to select and use their sensitive features to extract "yi(一) X jiu(就) Y " Structure in MWE.It analyses the status of MWE studies,and then broadly classi?es the structure according to Chinese linguistic experts’ studies.A feature set is extracted by segmentation.Finally, sensitive features are selected in the training set according to different categories.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《苏州市职业大学学报》
  • 主管单位:苏州市人民政府
  • 主办单位:苏州市职业大学
  • 主编:姜左
  • 地址:苏州市吴中大道1158号国际教育园
  • 邮编:215104
  • 邮箱:sxs@jssvc.edu.cn
  • 电话:0512-66503561
  • 国际标准刊号:ISSN:1008-5475
  • 国内统一刊号:ISSN:32-1524/G4
  • 邮发代号:
  • 获奖情况:
  • 全国高职高专学报综合评比优秀学报二等奖
  • 国内外数据库收录:
  • 中国国家哲学社会科学学术期刊数据库
  • 被引量:2389