位置:成果数据库 > 期刊 > 期刊详情页
基于统计方法的面向旅游问句分类实验研究
  • 期刊名称:电脑开发与应用
  • 时间:0
  • 页码:14-16
  • 语言:中文
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]山西大学计算机与信息技术学院,太原030006, [2]山西大学数学科学学院,太原030006
  • 相关基金:国家自然科学基金项目(60573074);教育部科学技术研究重点项目(207018);山西省自然科学基金(2007011042);山西高校科技研究开发项目(200611002);山西省科技攻关项目(051129)资助.
  • 相关项目:基于多层次语言粒度的文本情感分类研究
中文摘要:

根据旅游领域知识的特点,设计了面向旅游问句的分类体系。利用信息增益、互信息、交叉熵和X^2统计四种特征选择方法及支持向量机分类器,对网上常见的旅游真实问句分类进行了实验研究,实验结果表明:在现有问句分类体系下,信息增益的特征选择方法在特征空间维数为550维时,分类旅游问句的结果是最佳的。

英文摘要:

In this paper, a question classification system is developed according to the knowledge characteristic of traveldomain. Using the four kinds feature selection methods which are Information Gain, Mutual Information, Cross Entropy and Xz Statistics and support vector machine, this paper presents an empirical study on question sentence classification for tour domain. The experiments show that using the feature selection of Information Gain with 550 dimensions, the classification results are best.

同期刊论文项目
期刊论文 35 会议论文 12 专利 3
同项目期刊论文