位置:成果数据库 > 期刊 > 期刊详情页
基于自然语言处理的图书阅读难度自动分级研究
  • ISSN号:1006-8228
  • 期刊名称:《计算机时代》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:南通大学计算机科学与技术学院,江苏南通226019
  • 相关基金:江苏省教育科学“十二五”规划课题“心理语言学理论视角下的亲子阅读过程研究”(B-b/2015101/022)
中文摘要:

图书阅读难度自动分级系统能够帮助儿童读者快速找到适合自己认知水平的图书。文章基于图书句子难度和字难度两个维度,建立了一个图书难度分级模型,并开发出对应的图书阅读难度自动分级系统。利用该系统对常见的儿童图书进行了测试,初步实验表明:从图书中随机选取字数达到2500-3000字时,图书阅读难度分级算法测试结果误差较小,综合使用字难度和句子难度的分级算法比单纯字难度分级算法和单纯句子难度分级算法的效果更好。该系统目前仅限于白话文图书应用。

英文摘要:

The automatic grading system of reading difficulty degree can help children find books that are suitable for their own cognitive level. Based on the two dimensions of sentence difficulty and word difficulty, this paper establishes a hierarchical model of reading difficulty degree, and develops an automatic grading system of reading difficulty degree. The common children's books are tested by this system, preliminary experiments show that when the randomly selected books with words up to 2500-3000, the grading algorithm of reading difficulty degree results in less errors, and the grading algorithm using both sentence difficulty and word difficulty has a better result than that only using sentence difficulty or word difficulty. The system is currently limited to the books of using vernacular.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机时代》
  • 主管单位:浙江省科技厅
  • 主办单位:浙江省计算技术研究所 浙江省计算机学会
  • 主编:陈纯
  • 地址:杭州市环城西路33-2号省计算所大楼
  • 邮编:310006
  • 邮箱:computer_era@21cn.com
  • 电话:0571-87054111
  • 国际标准刊号:ISSN:1006-8228
  • 国内统一刊号:ISSN:33-1094/TP
  • 邮发代号:32-81
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:8022