位置:成果数据库 > 期刊 > 期刊详情页
一种基于UCL的中文网页信息过滤方法
  • ISSN号:0372-2112
  • 期刊名称:《电子学报》
  • 时间:0
  • 分类:TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]北京理工大学电子工程系,北京100081, [2]西南科技大学信息工程学院,四川绵阳621010, [3]中国工程物理研究院北京应用物理与计算数学研究所,北京100088
  • 相关基金:国家863高技术研究发展计划(No.2005AA121520);国家自然科学基金(No.60272014)
中文摘要:

围绕如何在浩瀚的中文网页中找到用户感兴趣的内容,提出了基于UCL(Uniform Content Loeator)的“二阶过滤法”.它将媒体空间中的信息用UCL语义格(Semantic Cases based on UCL,SCU)表示,通过语义向量空间模型(Semantic Vector Space Model,SVSM)对网页的语义矩阵进行分析计算,粗略筛选出用户感兴趣的网页;再借助精细语义逐句解读其内容,提取用户所关注的信息.根据用户的阅读行为动态了解用户的兴趣变化,建立用户兴趣的本体模型,并分析和定义了用户兴趣度的度量.实验验证了上述过滤方法的有效性,其测试结果同向量空间模型(Vector Space Model,VSM)进行了比较,性能明显优于VSM.

英文摘要:

The work focuses on filtering users' interested contents in Chinese web pages. Two-stage filtering method based on UCL is presented. SCU is brought forward to express the information of Medium Space. SVSM is introduced to filtrate cursorily web pages, and then contents of these pages are understood by virtue of some elaborate semantic characteristics, so the web pages which users are interested in can be extracted. At the same time, the users' interested changes are tracked dynamically according to the reading actions, and the interesting ontological profile is submitted, then the measure of interestingness is analyzed and calculated. Laboratory simulations demonstrate the arithmetic feasibility and validity.

同期刊论文项目
期刊论文 50 会议论文 3 著作 1
同项目期刊论文
期刊信息
  • 《电子学报》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会
  • 主办单位:中国电子学会
  • 主编:郝跃
  • 地址:北京165信箱
  • 邮编:100036
  • 邮箱:new@ejournal.org.cn
  • 电话:010-68279116 68285082
  • 国际标准刊号:ISSN:0372-2112
  • 国内统一刊号:ISSN:11-2087/TN
  • 邮发代号:2-891
  • 获奖情况:
  • 2000年获国家期刊奖,2000年获国家自然科学基金志项基金支持,中国期刊方阵“双高”期刊
  • 国内外数据库收录:
  • 美国化学文摘(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘,中国北大核心期刊(2000版)
  • 被引量:57611