位置:成果数据库 > 期刊 > 期刊详情页
基于LCS的特征树最大相似性匹配网页去噪算法
  • ISSN号:1002-8692
  • 期刊名称:《电视技术》
  • 时间:0
  • 分类:TP393.09[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]上海交通大学电子工程系图像通信与信息处理研究所,上海200240, [2]上海交通大学上海市数字媒体处理与传输重点实验室,上海200240, [3]上海文广互动电视有限公司,上海200072
  • 相关基金:国家“863”计划项目(2008BAH28804);上海市科委资助项目(08dzl500108);中国博士后科学基金、上海市博士后基金资助项目(20090460637;10R21414800)
中文摘要:

提出了一种基于LCS的特征树最大相似性匹配网页去噪算法。通过将目标网页和相似网页转化为特征树,并将特征树映射为一个特征节点序列,利用LCS算法能获得最长子序列全局最优解的特点,找出两棵特征树之间的不同节点作为候选集,并对候选集进行聚集评分找出网页重要内容块。给出了算法的原型系统,并对每一个模块的实现做了详尽的描述。

英文摘要:

A maximum similarity matching algorithm for noise reduction in Web pages is presented based on LCS. Parsing target page and similar pages into two characteristic trees, and mapping them to two characteristic node sequences, the LCS algorithm can get the longest sub-sequence which is global optimal solution, and the different characteristic nodes is found out between the two characteristic tree as a candidate set, clustering the candidate set and scoring to identify web page important informative block. In this paper, the algorithm prototype is given, and the implementation of each module is described.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《电视技术》
  • 北大核心期刊(2011版)
  • 主管单位:中国电子科技集团公司
  • 主办单位:电视电声研究所
  • 主编:许盈(执行主编)
  • 地址:北京市朝阳区酒仙桥北路乙7号
  • 邮编:100015
  • 邮箱:tvea@263.net.cn; dsss@chinajournal.net.cn
  • 电话:010-59570246
  • 国际标准刊号:ISSN:1002-8692
  • 国内统一刊号:ISSN:11-2123/TN
  • 邮发代号:2-354
  • 获奖情况:
  • 第三届国家期刊奖百种重点期刊、中国期刊方阵双百...
  • 国内外数据库收录:
  • 美国剑桥科学文摘,英国科学文摘数据库,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:12712