东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

基于语义分析的垂直搜索网络蜘蛛

ISSN号：1000-7024
期刊名称：《计算机工程与设计》
时间：0
分类：TP391.9[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]广东工业大学数字媒体系,广东广州510006, [2]华南理工大学广东省计算机网络重点实验室,广东广州510640
相关基金：国家自然科学基金项目（90412015）.

作者：罗立宏[1], 陈志[2]

关键词：计算机应用, 互联网, 搜索引擎, 垂直搜索, 网络蜘蛛, 语义分析, computer applications, interact, search engine, vertical search, web spider, semantic analysis

中文摘要：

通用搜索引擎数据量庞大，但查询结果不够准确。分类目录正好相反。为了综合两者优势，对垂直搜索引擎进行了研究和分析。着重研究了垂直搜索引擎的核心模块——智能网络搜索蜘蛛。提出了搜索分析的新概念——规则。研究了蜘蛛中定义支持同义词的语义词典的方法，给出了按照规则分析和检索的实现方法和流程。程序需要定义多种规则，让蜘蛛依照规则进行网页爬行和信息采集。最后给出一个项目实例，证明了上述方法的可行性。

英文摘要：

General search engine has large volume of data, but its search results are not accurate enough. Directories classification is on the contrary. In order to integrate advantages of the two, vertical search engine is studied and analyzed. The core module--intelligent search spider is mainly focused on. A new concept about searching and analyzing is brought forward： Rules. The method is researched that defining semantic dictionary which supports synonyms. The algorithm and flow that realize searching and analyzing according rules are afforded. Kinds of rules must be defined in search spider program, depending on which the function web pages crawling and information data extracting work. At last a project example is presented to prove the feasibility of these methods.

同期刊论文项目

基于网络环境的生物信息学研究和示范显示

期刊论文 48 会议论文 4

同项目期刊论文

基于XPath比较的Web数据抽取方法

广州华峰生物科技有限公司用户报

广东省疾病预防控制中心用户报告

中国人民解放军第四五八医院全军

华南理工大学生物科学与工程学院

基于语义的生物学专业搜索引擎设

区分服务及其组播环境中的一种接

基于Map/Reduce的网页消重并行算

基于优选链接的中文网页分类方法

基于集中式带宽代理的区分服务网

文本分类的性能评估指标研究

基于web挖掘的领域本体自动学习

基于站点资源的主题提取算法

基于ProActive的网格应用程序开

血管内皮生长因子与肺癌治疗

细胞因子和趋化因子作为DNA疫苗

三类整合酶基因(intⅠ)的简并引

结核分枝杆菌融合抗原Ag85B-ESAT

基因沉默技术在结核病防治研究中

乙型肝炎多表位DNA疫苗的发展趋

新型真核表达质粒pcDNA6/myc-his

我国SARS疫苗研究的现状

Polymorphic amino acids at cod

基于优选链接的中文网页分类方法研究

重组纤维素酶E4酶活性改变的初步研究

siRNA pro 2.0：siRNA理性设计在线程序

靶向TTF-1的siRNA腺相关病毒载体组装验证

基于语义的生物学专业搜索引擎设计

RNA干扰对MDA-MB-231细胞中CaSR基因表达的影响

基于集中式带宽代理的区分服务网络接纳控制

结核分枝杆菌融合抗原Ag85B-ESAT6真核表达载体的构建及鉴定

共表达siRNA和hIL-12的新型乙肝多表位DNA疫苗的研究

三重表达肺结核DNA疫苗在细胞水平的检测

同源建模在纤维素酶分子改造中的应用

VEGF与肿瘤血管生成及其在抗肿瘤药物开发中的应用

肝脏特异性表达载体的构建及Western blotting检测

特异性siRNA质粒的构建及其抑制癌细胞中mcl-1表达的研究

RNA干扰技术抑制乳腺癌细胞系MDA-MB-231中SATB1的表达

Rspo1-EGFP重组腺相关病毒载体的构建

RNAi抑制丙肝病毒复制的研究进展

区分服务及其组播环境中的一种接纳控制方案

49P（del）点突变提高中性纤维素内切酶EGV热稳定性的初步研究

基于URL类型和网页链接变化的信息采集更新算法

期刊信息

《计算机工程与设计》
北大核心期刊（2011版）

主管单位:中国航天科工集团
主办单位:中国航天科工集团二院706所
主编：汤铭瑞
地址：北京142信箱37分箱
邮编：100854
邮箱：ced@china-ced.com
电话：010-68389884

国际标准刊号：ISSN：1000-7024
国内统一刊号：ISSN：11-1775/TP
邮发代号:82-425

获奖情况:
中国科学引文数据库来源期刊,中国学术期刊综合评价数据库来源期刊,中国科技论文统计与分析用期刊

国内外数据库收录:
波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）

被引量:45616