东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

维基百科的中文语义相关词获取及相关度分析计算

ISSN号：1007-5321
期刊名称：《北京邮电大学学报》
时间：0
分类：TN911.22[电子电信—通信与信息系统;电子电信—信息与通信工程]
作者机构：[1]北京邮电大学计算机学院,北京100876, [2]德岛大学先端技术科学教育部,日本德岛7708502
相关基金：国家自然科学基金项目（60873001）;国家科技支撑计划项目（2007BAH05802-04）

中文摘要：

为了研究在线百科全书维基百科在语义相关词抽取、语义相关度计算等方面的应用,从中文维基百科下载并整理了5万余篇解释页面文档,抽取了反映语义关系的站内超级链接网络,通过挖掘文档间相互引用的链接关系抽取了近40万对语义相关词,并研究了语义相关词之间的主题聚类特性,选择两两相关的多个词得到相关词集合并计算了平均语义相关度.相关度计算综合利用了链接在文档中的位置、频率等信息,通过对比经典算法在同一测试集上的计算结果对算法进行了分析评估,证明了维基百科语义相关词抽取方法的有效性.

英文摘要：

To find how to collect semantic related words and calculate semantic relatedness, an experiment is done to download about 50 thousand documents from the web site of Chinese Wikipedia and extract hyperlinks between lines which contains semantic information. By mining hyperlinked references in documents, about 400 thousand semantic related word pairs are collected. With more experi- ments on topic groups of related words, tightly related words are grouped into smaller sets with an average semantic relatedness calculated. Semantic relatedness is calculated using information of hyperlink positions and frequencies in documents. Comparing with the result by classic algorithms, the reliability of the new measures is analyzed.

同期刊论文项目

机制主义方法与高等智能理论

期刊论文 27 会议论文 25 获奖 1 著作 4

同项目期刊论文

一种基于实例语境的汉语语音识别后文本检错纠错方法

Improved quantum “Ping-pang” protocol based on GHZ state and classical XOR Operation

Improved Quantum “Ping-Pang” Protocol Based on Extended Three Particle GHz State

Advanced Intelligence,：Definition, Approach, and Progress

Unity-based Diversity: System Approach to Information Defining

Mechanism Approach to Advanced Intelligence

A Conjecture on Mechanism of Information Understanding,

《脑与认知科学基础》教学研究

统一理论：人工智能研究的新进展，

面向智能科学与技术专业的C语言教学探讨,

Improved security detection strategy for quantum "ping-pang" Protocol and its security analysis.

三网融合安全问题及对策研究.

高等智能·机制主义·信息转换

人工智能的突破与科学方法的创新

一种改进的量子“乒乓”协议安全检测策略及其安全性分析(英文)

“机器智能”课程建设初探

智能科学技术导论教学目的及策略

文本分类技术在信息检索中的应用

设置“智能科学与技术”博士学位一级学科：必要性、可行性、紧迫性

面向“智能科学与技术”专业的C语言教学探讨

“脑与认知科学基础”教学研究

机制主义方法与人工智能统一理论——人工智能的新方法与新进展

三网融合安全问题及对策研究

时代召唤智能科学技术人才大军

高等人工智能：人工智能理论的新阶段

期刊信息

《北京邮电大学学报》
北大核心期刊（2011版）

主管单位:教育部
主办单位:北京邮电大学
主编：刘杰
地址：北京海淀区西土城路10号195信箱
邮编：100876
邮箱：byxb@bupt.edu.cn
电话：010-62281995 62282742

国际标准刊号：ISSN：1007-5321
国内统一刊号：ISSN：11-3570/TN
邮发代号:2-648

获奖情况:
美国工程信息公司（Ei）数据库收录期刊,1999年全国优秀高等学校自然科学学报及教育部优秀...,中国期刊方阵“双效”期刊

国内外数据库收录:
美国化学文摘（网络版）,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:7684