东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

基于句中词语间关系的文本向量化算法

ISSN号：1009-8054
期刊名称：信息安全与通信保密
时间：2014.4.10
页码：84-88
分类：TP301.6[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
作者机构：[1]上海交通大学信息安全工程学院,上海200240
相关基金：国家自然科学基金资助项目（批准号：61272441,61171173）
相关项目：海量网络舆情信息获取、分析及表达关键技术研究

作者：许阳|刘功申|孟魁|

关键词：向量模型, 文本表示, PAGERANK, 词语关系, vector space model, text representation, PageRank, word relationship

中文摘要：

文本向量化是将文本转化为向量的代数模型建立过程,在文本处理领域具有重要的应用价值,是文本数据挖掘算法的关键环节。在著名的PageRank算法基础上,提出一种基于句中词语间关系的文本向量化算法。通过引入语义层面的词语关联来克服传统的基于词频统计数据的向量化方法语义敏感度不佳的缺陷。在不同的语料测试集上的实验表明,基于句中词语间关系的文本向量化算法有更高的准确率。

英文摘要：

Document vectorization is the process of building vector space model which has a number of potential applications on natural language processing. This paper describes an algorithm of vectorization through the relationships of word in a sentence based on the PageRank algorithm. The introduction of semantics relationship is then proposed to overcome the disadvantage of traditional statistics-based vectorization. Experimental results show that the new method has a better accuracy rate.

同期刊论文项目

海量网络舆情信息获取、分析及表达关键技术研究

期刊论文 67 会议论文 15

面向网络舆论的定题情感分析技术研究

期刊论文 21 会议论文 5

同项目期刊论文

An anti-attack model based on complex network theory in P2P networks

基于译文特征的中英文跨语种抄袭识别研究

网络突发热点事件的热度分布

基于语义密度的名词消歧算法

复杂网络理论在对等网络特性分析中的应用

攻击图的网络威胁自动建模方法研究

Wiretap Channel with Action-Dependent States and Rate-Limited Feedback

Research on an outer bound of achievable secrecy rate region for BCE

iOS系统数据安全研究

Windows mobile系统关键信息获取技术研究

一种基于网络结构的微博用户重要度算法

MURank:社交网络用户实时影响力算法

Wiretap channel with information embedding on actions

基于结构的论坛回帖倾向性研究

融合标签传播和信任扩散的个性化推荐方法

一种微博用户影响力的计算方法

基于TextRank的用户模板构建方法

基于相似度的社团划分算法

基于投票机制的文本主客观分类系统研究

Nonrandom community detection algorithm based on label propagation

Analysis and Extension of Safety Mechanisms for Standardized Control Networks in Smart Grid

Capacity-Equivocation Regions of the DMBCs with Noiseless Feedback

结构化P2P网络快速数据分发研究

Web服务器上应用层DDoS检测方法的改进

Wiretap Channel with Rate-Limited Channel State Information

Prediction of user's retweet behavior in social network

社交网络中的用户转发行为预测

相关信息加权的自适应多标签分类算法

基于文本纹理特征的中文情感倾向性分类

面向情感倾向性识别的特征分析研究

基于中文多标签分类的特征选择研究

分级指标体系下的网络舆情指数计算

基于句法分析的商品情感倾向性分析

微博话题评论的情感分析研究

基于关系的微博重要度算法研究

一种基于二进制序列的秘密共享新方法

eCK模型的安全性分析

基于约束分析的跨站脚本防御方法研究

一种基于组合保留集的SVM增量学习算法

非随机的标签传播社区划分算法

基于攻击图模型的多目标网络安全评估研究

基于微博网络的信息传播模型

融合标签传播和信任扩散的个性化推荐方法

一种微博用户影响力的计算方法

社交网络中的用户转发行为预测

相关信息加权的自适应多标签分类算法

An improved topic detection method for Chinese microblog based on incremental clustering

一种微博用户影响力计算方法

基于一类SVM的不良信息过滤算法改进

基于文本纹理特征的中文情感倾向性分类

智能信息系统中手机产品评论的情感倾向分析

一种微博预警算法

面向情感倾向性识别的特征分析研究

基于中文多标签分类的特征选择研究

A Text Information Hiding Algorithm Based on Alternatives

分级指标体系下的网络舆情指数计算

基于句法分析的商品情感倾向性分析

利用依存关系优化拼音输入法

元搜索中确定成员搜索引擎权重的算法

微博话题评论的情感分析研究

基于关系的微博重要度算法研究

期刊信息

《信息安全与通信保密》

主管单位:中国电子科技集团公司
主办单位:中国电子第三十研究所
主编：惠志斌鲁传颖
地址：四川成都市高新区创业路8号
邮编：610041
邮箱：
电话：028-88203306 85169935

国际标准刊号：ISSN：1009-8054
国内统一刊号：ISSN：51-1608/TN
邮发代号:62-208

获奖情况:

国内外数据库收录:

被引量:7388