东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

基于语义的多文种编码方案SemaCode

ISSN号：1001-3695
期刊名称：《计算机应用研究》
时间：0
分类：TP391.12[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]苏州大学计算机科学与技术学院,江苏苏州215006
相关基金：国家“863”计划资助项目（2006AA012147）;国家自然科学基金资助项目（60673041）;江苏省高技术研究资助项目（BG2005020）

作者：李培峰[1], 朱巧明[1], 钱培德[1]

关键词：多文种编码方案, 语义, 层次结构, 词编码, multilingual encoding scheme, semantic, layered structure, phrases encoding

中文摘要：

分析了现有的几种常用编码方案的优点和缺陷,并提出了一个基于语义的多文种编码方案SemaCode及其模型。SemaCode模型分为六个层次,分别为交换传输层、字符码位层、词码位层、属性层、语义层和应用接口层。SemaCode是一种面向信息处理、可扩展的多文种编码方案,它在码位层SemaCode以字符为单位编码,并在编码中嵌入文种信息;在词码位层提出了以语义为轴心,以词为单位的编码理念;在属性层引入了一种对编码进行描述的标签机制,使得编码具有良好的可描述性和可扩展性;另外,在语义层以及其他层次提出了基于码位和描述协议的语义表示方法,并使得SemaCode成为一种具有部分可计算特性的编码方案。最后,在与Unicode对比的基础上,分析了SemaCode所具有的优势。

英文摘要：

Firstly,this paper analyzed and discussed the advantages and disadvantages of some common encoding schemes.And then to meet the request of expressing the semantic knowledge of the characters for information processing,it put forward a multilingual encoding scheme——SemaCode and its model.SemaCode model consisted of six layers,including exchange and transmission layer,character code point layer,phrase code point layer,property layer,semantic layer and application layer.SemaCode was an extensible multilingual encoding scheme,and it introduced a new character encoding method to the character point layer,which assigned each character（not glyph） a unique code point and language information also was encoded in that code point.On the property layer,the property tags was applied to tag the characters,and consequently the SemaCode had the ability to mark the characters.Furthermore,on phrase code point layer SemaCode put forward a new encoding method that the phrases but not characters were used as the basic encoding unit,and it also realized an encoding scheme on semantic layer,which was centered on semantic knowledge and had the ability to express the semantics of phrases.Finally,in contrast with Unicode,analyzed and discussed the advantages of SemaCode.

同期刊论文项目

基于机器学习的高性能自适应信息抽取关键技术研究

期刊论文 75 会议论文 28 专利 4

同项目期刊论文

Extracting relation information from text documents by exploring various types of knowledge

Building a collocation net

基于支持向量机的英语名词短语指代消解

基于树核函数的实体语义关系抽取方法研究

指代消解中语义角色特征的研究

语义角色标注中特征优化组合研究

基于最大熵模型的中文指代消解系统实现

基于树核函数的英文代词消解研究

基于树核函数的代词指代消解

基于合一句法和实体语义树的中文语义关系抽取

基于依存句法分析的中文语义角色标注

统计和规则相结合的并列结构自动识别

基于中心理论的指代消解研究

混合的汉语基本名词短语识别方法

依存关系上的中文名词性谓词识别研究

指代消解中距离特征的研究

基于分层策略的弱指导语义关系抽取

语言学组合特征在语义关系抽取中的应用

语义角色标注中有效的识别论元算法研究

Exploring syntactic structured features over parse trees for relation extraction using kernel method

Hierarchical learning strategy in semantic relation extraction

Semantic role labeling using a grammar-driven convolution tree kernel

基于字位置概率特征的条件随机场中文分词方法

一种基于历史信息的多层次中文句法分析方法

基于依存关系的语义角色标注

指代消解综述

面向信息服务的网格资源管理器的设计

基于相似树的MPLS多播标记聚合算法

一个网格服务工作流的动态调度算法

基于事件框架的主题事件融合研究

基于语义的网格服务匹配研究

面向服务网格的自调度算法优化技术

基于双向共享树的MPLS多播流聚合算法

使用树核函数进行中文代词消解的研究

语义分析中谓词标识的特征工程

依存关系语义角色标注研究

高性能OCSP系统的设计与实现

基于特征倾向性的网页特征提取方法研究

面向Web应用系统的访问控制设计及应用

基于Struts和Hibernate架构的招生管理系统的设计

语义为核心的多文种信息处理平台的模型

基于部分广播通道的可验证秘密共享方案

网格环境下基于分块的任务执行时间预测算法

基于指代消解的中文事件融合方法

基于超椭圆曲线密码体制的门限签名方案

基于Netfilter的实时网页内容过滤器的设计与实现

基于GridSphere的网格门户的研究和设计

IP控制网关QoS模块的设计与实现

基于特征组合的中文实体关系抽取

面向不良文本信息的中文网页分类方法

基于标注依赖图的服务组合方法

基于内容评价的爬虫搜索策略研究

一种密钥传输方案的分析和改进

基于自适应学习的文本信息过滤系统

一种基于历史信息的自适应动态网格作业调度方法

语篇分析在实体语义关系抽取中的应用

数字资源的元数据自动获取系统

基于广义双基链的除子标量乘优化算法

语义角色标注中句法特征的研究

网格环境下几种容错策略的比较

一种基于（部分）广播通道的秘密共享方案

关联规则挖掘中Apriori算法的研究与改进

基于树核函数的“it”待消解项识别研究

插入语分类抽取研究方法探讨

基于一般访问结构的可验证多秘密共享方案

N取1的可验证分布式不经意传输方案

基于短语的统计机器翻译中短语表的过滤

基于LDA主题特征的自动文摘方法

期刊信息

《计算机应用研究》
北大核心期刊（2011版）

主管单位:四川省科学技术厅
主办单位:四川省计算机研究院
主编：刘营
地址：成都市成科西路3号
邮编：610041
邮箱：arocmag@163.com
电话：028-85210177 85249567

国际标准刊号：ISSN：1001-3695
国内统一刊号：ISSN：51-1196/TP
邮发代号:62-68

获奖情况:
第二届国家期刊奖百种重点科技期刊,国内计算技术类重点核心期刊,国内外著名数据库收录期刊

国内外数据库收录:
俄罗斯文摘杂志,波兰哥白尼索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:60049