东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于文本频谱的中文文本聚类方法

ISSN号：0490-6756
期刊名称：四川大学学报(自然科学版)
时间：0
页码：-
分类：Q811[生物学—生物工程]
作者机构：[1]四川大学生命科学学院,生物资源与生态环境教育部重点实验室,成都610064, [2]军事医学科学院放射与辐射医学研究所,蛋白质组学国家重点实验室,北京100850
相关基金：基金项目：国家自然科学基金项目（30971557,30971816,30900830,30900862）
相关项目：耐热基因TT1的功能及表达调控分析

作者：杨毅|

关键词：文本频谱, 频谱比对, 文本分析, 文本聚类, text profiling, profiling alignment, text analysis, text clustering

中文摘要：

本文提出了利用文本频谱进行中文文本轮廓分析的表征方式．该方法基于不同时代、体裁和领域的文本在文字使用方面具有偏好性的假说，以文本中单个字符为单位，通过文本频谱刻画方法统计所有单字符在文本中出现的频率，并使用刻画出的文本频谱对文本进行表征；利用频谱比对分析技术，可计算出任意文本间的距离，并以此距离为基础进行聚类分析．进一步的实验证实了该方法的有效性．

英文摘要：

In this paper, a Chinese text representation method by using text profiling approach was pres- ented. This method is based on the hypothesis that, texts in different eras, styles and fields have biases in the use of characters. Text profiling was construct by counting the frequency of each character in the text in character level, and use the constructed text profiling to present the whole text. In addition, the distance between the two given texts was calculated by using text profiling alignment method. Finally, an effective text clustering method was developed on the basis of the distance. The experimental results validated the efficiency of the method.

同期刊论文项目

秀丽线虫在低氧应答过程中的定量行为学研究

期刊论文 13

耐热基因TT1的功能及表达调控分析

期刊论文 20

甘蓝型油菜耐热基因TT1的功能分析以及创制耐热油菜新材料

期刊论文 19

复杂疾病中剪接相关的外显子分子逻辑挖掘方法的研究

期刊论文 11

同项目期刊论文

甘蓝行油菜基因BnRCH转染人HEK293A和Hela细胞的研究

拟南芥谷氨酰tRNA合成酶同其相互作用蛋白VDAC的转录水平分析

转耐辐射球菌irrE基因提高拟南芥盐胁迫耐受性的表型分析

BnRCH gene inhibits cell growth of Hela cells through increasing the G2 phase of cell cycle

Arabidopsis WRKY28 transcription factor is required for resistance to necrotrophic pathogen, Botryti

酵母双杂交筛选与脱落酸受体相互作用的蛋白质及其重转酵母的验证

Regulation of the flowering time of Arabidopsis thaliana by thylakoid ascorbate peroxidase.

AtVDAC2参与拟南芥盐胁迫信号应答过程

拟南芥AtRAC在盐胁迫应答中的功能研究

甘蓝型油菜基因BnRCH转染人HEK293A和Hela细胞的研究

甘蓝型油菜BnTRl和ATP6之间相互作用的研究

油菜中一未知BnRCH蛋白的E3连接酶活性分析

油菜BnRCH基因提高转基因拟南芥的耐盐性研究

拟南芥糖基转移酶基因UGT71C5启动子的克隆和功能分析

利用酵母双杂交系统筛选甘蓝型油菜ATP6的相互作用蛋白质

转录因子AtWRKY28亚细胞定位及在非生物胁迫下的表达分析

拟南芥谷氨酰tRNA合成酶同其相互作用蛋白VDAC的转录水平分析

Expression in Escherichia coli of the Gene Encoding Ascorbate Peroxidase from Brassica napus Enhance

酵母双杂交筛选与脱落酸受体相互作用的蛋白质及其重转酵母的验证

转录因子AtWRKY28在拟南芥与甘蓝链格孢菌(Alternaria brassicicola)亲和性互作中的功能分析

AtVDAC2参与拟南芥盐胁迫信号应答过程

Regulation of the flowering time of Arabidopsis thaliana by thylakoid ascorbate peroxidase

甘蓝型油菜基因BnRCH转染人HEK293A和Hela细胞的研究

甘蓝型油菜BnTRl和ATP6之间相互作用的研究

拟南芥糖基转移酶基因UGT71C5启动子的克隆和功能分析

温度依赖型性别决定在爬行动物中的研究进展

BnRCH同源基因耐热性分析

VDAC3与ABA受体蛋白相互作用的验证以及初步研究

拟南芥AtGluRS相互作用蛋白质VDAC及其转基因植物表型分析

用于寡核苷酸二级结构预测的热力学数据库研究进展

线虫PCR:直接针对秀丽线虫进行PCR扩增基因组DNA的新方法

秀丽线虫物理低氧损伤模型的建立与应用

VizPrimer: a web server for visualized PCR primer design based on known gene structure

利用GSP逆转录结合巢式PCR技术鉴定剪接变体的新方法及其在小鼠TrkC基因变体发现中的应用

多重PCR在质粒拷贝数检测中的应用

利用单线虫多重PCR技术快速制备DNA分子量标准

PC12细胞中持续性氧糖剥夺模型的建立

核糖体谱技术及其应用

影响因子（IF）即输即现快速查询的实现

期刊信息

《四川大学学报：自然科学版》
中国科技核心期刊

主管单位:国家教育部
主办单位:四川大学
主编：刘应明
地址：成都九眼桥望江路29号
邮编：610064
邮箱：
电话：028-85410393 85412393

国际标准刊号：ISSN：0490-6756
国内统一刊号：ISSN：51-1595/N
邮发代号:62-127

获奖情况:
国家“双效”期刊,四川省十佳科技期刊,教育部全国高校优秀学报二等奖（1995，1999）,四川省科技优秀期刊一等奖（1996，2000）

国内外数据库收录:
美国化学文摘（网络版）,美国数学评论（网络版）,德国数学文摘,美国生物科学数据库,英国动物学记录,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:10542