位置:成果数据库 > 期刊 > 期刊详情页
一种正则表达式匹配的存储空间优化技术
  • ISSN号:1007-1423
  • 期刊名称:《现代计算机:中旬刊》
  • 时间:0
  • 分类:TP333[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:上海海事大学信息工程学院,上海201306
  • 相关基金:国家自然科学基金(No.61472237)、上海市自然科学基金(No.14ZR1419700)
中文摘要:

针对有限状态自动机DFA构造过程中出现状态爆炸导致存储空间大、匹配效率低等问题,提出一种基于规则分组及状态边压缩相结合的正则表达式引擎优化算法GCFA,通过将规则基于关联性进行分组,对各个分组所构造的联合DFA采用存储连续字符的范围代替单一字符以达到减少存储空间的目的。实验结果证明,与标准DFA构造算法相比较,GCFA算法对状态转移边的压缩率达到98%,与经典改进算法相比较,降低2个数量级的存储空间。

英文摘要:

To solve the problems that state explosion, large storage space and low matching efficiency usually happen in the process of constructing the traditional finite state automaton such as NFA.DFA, proposes the regular expression engine optimization algorithm GCFA based on the combination of grouping rules and compressing the state transition edges. Though the analysis of the rules, combined the methods of grouping rules based on relevance and storing the contiguous characters instead of single ones when constructing the united DFAs in order to achieve the purpose of compacting the state transition edges and reduce the storage space. The results of experiments show that, compared with the standard DFA algorithm, GCFA makes the state transition edge's compression rate reach at 98%, and compared with the other classic construction algorithms of DFA, GCFA's storage space is reduced by 2 orders of magnitude.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《现代计算机:中旬刊》
  • 主管单位:中山大学
  • 主办单位:中大控股
  • 主编:林楚昭
  • 地址:广州市新港西路135号中山大学园东区106栋西座1楼
  • 邮编:510275
  • 邮箱:tougao@moderencomputer.cn
  • 电话:020-84110804
  • 国际标准刊号:ISSN:1007-1423
  • 国内统一刊号:ISSN:44-1415/TP
  • 邮发代号:46-205
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:1102