位置:成果数据库 > 期刊 > 期刊详情页
支持多程序语言的静态信息提取方法
  • 期刊名称:哈尔滨工业大学学报
  • 时间:0
  • 页码:62-66
  • 语言:中文
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]哈尔滨工业大学计算机科学与技术学院,哈尔滨150001
  • 相关基金:国家自然科学基金资助项目(60673035);高等学校博士学科点专项科研基金资助项目(20092302110040).
  • 相关项目:数据挖掘和静态分析相结合的重复代码缺陷检测及重构方法
中文摘要:

为了满足代码分析对多语言静态信息提取的需求,克服当前构建单语言提取重用率低、过程复杂等不足,采用直接修改GCC特定解析阶段源代码的方法建立统一的提取接口.针对所需静态信息的不同,按GCC内部机制,提出了运行改入点与内部辅助函数重用相结合的提取方法,具体包括类型和函数声明信息的采集、函数体内程序语句的遍历以及多语言统一中间表示的获取,重用了GCC内部高质量代码,从而降低了构建静态信息提取所需的重复开销.通过对比试验表明该方法程序语言解析能力稳定健壮且效率高,能够直接提取大型开源程序的静态信息.

英文摘要:

There are many requirements for the multilanguage static information retrieval, and it is wasteful and complex to build specific front end for each language. So to meet theneed and conquer the weakness we present a method based on GCC source code change to provide a uniform interface for retrieval. According to the static information type and the GCC inside mechanism, this method integrates the specific hook point with the GCC's internal functions to gather the needed. The details to be collected include: the type and function declaration, the statements traverse and the uniform multilanguage middle-representation, iThe reusability of this method reduces the duplicated cost of the construction for each language. The comparison experiments shows that this method can efficiently and robustly parse multilanguage and be directly applied to large -scale open source code to retrieve the static information.

同期刊论文项目
同项目期刊论文