提出了一个基于统计的从未标注语料库中半自动获取语义语法算法.该算法对特定领域的语料库进行反复的时间聚类和空间聚类,通过时间聚类发现语言片段的语法结构;通过空间聚类发现语言片段的语义类别;循环迭代,可以生成一个粗糙的文法.最后,将这些抽取出来的粗糙文法经过人工校对,得到新领域的语义语法.实验结果表明了该算法是有效和切实可行的.