人类基因组计划及其后续的DNA元件百科全书计划(The Encyclopedia of DNA Elements Project,ENCODE)研究成果表明,蛋白质编码基因序列仅占人类基因组序列的1%-3%,人基因组中绝大部分可转录的序列为长链非编码RNA(long non-coding RNA,lnc RNAs)[1].Lnc RNA广泛地存在于各种生物中,且随着生物复杂程度的升高,基因组中lnc RNA序列的比例也相应地增大,提示lnc RNA在生物进化过程中可能有着重要意义[2-4]。