4月28日,中国科学院北京生命科学研究院赵方庆团队在国际期刊Genome Biology发表题为CircAtlas: an integrated resource of one million highly accurate circular RNAs from 1070 vertebrate transcriptomes 的研究论文。该研究基于现有的海量转录组数据,采用多维数据智能整合分析手段,成功解析了跨物种、多组织、大样本的环形转录本表达特征和进化规律,为探索真核生物复杂多变的环形RNA全貌和产生机制提供了强有力的数据支持。
近年来,环形RNA作为一类新型的内源性非编码RNA在生物系统调控和疾病发展过程中的作用不断被发现和扩展。高通量测序技术的快速发展和广泛应用,更是将环形RNA研究带入了大数据时代,使之迅速成为RNA研究领域的热点之一。环形RNA转录组数据的大量积累,给研究人员带来了新的机遇和挑战:如何从转录组数据海洋中高效筛选和获取具有重要生物学功能的环形RNA分子。物种信息的日益丰富为全面解读复杂的环形RNA转录调控过程打开新的突破口:基于多物种的进化保守性分析将有助于筛选出具有潜在功能的环形转录本,而多组学数据的整合分析则可以从不同层次解析环形RNA的表达调控过程。
研究人员通过整合自有及公共转录组数据,获得覆盖6个物种(人、猴、小鼠、大鼠、猪和鸡)的19个组织类型,共计1070个转录组数据集,构建了目前覆盖物种最广、数据最齐全的环形RNA整合数据资源平台circAltas (
图1.环形RNA整合数据资源和挖掘平台——circAtlas
图2. 保守性环形RNA的识别和打分策略