鸡拐信息网

【科技日报】“垃圾基因”数据库收获全球遗传学家“粉丝”

刘芷微《生物前沿》的记者颜屋说:“打个比方,如果我们的遗传信息是一座山,遗传学家知道山中有黄金,但他们用锄头。我们的工作是为他们建造“矿工”,帮助他们更快地挖掘黄金。展示我们挖掘出的东西,并建立一个资源库供他们使用。”华中农业大学信息学院和生物医学与健康学院的教授龚静这样解释了他们的研究。

龚静的团队最近在英国杂志《核酸研究》上发表了三篇文章。通过深入分析基因变异在各种癌症中的作用,他们发现了大量可以调节非编码核糖核苷酸(ncRNA)和选择性聚腺苷酸化(APA)的基因变异位点,并构建了一个在线数据库,供全球研究者共享。

"其中一个数据库已经上线一个多月了,已经有来自22个国家的1446次访问!"龚静在接受《科学技术日报》记者采访时说,她很高兴她的研究能够收获来自世界各地的粉丝。

龚静通过从“垃圾基因”中“挖掘”宝藏来详细解释其中一项研究。她说:“表达数量性状基因座(eQTL)是指基因组上可以影响基因表达的遗传变异位点。EQTL分析是分析遗传功能和寻找致病基因的重要方法之一,已广泛应用于遗传研究中。

基因分为编码基因和非编码基因。然而,目前的研究大多集中在编码基因相关EQL的识别上,对非编码相关EQL的系统分析很少。龚静说,非编码比编码基因数据大。十年前,每个人都认为它不重要,有些人甚至称之为“垃圾基因”。但是现在,每个人都发现它有越来越多的功能,甚至参与癌症的发生和发展。

龚静从事生物信息技术研究多年,一年前发现缺乏对非编码相关eQTL的系统分析,决定带领团队填补这一空白。他们利用近10,000份癌症基因组图谱(TCGA)样本的基因组和非编码表达信息,系统分析了33种癌症中遗传变异和非编码表达之间的关系。

通过大样本和多组分析,他们在33种癌症中鉴定出600多万个顺式eqtl和70多万个反式eqtl与长时间非编码有关。他们进一步将识别的eQTLs与癌症患者的生存信息相关联并进行分析,确定了与患者总生存时间相关的8,235个长的非编码核糖核酸-eQTLs和116个微核糖核酸-eQTLs。

在此基础上,他们建立了一个在线数据库。在这个网站上,其他研究人员可以轻松浏览和查询与各种癌症相关的eQTL数据。

这些eQTL数据将有助于理解遗传风险等位基因如何促进肿瘤的发生和发展,有助于遗传学家更好地理解非编码基因在癌症进展中的作用和生物学机制,并为潜在癌症靶点的开发提供新的思路。

它也可以延伸到动物和植物

本科医学研究的背景和医生对生物信息学的选择给龚静带来了更多跨学科的思考。她认为生物信息学科学家的一项重要职责是为生物学家、遗传学家和临床工作者提供更方便的工具和数据资源。

龚静说:“因为对非编码相关eQTL的研究很少,这意味着可供我们参考的研究方法很少。因此,我们需要知道如何选择方法、收集和分析数据以及构建相关的数据库。为了提高我们研究的可信度和可行性,我们使用了来自专业癌症数据库的表型样本和存活信息,这些都是经过行业认证的可靠数据。”

在数据库建设方面,如何在使用户易于使用和理解的同时体现专业科学?这花了他们很多时间。他们改变了许多版本,并从配色、排版和内容填充等方面进行了多次讨论。其目的是为其他研究人员提供一个直观的数据库,并尽力呈现专业数据库的特征。

他们的基因研究方法不仅可以应用于癌症,也可以应用于其他疾病。同时,它也可以扩展到动物和植物的研究。最近,通过广泛收集和处理动物基因组测序数据,他们为13个物种构建了基因组参考小组,并建立了一个用于填写动物遗传数据的数据库。该数据库可广泛用于动物遗传学、育种和质量改进。数据库中的数据和提供的工具可以大大节省研究成本和时间,大大提高研究效率。

龚静说他们将来会继续维护和更新这些数据库,希望让更多的研究人员受益。此外,他们还考虑根据已开发的数据库和已鉴定的具有潜在功能的基因座进一步深化研究。

具体来说,就是将生物信息方法获得的结果与人群的分子流行病学和分子生物学相结合,深入探索基因座的功能,通过多维分析找到并识别某些与癌症相关的生物标志物或药物靶标,从而真正实现生产、研究和研究的结合,促进临床生物医学实践,从而造福大众。

点击阅读原文