RNA剪接预测模型使用说明

简介

发生在外显子或内含子的突变有可能导致剪接识别序列或其他影响外显子剪接的调控因素发生变化,最终导致更严重的后果。根据对malacards(https://www.malacards.org/)网站的人类SNP致病的数据总结后可以发现,致病突变数据中有不低于15%的突变是发生在内含子上的,当中绝大部分致病突变都发生在靠近外显子和内含子的边界,这些突变大多影响了mRNA的剪接。
RNA Splicer是清华珠三角研究院人工智能创新中心研发的利用AI模型进行突变位点剪接预测的工具。RNA Splicer 的AI模型将机器学习的HMM方法与permutation test的统计学方法相结合,通过学习正常的剪接数据,可预测碱基序列突变后mRNA序列可能发生的剪接情况。
现有的剪接预测工具一般围绕预测碱基突变对正常剪接位置的影响、选择性剪接位点这些需求开发功能,但是并未对引起选择性剪接位点的机制以及产生的结果进行具体的分析。同时现有的剪接预测工具在使用上和结果解读上存在一定的难度。有些需要用户自身转换数据,结果解读难,甚至需要用户自行搭建算法模型,没有可视化展示的结果。RNA Splicer的用户界面交互友好,数据获取简单,结果解读方便,结果信息相对丰富。

操作说明

预测信息

输入感兴趣的基因进行检索
突变信息提供三种序列输入方式:“g.”以基因序列为参考序列、“c.”以基因编码序列为参考序列、“p.”以蛋白序列为参考序列

“g.”以基因序列为参考序列

例如: g.95T>G,即DNA序列95位 碱基T变成G

“c.”以基因编码序列为参考序列

例如: c.65T>G,即CDS序列的第65位的碱基由T突变成G
例如: c.68+1G>A,即CDS序列的第68位右侧一位的内含子序列的碱基由G突变成A
例如:c.52_53delTG,即CDS序列的第52位到53位的碱基TG进行删除
例如:c.52_53insAGG,即CDS序列的第52位与53位之间插入碱基AGG
例如:c.52_53delTGinsAGG,即CDS序列的第52位到53位的碱基TG进行删除并插入碱基AGG
例如:c.-12C>T,即5`UTR从右往左数第12个位子的碱基C突变成T
例如:碱基C突变成T,即3`UTR从左往右数第17个位子的碱基G突变成T

“p.”以蛋白序列为参考序列

例如:p.A3F(GCT>TTT),蛋白序列的第3号氨基酸A突变成氨基酸F,对应的碱基变化为GCT突变成TTT

预测结果

结果页面会将分子结果展示在剪接图谱的左上角:
提示插入或删除的碱基长度
序列改变后是否造成蛋白编码框的移码、序列编码是否提前终止
插入的序列是否是以伪外显子的形式存在

图标解释

序列删除
野生型序列原本存在的剪接位置
序列插入
新产生的剪接位置
伪外显子
潜在的可能剪接位置,展示的剪接方式为生信分析最可能的剪接位置
突变后预测分值降低
外显子拼接位置
突变后预测分值升高

结果展示

工具预测分析可能产生的RNA剪接结果,包括以下几种情况:
原始剪接方式:跟野生型剪接方式一致,若突变后对比突变前分值明显降低,RNA的表达量也许会受到碱基突变的影响
RNA以外显子上新的剪接位置进行剪接,存在剪接供体或者剪接受体的替换从而导致外显子序列的删除
原始剪接位置因为碱基突变遭到破坏同时内含子序列上产生了新的剪接位置,最终导致内含子部分序列的包含
原始剪接识别位点遭到破坏,使用了内含子里潜在的备用剪接位置,最终造成内含子部分序列的包含
插入一段伪外显子,碱基突变发生在内含子的内部,有可能会形成一个伪外显子插入到RNA的序列里
外显子跳跃,一个剪接识别序列被破坏,并且内含子里没有合适的替代切割位置,那可能会存在外显子的跳跃

更多信息

信息比对
科研助手
回到顶部