小核酸药物研发生信分析平台

艾码小核酸药物生信分析平台建立在生物信息、统计学、AI等算法和基因数据库基础之上, 旨在更高效推进小核酸药物开发。目前平台可提供以下几个分析模块:(1)借助AI算法不断优化小核酸序列模型; (2)利用优化的模型设计siRNA; (3)评估小核酸药物的脱靶效应; (4)检测siRNA载体产物的可靠性,优化递送系统;(5)供试体免疫原性反应检测。
机器学习算法训练siRNA模型
从头(de novo)设计siRNA
该流程基于靶基因和siRNA模型设计siRNA。步骤包括:
  1. 提取基因的所有转录本,分别对每一个转录本进行siRNA设计
  2. 将转录本切割成19nt的片段,输入通过机器学习算法训练的模型中,进行打分
  3. 高分值的19nt序列,比对全基因组转录本序列,剔除潜在的off-target效应
  4. 计算siRNA潜在和靶基因的结合特性,进行过滤后得到各转录本的候选siRNA
  5. 综合多个转录本候选siRNA的,取交集,得到多个按分值排序的siRNA
isomiRs检测流程

isomiRs是miRNA的一系列异构体。isomiRs形式多样,甚至引入了不同5'端及种子区域。 在第三代小核算递送系统中,含有siRNA的pre-miRNA骨架在生成siRNA时, 其产物有可能是siRNA的各类异构体。 通过检测isomiRs类别及其表达模式,我们可以判断该递送系统的可靠性, 从而为优化siRNA和骨架提供依据。

猴MHC分型

目前开源的MHC分析软件(如OptiTyp)都是基于人MHC数据库的, 在生物药研发阶段,为了预测生物药在猴中的免疫原性,需要利用已有的算法, 针对猴的MHC,开发特定的MHC分析软件。 从IPD-MHC数据库下载猴MHC序列,提取和整理特定序列的MHC信息。 将RNASeq序列比对到猴MHC序列。 利用整形线性规划算法,对比对信息进行处理,进行基因型的分型。

基于RNASeq检查siRNA脱靶效应

分析RNAi处理组和对照组的RNASeq数据,分析差异表达的基因。 分析差异表达基因和siRNA seed region序列。