生物信息学在线分析平台
²BLAST序列相似性检索(http://blast.ncbi.nlm.nih.gov/Blast.cgi):核酸、氨基酸序列相似性检索。
²InterPro注释(http://www.ebi.ac.uk/interpro):关于蛋白家族(proteinfamilies)、功能保守区域(domains)和功能位点(funtionalsites)检索。
²GO(Gene Ontology)功能分类(http://www.geneontology.org,http://amigo.geneontology.org):基因或蛋白质从生物过程(biological process)、分子功能(molecular function)、细胞组成(cellular component)三个层面进行注释 (annotation)、分类(classification)或富集分析(GO Enrichment Analysis)。
²KEGG代谢途径分析(Kyoto Encyclopedia of Genes and Genomes,http://www.genome.jp/kegg):京都基因和基因组百科全书是系统分析基因功能,联系基因组信息和功能信息的知识库。基因组信息存储在GENES数据库里,包括完整和部分测序的基因组序列;更高级的功能信息存储在PATHWAY数据库里,包括图解的细胞生化过程如代谢、膜转运、信号传递、细胞周期,还包括同系保守的子通路等信息。
²蛋白质性质预测(PROTPARAM,http://web.expasy.org/protparam):计算蛋白质分子量MW、等电点pI、氨基酸组成、原子组成、消光系数、估算半衰期、不稳定性系数、脂溶指数和总平均亲水性(Grand average of hydropathicity,GRAVY)等参数。
²蛋白质二级结构预测:
Mfold,http://unafold.rna.albany.edu/?q=mfold
NPSA-PRABI,http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_server.html
²蛋白质三级结构预测(Swiss-Model Swiss-Model Workspace,http://swissmodel.expasy.org):
²蛋白质亚细胞定位:
PSORT WWW Server,http://psort.hgc.jp
TargetP,http://www.cbs.dtu.dk/services/TargetP/
蛋白质跨膜区分析:TMHMM-2.0,http://www.cbs.dtu.dk/services/TMHMM/
基因编辑设计在线分析平台
RNA干扰(RNA interference,RNAi)设计
RNA干扰是指在进化过程中高度保守的、由双链RNA(double-stranded RNA,dsRNA)诱发的、同源mRNA高效特异性降解的现象。基因沉默,主要有转录前水平的基因沉默(TGS)和转录后水平的基因沉默(PTGS)两类。
设计siRNA序列时,可在以下网站对目标序列进行筛选:
http://www.genesil.com/business/products/order2.htm
http://www.ambion.com/techlib/misc/siRNA_finder.html
http://www.ic.sunysb.edu/Stu/shilin/rnai.html
http://design.dharmacon.com/rnadesign/default.aspx?SID=45358710
目前已证实的siRNA可以在下面的网站检索:
http://design.dharmacon.com/catalog/category.aspx?key=49
http://www.ambion.com/techlib/tb/tb_502.html
http://web.mit.edu/mmcmanus/www/siRNADB.html
CRISPR-Cas基因组编辑设计
在各种细菌和古细菌(archaea)中陆续发现了很多成簇的、规律间隔的短回文重复序列(clustered regularly interspaced short palindromic repeat sequences,CRISPR序列)和CRISPR相关基因(CRISPR-associated genes, Cas gene),这些CRISPR序列与很多病毒或者质粒的DNA序列是互补的,这些基因编码的酶能够利用向导sgRNA(small guide RNA)分子对特定的DNA片段进行定向切割,说明这套CRISPR-Cas系统是生物体抵御病毒等外来入侵者的一套特异性防御机制。科学家们利用这种特点开发出了一种能够对基因组进行特异性定点修饰的工具,对细胞乃至整个生物体进行基因组改造。目前已经利用这种技术已对微生物、动物、植物进行过成功的遗传学改造工作。
根据目的基因的外显子序列(CDS部分),利用以下网站进行CRISPR靶点(sgRNA)设计:
CRISPRdirect:http://crispr.dbcls.jp
CRISPR design:http://crispr.mit.edu,https://zlab.bio/guide-design-resources
CRISPR-P 2.0:http://crispr.hzau.edu.cn/cgi-bin/CRISPR2/SCORE
主要要求:
(1) sgRNA的长度为17-20个碱基;如引导Cas9蛋白在基因编辑位点进行定向切割,一般是20个碱基,不含PAM序列;PAM序列为NGG(其中N为任意核苷酸),在sgRNA互补的靶基因的3'末端(设计靶点sgRNA时不带这个结构)。
(2) sgRNA多选3'末端含GG的,避免使用含“TTTT”转录终止序列,GC%含量40%-60%。
(3) 如果构建U6或T7启动子驱动的sgRNA表达载体,为提高转录效率,可限定sgRNA的5'末端为G或GG。
(4) 如需造成基因移码突变,尽量选择在功能域或编码区内部设计sgRNA。
(5) 检查sgRNA靶标位点基因组序列是否存在SNPs。
(6) 如果有指定基因组数据,可预测脱靶位点数,避免基因脱靶产生。