新聞中心
blast蛋白是哪個(gè)?
1、BLASTP是蛋白序列到蛋白庫中的一種查詢。庫中存在的每條已知序列將逐一地同每條所查序列作一對(duì)一的序列比對(duì)。

2、BLASTX是核酸序列到蛋白庫中的一種查詢。先將核酸序列翻譯成蛋白序列(一條核酸序列會(huì)被翻譯成可能的六條蛋白),再對(duì)每一條作一對(duì)一的蛋白序列比對(duì)。
3、BLASTN是核酸序列到核酸庫中的一種查詢。庫中存在的每條已知序列都將同所查序列作一對(duì)一地核酸序列比對(duì)。
4、TBLASTN是蛋白序列到核酸庫中的一種查詢。與BLASTX相反,它是將庫中的核酸序列翻譯成蛋白序列,再同所查序列作蛋白與蛋白的比對(duì)。
Nonber是什么意?
blast 的全稱是 basic local alignment search tool 是一種極其常見的序列比對(duì)工具。其中包含幾個(gè)模塊(可以這么認(rèn)為),blastn blastp blastx,tblastx 等等。blastp 用于蛋白序列之間的比對(duì)。
ncbi中怎么進(jìn)行批量blast?
用C++重構(gòu)的那個(gè)版本,蛋白比對(duì)速度快了好多倍。
不要直接blastx。你既然是mRNA,那么ORF顯然只有一個(gè)。先找出這個(gè),然后直接做blastp。
不要使用全蛋白的數(shù)據(jù)庫,而是做一些篩選。你可以選擇:
只選出mRNA對(duì)應(yīng)目標(biāo)物種的蛋白。
只使用注釋良好的蛋白,比如用SwissProt。
使用去冗余的蛋白庫,比如UniRef90,或者自己去冗余。
也可以以上都做。
當(dāng)然,你還可以搞個(gè)大點(diǎn)的電腦。NCBI的blast可以開多線程。
e值和p值有什么區(qū)別?
BLAST中使用的統(tǒng)計(jì)值有概率p值和期望e值。
E期望值(E-value)這個(gè)數(shù)值表示你僅僅因?yàn)殡S機(jī)性造成獲得這一比對(duì)結(jié)果的可能次數(shù)。這一數(shù)值越接近零,發(fā)生這一事件的可能性越小。從搜索的角度看,E值越小,比對(duì)結(jié)果越顯著。默認(rèn)值為10,表示比對(duì)結(jié)果中將有10個(gè)匹配序列是由隨機(jī)產(chǎn)生,如果比對(duì)的統(tǒng)計(jì)顯著性值(E值)小于該值(10),則該比對(duì)結(jié)果將被檢出,換句話說,比較低的E值將使搜索的匹配要求更嚴(yán)格,結(jié)果報(bào)告中隨機(jī)產(chǎn)生的匹配序列減少。
p值表示比對(duì)結(jié)果得到的分?jǐn)?shù)值的可信度。一般說來,p值越接近于零,則比對(duì)結(jié)果的可信度越大;相反,p值越大,則比對(duì)結(jié)果來自隨機(jī)匹配的可能性越大。
到此,以上就是小編對(duì)于blast和bomb的問題就介紹到這了,希望這4點(diǎn)解答對(duì)大家有用。
分享題目:blast蛋白是哪個(gè)?(BLAST中blastn和blastp的區(qū)別有哪些)
當(dāng)前網(wǎng)址:http://www.dlmjj.cn/article/coccgcj.html


咨詢
建站咨詢
