" />
GPAT生物序列模式搜索程序是時下互聯(lián)網(wǎng)常用的教育教學軟件之一,該軟件綠色、安全、無毒,讓你可以放心使用。
GPAT生物序列模式搜索程序,開發(fā)的基于IBM Splash算法的生物序列模式搜索程序。運行環(huán)境為LINUX,多線程運行,使用多CPU,運行速度快,特別適合序列中重復模式的定位。
目的獲取IBMSPLASH算法核心代碼,為進一步開展生物序列模式識別研究提供一個高效算法引擎。方法基于SPLASH算法開發(fā)核心代碼,運用開源軟件工具,開發(fā)、調(diào)試和優(yōu)化程序。結(jié)果開發(fā)出GNUPattern(Gpat)程序,高效實現(xiàn)了SPLASH算法的核心部分,并提供全部源碼,其他研究人員可以在GNU許可協(xié)議下修改該程序。結(jié)論Gpat成功地實現(xiàn)了SPLASH算法,并為下游生物序列模式識別研究提供鋪墊。
生物序列數(shù)據(jù)挖掘的主要目的是識別序列中的功能元素、研究序列間的相互關(guān)系等等。生物序列模式挖掘和生物序列聚類是生物序列數(shù)據(jù)挖掘中重要的兩個研究內(nèi)容。生物序列模式挖掘是識別功能元素進而了解序列功能等的關(guān)鍵技術(shù), 序列模式還能夠描述序列特征,作為生物序列聚類相似性度量設(shè)計的依據(jù);生物序列模式挖掘也是生物序列關(guān)聯(lián)分析的基礎(chǔ)。生物序列聚類是研究序列間相互關(guān)系進而解釋進化關(guān)系等的主要手段,其結(jié)果是具有共同特征的序列簇;另外在這樣的簇中挖掘序列模式能進一步提高序列模式挖掘結(jié)果的準確率,從而更好的指導功能元素的識別;生物序列聚類也可作為分類、異常挖掘等的預處理步驟。