成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Python統(tǒng)計如何進行DNA序列整理

開發(fā) 后端
Python統(tǒng)計在廣泛的應(yīng)用中有不少的問題出現(xiàn),下面我們就來詳細(xì)的看看Python統(tǒng)計如何進行DNA序列的整理。希望大家有所收獲。

Python統(tǒng)計在我們的使用中有很多的障礙,其中在DNA序列上的相關(guān)問題就需要我們不斷的去學(xué)習(xí)。下面我們就向大家介紹有關(guān)的問題,希望在以后Python統(tǒng)計的使用過程中有所收獲。

給定一堆DNA序列,即由字符A, C, G, T組成的字符串,統(tǒng)計所有長度為n的子序列出現(xiàn)的頻率。比如 ACGTACGT,子序列長度為2,于是 AC=2, CG=2, GT=2, TA=1,其余長度為2的子序列頻率為0.

***想到的就是建一個字典,key是所有可能的子序列,value是這個子序列出現(xiàn)的頻率。但是當(dāng)子序列比較長的時候,比如 n=8,需要一個有65536 (4的8次方) 個key-value pair的字典,且每個key的長度是8字符。這樣ms有點浪費內(nèi)存。。

于是想到,所有的長度為n的子序列是有序且連續(xù)的,所以可以映射到一個長度為4的n次方的的list里。令 A=0, C=1, G=2, T=3,則把子序列 ACGT 轉(zhuǎn)換成 0*4^3 + 1*4^2 + 2*4 + 3 = 27, 映射到list的第27位。如此,list的index對應(yīng)子序列,而list這個index位置則儲存這個子序列出現(xiàn)的頻率。

于是我們先要建立2個字典,Python統(tǒng)計表示ACGT和0123一一對應(yīng)的關(guān)系:

  1. i2mD = {0:'A', 1:'C', 2:'G', 3:'T'}  
  2. m2iD = dict(A=0,C=1,G=2,T=3)  
  3. # This is just another way to initialize a dictionary 

以及下面的子序列映射成整數(shù)函數(shù):

 

  1. def motif2int(motif):  
  2. '''convert a sub-sequence/motif to a non-negative integer'''  
  3. total = 0 
  4. for i, letter in enumerate(motif):  
  5. total += m2iD[letter]*4**(len(motif)-i-1)  
  6. return total  
  7. Test:  
  8. >>> motif2int('ACGT')  
  9. 27 

以上就是對Python統(tǒng)計的相關(guān)介紹。雖然我們內(nèi)部把子序列當(dāng)成正整數(shù)來存儲(確切地說,其實這個整數(shù)是沒有存在內(nèi)存里的,而是由其在list的index表示的),為了方便生物學(xué)家們看,輸出時還是轉(zhuǎn)換回子序列比較好。

【編輯推薦】

  1. Python字符串如何進行代碼替換
  2. Python輸入方式具體的三種實現(xiàn)方式
  3. Python編程語言維和受到眾人的追捧
  4. Python編程語言具有相當(dāng)高的適應(yīng)能力
  5. Python字符串替換如何才能進行字符的拆分
責(zé)任編輯:張浩 來源: IT專家網(wǎng)
相關(guān)推薦

2010-03-10 15:41:39

Python序列

2022-07-17 07:37:29

微服務(wù)DDD工程化落地

2010-02-01 10:21:36

Python編碼轉(zhuǎn)換

2010-02-22 16:05:40

Python配置

2024-07-08 08:38:37

Python游戲開發(fā)

2010-02-03 13:55:51

Python 代碼

2010-03-15 09:47:43

Python DNA序

2010-02-01 14:48:43

2010-02-01 17:33:24

Python主線程

2010-02-01 18:20:17

Python 多重繼承

2010-03-11 17:38:20

Python中文

2010-03-15 15:11:50

Python列表

2010-02-02 16:47:12

Python主線程

2019-05-21 14:22:28

Android渠道統(tǒng)計打包

2010-02-22 17:12:34

Python對象

2010-03-01 16:32:36

Python語言

2010-03-09 18:14:55

Python sock

2010-02-01 16:22:36

Python字符串操作

2010-03-01 11:06:52

Python 調(diào)試器

2010-03-15 15:45:15

Python編程語言
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 在线免费观看视频你懂的 | 久久久视| 欧美在线a | 成人精品国产一区二区4080 | 国产欧美一区二区三区日本久久久 | caoporn国产精品免费公开 | 欧美精品a∨在线观看不卡 欧美日韩中文字幕在线播放 | 91传媒在线观看 | 日韩精品久久久久 | www.99re| 精品国产91久久久久久 | 亚洲 成人 av | 色视频在线免费观看 | 久久久久久久久国产成人免费 | 99精品国产一区二区青青牛奶 | 日韩欧美福利视频 | 在线免费观看黄a | 久草中文在线 | 日本视频在线 | 夜夜艹 | 密室大逃脱第六季大神版在线观看 | 北条麻妃视频在线观看 | 亚洲精品乱码久久久久久按摩观 | 国产日韩欧美在线观看 | 亚洲欧美日韩精品久久亚洲区 | 国产a视频 | 久久久久国产一区二区三区四区 | 色一级| 欧美一级全黄 | 亚洲一区二区三区免费观看 | 欧美综合精品 | 激情五月婷婷 | 久久精点视频 | 日韩视频成人 | 欧美日韩中文国产一区发布 | a毛片| 亚洲欧洲在线视频 | 天天色天天射天天干 | 女人av| 久久久国产精品网站 | 国产色在线 |