首先,我們的DNA一半來(lái)自父親,一半來(lái)自母親。然后在我們的DNA上有一些區(qū)域存在著被稱(chēng)為串聯(lián)短重復(fù)片段(STR)的結(jié)構(gòu)。同一個(gè)STR位置,有些人有10個(gè)重復(fù),有些人有20個(gè)重復(fù)。DNA鑒定就是通過(guò)檢測(cè)20個(gè)左右不同位置來(lái)區(qū)分每個(gè)個(gè)體。我們假設(shè)每個(gè)位置有5種不同長(zhǎng)度的重復(fù)(實(shí)際只會(huì)更多),檢測(cè)20個(gè)位置理論上有95萬(wàn)億種可能,相對(duì)于目前人口的總數(shù)量是富富有余的。 但是對(duì)于同卵雙胞胎(搞遺傳和疾病研究人群的最?lèi)?ài))這樣的存在,STR的方法往往不能很好的區(qū)分。因?yàn)樵谶@種情況下STR的多樣性特點(diǎn)消失了,STR鑒定只相當(dāng)于在兩個(gè)DNA序列高度相似的個(gè)體間選取20個(gè)位置,希望能夠在這20個(gè)位置中找到不同。我們假設(shè)同卵雙胞胎的DNA相似度為99%(總體肯定會(huì)比99%更高,但是我們只考慮改變發(fā)生可能性高的區(qū)域,99%也差不多),那么隨機(jī)找20個(gè)位置完全一致的概率是81.8%。這就是為什么目前基于STR的法醫(yī)鑒定手段對(duì)于同卵雙胞胎無(wú)能為力的原因。 不過(guò)技術(shù)始終是在進(jìn)步的。科學(xué)家們又找到了一種新的標(biāo)記,稱(chēng)為單核苷酸多態(tài)性(SNP)。就是做在我們的DNA上的某個(gè)位置,有些人是A,另外一些人是B。 可以看出每個(gè)SNP包含的信息量是遠(yuǎn)遠(yuǎn)少于STR的,前者只有兩種可能,而后者可以有十幾種可能。但是SNP存在的數(shù)量非常多,檢測(cè)起來(lái)也更加容易,隨著 新技術(shù)的發(fā)展,檢測(cè)成本和時(shí)間都在大幅度下降。 前面我們說(shuō)了檢測(cè)20個(gè)STR有95萬(wàn)億種可能性,那么檢測(cè)200個(gè)SNP呢,2的200次方=10的60次方。作為對(duì)比我們知道地球上的沙子大概有10的24次方個(gè)。這樣看來(lái)檢測(cè)200個(gè)SNP來(lái)區(qū)分不同的人會(huì)比之前的STR的方法更加可靠。 再回到同卵雙胞胎的問(wèn)題上,同樣按照99%的相似度來(lái)計(jì)算,檢測(cè)200個(gè)SNP后,兩個(gè)人完全一致的概率為13.4%。雖然不能保證一定區(qū)分開(kāi),但是要比STR情況好很多。 處女座的朋友又要糾結(jié)了,萬(wàn)一我遇到的情況就是在在13.4%里面怎么辦?So easy,可以做全基因組測(cè)序,一周時(shí)間,費(fèi)用不過(guò)是幾萬(wàn)元。不要說(shuō)99%的相似度,就是99.99999999......%的相似度,只要有不一樣的地方,就能找出來(lái)。 可能還有人問(wèn),既然SNP這么好,為什么現(xiàn)在沒(méi)見(jiàn)到有人用。這就涉及到一個(gè)數(shù)據(jù)兼容的問(wèn)題,STR作為標(biāo)準(zhǔn)檢測(cè)手段存在了十幾年,已經(jīng)在全球建立了一個(gè)龐大 的數(shù)據(jù)庫(kù)。任何新的檢測(cè)手段如果不能兼容之前的數(shù)據(jù)庫(kù),那么都是很難推廣的。好消息是技術(shù)的進(jìn)步終于解決了這個(gè)問(wèn)題,DNA的檢測(cè)已經(jīng)可以同時(shí)檢測(cè)STR 和SNP。 對(duì)于雙胞胎兄弟娶雙胞胎姐妹的情況,分出孩子是誰(shuí)和誰(shuí)生的也不是問(wèn)題了。 更多詳情:科鑒基因 |