〜DNA実験が一段落ついて、ある程度まとまったデータが揃ったら〜

遺伝解析をはじめるにあたって。

GENEPOP, Arlequin, STRUCTURE, FSTAT, PCAGEN, Relatedness, GDA, Microsat...
遺伝解析のソフトはあまりにたくさんあって、必要な時にどれを使えばいいかがよくわかりません。
というわけで、ここでは超簡単に、「これを求めたいならこのソフトを使えばいい」ってのを紹介します。

「基本はGENEPOPで」というスタンスです。

まずはinput fileの作成

GENEPOPを使えばArlequinやFSTAT/PCAGENのinput fileを簡単に作成できる。
そのためにまずはGENEPOP用のinput fileを作ろう。

基本情報

・個体群別、遺伝子座別のallele数: GENEPOPのOption-3.1
・個体群別、遺伝子座別のallele頻度: GENEPOPのOption-5.1
ArlequinやFSTATでもできるけど、GENEPOPが簡単だと思う。

ヘテロ接合度HeとHo、Hardy-Weinberg平衡

・GENEPOPのOption-5.1でHeとHo、Option-1.3でHWEからのずれがわかる。
Arlequinなら一気にこの二つが計算できる。

遺伝的差異:やっぱりFst?

Weir & Cockerham 1984のFstはGENEPOPのOption6-2で求まる。
ArlequinやFSTATでもできるけど、GENEPOPが簡単。
Arlequinではmissing dataの扱いが異なるので多少、値は変わる。

Fst値の0からのずれはFSTATとかで出せるけど、これはFstが非常に小さい値でも有意さが出たりする。
ただ個体群間の遺伝的差異が大きいかどうかを見たいのならFisherのExact testとかがいい気がする(経験的に)。

Exact test

GENEPOPでできる。 

血縁度

血縁度には様々な指標が提案されている。(Blouin 2003参照)
@Identify by descent(IBD)法→
Queller & Goodnight (1989)
A最尤法を用いた方法→
Milligan 2003
…など。
あとはWang (2002)とかLynch & Ritland (1999)などがあるようですが、詳しいことはわかりません。
これらの手法は、解析の目的によってどれを用いるべきなのかが変わると思うので、本格的に必要なら勉強したほうがいいでしょう。
ま、それは全ての解析に共通することですが…

@のQueller & Goodnight (1989)の血縁度は、おそらく最も多く使われているもので、実際の計算にもこれまた彼らが開発したソフト「RELATEDNESS」や「KINSHIP」が最もよく用いられている。
しかし困ったことに、これはMacintoshパソコン専用ソフトで、大多数のWindowsユーザーには使えない。
また、使い方もややこしく(マニュアルが解読できない…汗)、Macユーザーだとしても正直使いにくい。
そこで、同様のプログラムとしてたまに使われているのが
KINGROUPというソフト。
これはWindows、Mac限らず使えるし、上記に挙げた多くの血縁度について計算できる。
マニュアルが不十分なので、ソフトの中身の詳しいとこはわからないけど、その分、使い方も簡単なので英語の苦手な読者にも使いやすいだろう。

…ただ、input fileが作りにくい。
missing dataのあらわし方がQueller & Goodnightのソフト「RELATEDNESS」と同じで、この文字「(半角の)・」がWindowsではうまく入力できない。
Macで作ったファイルをWindows上のKINGROUPで使うことはできたけど、
せっかくWindowsで使えるソフトを作っておいてそんなに不便なことはない。
てわけで、いちいちMacを使わなくても済む、何かしらの方法はあるんだろうけど、現時点で筆者はその方法を知らない。
読者の中で知っている方がいれば、是非とも教えていただきたい。


(参考文献)

・Blouin,M.S.(2003). "DNA-based methods for pedigree reconstruction and kinship analysis in natural populations." Trends in Ecology & Evolution 18(10): 503-511.
・Milligan,B.G.(2003). "Maximum-likelihood estimation of relatedness." Genetics 163(3): 1153-1167.
・Queller,D.C. and K.F.Goodnight(1989). "Estimating Relatedness Using Genetic-Markers." Evolution 43(2): 258-275.
・Weir, B. S. and C. C. Cockerham 1984. "Estimating F-statistics for the analysis of population struct¬ure." Evolution 38: 1358-1370.