フィールドデータの解析覚書2

今回はロシアの共同研究者から頼まれて、「ある/なし」データの解析をすることになりました。彼も数学が苦手で私に頼んできたのですが、やはり数学な苦手な私になにができるか・・・。とりあえず情報集めは得意なのでとにかく調べまくりました。ある野生動物Aが、いる・いないというデータを彼は10年近く、3か所の調査地で集めていました。各調査地にはさらに3~4の区画があります。各年に1~3回ずつの調査回数です。とにかく体系だっていないデータ!欠測も多い…となるとANOVAなど旧来の方法は使いにくいです。そこで階層ベイズを思いつきました。

ある・なしデータはベルヌーイ分布へのフィットが基本になります。このベルヌーイ分布を主軸としつつ、そこに特定のハビタット要素の影響とか季節性、測定誤差などいろいろなことを考えなければなりません。欠測値を補う必要もあります・・・

あまりの複雑さに泥沼に陥りました。そこで、階層ベイズはとりあえずあきらめて、可能な方法を調べました。するとDynamic occupancy modelというのにあたりました。フィールドでいる、いない(=ある場所を占有した・しない)データをとったときに、それをフィットさせるというものです(MacKenzie et al.2003)。

いま、調査地 i に、季節 tのあいだにj 回調査におとずれたとき、ある種を確認したかどうかをYijt で表すとします。つまりYijt は1か0です。モデルは次の仮定をおいています。

*ある季節のなかでの各調査は独立であること

*調査地 iにその種が実際にいるかいないかの状態Zit(存在状態でもいいますか)は、季節 tの間は

変化しない。

*実際にはいないのに確認できたというような間違え方(勘違いタイプfalse-positibe errors)はない。

このとき最初の季節(つまりt=1)の調査地iの存在状態Zi1は次のようになります。もちろん0か1です。

Z i1=Bernoulli (Ψi1)

このときΨ(プサイとよむギリシャ語です)は、存在可能性を示すパラメータであり、これは実際に観測できるデータではありません。同じくZも観測はできません。t=2,3,…としたとき、

Zit~Bernoulli (Zi, t-1×Φit +(1-Zi,t-1)Γit)となります。

ひとつ前の季節t-1にiにその種が存在していなければZ i,t-1=0となります。そしてZitは0×Φit +(1-0)×ΓitをパラメータとしたBernoulliとなります。

ΦitのΦはファイ、ΓitのΓはガンマです。それぞれ局所的な生存確率、移住確率です。

このようなバックグラウンドをもとに観察失敗も加味するとある種を確認したかどうかを示すYijtは

Yijt~Bernoulli (Zit×Pijt)となります。

さらにこのモデルに環境変数を加えてその効果をモデリングしてゆくというわけです。この詳細はunmarkedというRのパッケージを参照ください。

 

 

(文献)

MacKenzie DI, Nichols JD, Hines JE, Knutson MG, Franklin AB. 2003. Estimating site occupancy, colonization, and local extinction when a species is detected imperfectly. Ecology. 84:2200–2207