bugfix> r > 投稿

このトピックに関して私が見つけた多くの質問がありますが、私のシナリオに全く似ていないものはありません。これは主に一般的な統計アプローチの質問ですが、Rでこのタイプのデータにアプローチする方法に関する役立つ情報は大歓迎です!

これは、遺伝子型を作成するために使用する3つの独立した突然変異「A、B、C」がある生物学的研究です。私の研究デザインでは、従属変数(距離)と独立変数(負荷)があります。次の遺伝子型で測定します:

Genotypes:
Reference
A
B
C
A:B
A:C
B:C
A:B:C

つまり、参照遺伝子型に「負荷を与えられた距離」のバックグラウンドレベルがあります。私がテストしたいのは、個々の突然変異(A、B、またはC)、および複合突然変異(AB、AC、BC、ABC)の、特定の負荷に対する距離への寄与です。これに対する私の計画は、異なる遺伝子型によって生じる回帰の傾きが互いに有意に異なるかどうかをテストすることでした。これにより、距離の損失が負荷の増加に起因するのか、特定の遺伝子型が負荷の増加に応じて距離をより速くまたはより遅くするのかを判断できます。

この質問にANCOVAまたは混合効果モデルを使用できるかどうか/どのように使用できるかわかりません。

距離が遺伝子型によってどのように変化するかを見る同様のアプローチがあります。その例では、私のデータ構造は次のようになります(csv):

Genotype, Distance, A, B, C
Reference, 15, 0, 0, 0
Reference, 16, 0, 0, 0
A, 15, 1, 0, 0
A, 16, 1, 0, 0
B, 12, 0, 1, 0
B, 11, 0, 1, 0
C, 15, 0, 0, 1
C, 15, 0, 0, 1
AB, 3, 1, 1, 0
AB, 4, 1, 1, 0
AC, 13, 1, 0, 1
AC, 14, 1, 0, 1
BC, 8, 0, 1, 1
BC, 9, 0, 1, 1
ABC, 2, 1, 1, 1
ABC, 2, 1, 1, 1

各遺伝子型の距離を測定し(複製を使用)、データマトリックスを使用して、その遺伝子型の変異を示します。 そのため、Aには1、0、0があり、AがあるがBではなく、Cもないことを示します。 ABには1、1、0があり、AとBがあり、Cなどはないことを示します...

そして、私は使用します:

lm<-lm(Distance~A*B*C, data=data)
summary(lm)

Distanceへの各突然変異の寄与をテストし、相互作用項(A:Bなど)が重要かどうかを確認します。これは、連続変数としてA、B、およびCを使用します(正常性の違反ですが、少なくともアプローチです)。

どんな助け、洞察、または誰かが私に向けることができる指示に感謝します。このlm()アプローチの適用は、1つの従属変数と独立変数としての遺伝子型で機能しますが、2番目の独立変数への共変量として遺伝子型(相互作用を含む)を使用することは、他の質問では採用されていません。

回答 1 件
  • 固定効果モデルの場合:

    fit.null <- lm(Distance ~ A*B*C + Genotype)

    fit.alt<- lm(Distance ~ A*B*C * Genotype)

    aov(fit.alt, fit.null) を使用してネストされたモデルをテストする 。

    仮定:十分なパワーと等分散性:簡単なトリック、クロス集計 freqs <- table(A, B, C, Genotype)   any(freqs) < 5 を検査します 。低精度は低電力を意味します。

    lme4 による分散の均一性のテストを使用した混合効果アナログ (たぶんユーザー@BenBolkerはこのモデルの適合性についてコメントできます):

    fit.null <- lmer(Distance ~ A*B*C + (1|Genotype))

    fit.alt <- lmer(Distance ~ A*B*C + (A*B*C|Genotype))

    ネストされたモデルは、分散コンポーネントのテストであるため、ここではテストできません。このようなモデルをテストすることは、stats.stackexchange.comにとってさらに問題です

あなたの答え