研究の壁:統計手法の選び方II
こんばんわ、sumaです。
今日で101個目の記事になります。
引き続き、統計手法の選び方について書いてみます。
前回は、差の比較について説明しました。
今回はもう1つの
AとBの関係性を調べる(相関関係)
についてです。
例2
脳卒中患者の上肢機能と実際の使用頻度の関係を知りたい。
上記のような疑問が例題です。
でも、これではすぐに調べられません。
1つずつ、研究疑問に近づけていきましょう。
前回もやりました、研究の大前提をおさらいします。
1、評価項目を選ぶこと
2、評価時期と対象を統制すること
をみていきましょう。
例題で出てくる評価項目は、
上肢機能
実際の使用頻度
ですね。
この2つの関係を知りたいようです。
上肢機能は前回と同様、STEFにしましょう。
STEFは、10種の物品からなる上肢機能検査です。
右手、左手ごとに10段階で移動時間が設定されていて、合計100点満点となります。
尺度としては、間隔尺度です。
もう1つ
実際の使用頻度は、何で表されるでしょう。
たとえば、発症前の手の使用頻度を10として、今の手の使用頻度を尋ねてみますと、10段階評価で聞くことができます。
100点満点で聴いてもいいかもしれません。
ただ、この方法は信頼できる情報が得られるかどうかは不明です。
なぜなら、尺度としての信頼性や妥当性が検証されていないからです。
評価項目は、この信頼性や妥当性が確認されているものを使うことが重要です。また、対象に応じても異なりますので、注意しましょう。
はて、話しが逸れましたが、知りたいのは実際の使用頻度です。
信頼性や妥当性が確認されてるものは、MALでしょうか。
「実際の」という語には引っかかりますが、まあ良しとしましょう。
これで評価項目が決まりました。
上肢機能=STEF
実際の使用頻度=MAL
では、次は対象と時期について決めましょう。
脳卒中患者の手の使用頻度は、いつぐらいに取るのがいいでしょうか。
これは研究目的で絞ることになります。
今回は例題ですので、やや適当に決めます。
脳卒中患者のうち、急性期は、麻痺の重症度にバラツキが大きいため、適しません。
すると、回復期以降が妥当そうです。
たとえばADLの自立度によっても、手の使用頻度は変わりますよね。
なので、ADLの自立度で、統制をかけた方が良さそうです。
たとえば、バーセルインデックス85点以上を対象としたり、要支援者に限るなどです。
もちろん、利き手と非利き手によっても使用頻度は変わりそうですので、そこについても検討した方が良さそうです。
では、適当に決めてみます。
まず、利き手が右であったことを前提とした、右片麻痺を対象としました。
もともと利き手であり、使う必要性が高いはずです。
麻痺やその他の要因によって動かないのか、それとも使わないのか。
要因は様々ありますが、今回は上肢機能が高ければ、実際の使用頻度のが高くなるはずだ、という当たり前のことを検証します。(実は当たり前ではないですが)
つまり、関係なかったら、上肢機能が向上しても実際の使用頻度が高くなるとは限らないことになります。
両者に正の相関関係があれば、上肢機能が高いほど、実際の使用頻度が高くなることになります。
※グラフはイメージです
グラフでいえば、
右肩上がり↗︎の関係性のことを『正の相関関係にある』と言い、
右肩下がり↘︎の関係性のことを『負の相関関係にある』と言います。
ここまで分かれば、あと一息です。
相関関係は、2つの数値間に何らかの関係性があることを明らかにします。
しかし、ニワトリとタマゴの関係と同じで、どっちが先かは分かりません。
つまり、MALが高いから、STEFが高くなるのか、
STEFが高いから、MALが高くなるのか、
相関関係を調べても、これはわかりません。
とりあえず、何かしらの関係性がある、ということが相関関係の限界です。
また、相関関係にも、パラメトリックとノンパラメトリックの手法で分かれますので、
2つの項目の尺度の種類は理解しておく必要があります。
STEFは、間隔尺度。
MALは、合計と平均を使えば間隔尺度か?
両者が間隔尺度であり、各データの正規性が確認できたら、パラメトリックを使うことができます。
どちらか一方でも正規分布でない場合は、ノンパラメトリックにしましょう。
パラメトリックであれば、ピアソンの相関関係数を使います。
ノンパラメトリックであれば、スピアマンの順位相関係数を使います。
とりあえず、単純な2つの項目間の関係性を知りたいときは、相関関係数を調べてみましょう。
僕はあまり統計が得意ではないので、初めて統計や研究をする皆さんと同じ目線で、少しでも役に立てればと思いました。
それでは。
suma's occupation
0コメント