研究の壁:統計手法の選び方
こんばんは、sumaです。
今回の記事が、100番目になります。
不定期で、内容もないblogですが、少しでも皆様のお役に立てればと思います。
今後とも、よろしくお願いします。
さて、今日は研究する際によくつまずく、統計手法について書きたいと思います。
僕は統計について素人ですが、苦手意識を持つ皆さんに向けて、素人なりに統計の使いはじめの一歩になればと思います。
ここで扱うのは、頻度論における古典的統計手法です。
共分散構造方程式モデリングやベイズ統計は紹介しません(勉強不足でできません)
とりあえず、はじめて研究するけど、どんな統計手法を使えばいいかわからん、という人に、読んでいただければと思います。
まず、研究の目的を振り返ります。
そもそも研究は、何かを明らかにするために行うものです。
何を明らかにしたいか、で統計手法は変わってきます。
ここで確認することは、
AとBの差を比べるのか(差の比較)
AとBの関係性を調べるのか(相関関係)
の2つです。
どっちも、と言う方はもう少し後でお話しします。
まず差の比較をしたい時。
例1
脳卒中患者の上肢機能について、利き手と非利き手で回復率に差があるかを知りたい。
上記のような疑問があったと仮定します。(あまり良い例えではないですが、申し訳ありません)
研究の大前提として、
1、比較する評価項目を選ぶこと
2、評価時期と対象を統制すること
が大事です。
なぜなら、せっかく統計手法を使っても、結果の信頼性や前提とする対象がばらばらでは比較のしようがないからです。
まず、1の評価項目を決めましょう。
脳卒中患者の上肢機能といえば、WMFTやFMA、STEFなどを思い浮かべるでしょう。
例として日本で馴染み深いSTEFを用います。
上記の疑問を言い換えると、
脳卒中患者のSTEF得点の回復率が、利き手と非利き手で異なるか、となります。
さて、次は2の評価時期と対象です。
回復率という言葉から、定義つける必要があります。
回復率というのは、どのように表すでしょうか。
ある時点とある時点のSTEF得点を計測して、その変化の差が分かるはずですね。
しかし、重症度によって初期得点にばらつきがあります。
また、初期得点をいつとるか、も重要なfactorになりますね。
そして、初期と最終の期間も決めなければいけません。
回復率の表し方は、点数の差でも、初期を100%とした百分率でも、構いません。(正しい表記は厳密には知りませんので、ご了承ください)
大事なことは、
どのような時点の患者に、
どれくらいの期間を介入をしたか、
を明確にすることです。
なので、回復率を言い換えるには
発症から2ヶ月時点のSTEF得点を初期とし、
2ヶ月間の介入を行った後の4ヶ月時のSTEF得点を最終とします。
すると、
回復期脳卒中患者における2ヶ月間のSTEF得点の変化
となります。
だいぶ、具体的になった、、、かな?
同じ内容に思えても、このように具体的に設定することが重要です。
なぜなら、何をどのように比べるか、を明確にしないと統計は選べないからです。
ということで、回復率の定義は、
「回復期脳卒中患者における2ヶ月間のSTEF得点の変化」
となりました。
残るは、対象の統制です。
ここでは、「利き手と非利き手の差」をみたいのですから、それ以外の要因をなるべく統制します。
研究の場合、
利き手はほとんど右だから右片麻痺、非利き手は左片麻痺でいいじゃん、と適当に決めてはいけません。
なぜなら、利き手の違いは、生活での手の使用だけでなく、脳の優位半球や局在が異なる可能性も含むからです。
簡単にいえば、変わった人を外して、一般的な人たちを対象にしたことを証明できればいいわけです。
日本には、右利きが8割を超えますので、
エジンバラの利き手テストで右利きと判定された人たちを対象とし、矯正の経験がないことを確認しておきましょう。
そうすれば、利き手=右片麻痺、非利き手=左片麻痺とすることができますね。
これで何とか比較できそうです。
さて、見比べると
例1
「脳卒中患者の上肢機能について、利き手と非利き手で回復率に差があるかを知りたい。」
↓↓↓↓↓
「回復期脳卒中患者における2ヶ月間のSTEF得点変化の損傷半球による比較」
となりました。
統計手法を選ぶには、このように目的を明確にする過程がきわめて重要になります。
説明が下手すぎて、長くなってしまいました。
例1「回復期脳卒中患者における2ヶ月間のSTEF得点変化の損傷半球による比較」では、
一様のリハビリテーション介入をしたという前提を置き、
右片麻痺と左片麻痺患者の2群間のSTEF得点の変化値(最終のSTEF得点ー初期のSTEF得点)を比べます。
右片麻痺患者と左片麻痺患者は、それぞれ別々ですから、「対応がない」となります。
※対応がある=すべて同一の患者(同じ患者の初期と最終の得点を比較する時は「対応がある」となります)
次に、STEF得点は何尺度か、を確認します。
名義尺度、順序尺度、間隔尺度、比例尺度から選びます。
STEF得点は間隔尺度です。
尺度は、パラメトリックかノンパラメトリックの手法を選ぶのに使います。
間隔尺度は、パラメトリックな手法で使うことができます。
しかし、パラメトリックな手法を使用できる条件は、尺度だけではありません。
もう1つは、データの正規性です。
正規性とは、正規分布に従うか否かを示すものですが、
グラフをみて、なんとなく正規分布っぽいな、ってことではありません。
Shapiro-Wilk(シャピロ-ウィルク)検定というものを使って、検定します。
ここの時点で、SPSSなどの統計ソフトを使います。
Shapiro-Wilk(シャピロ-ウィルク)検定は、データの分布が正規分布と同じかどうかを見るもので、
p値が0.05未満になると→正規分布とは違う
p値が0.05以上になると→正規分布とみなす
という検定です。
つまり、間隔尺度で、正規分布とみなされれば、
パラメトリック検定を使うことができます。
この条件を満たさない場合は、ノンパラメトリック検定となります。
図は、下記URLより引用しています。
合わせてご覧ください。
この図を見ながら、もう一度確認しましょう。
例1「回復期脳卒中患者における2ヶ月間のSTEF得点変化の損傷半球による比較」
2群間に対応はありませんので、対応なし
STEF得点は間隔尺度のため、連続変数となります。
正規分布に従うか否かで分かれますが、
2群間の比較になりますので、
正規分布とみなされれば、
スチューデント(独立)t検定
正規分布でなければ、
マンホイットニーのU検定
ウィルコクスンの順位和検定
となります。
ひとまず、この流れで考えれば、差の比較はできると思います。
まあ、備忘録的に書けたので良しとします。
長文になりましたが、100個目の記事です。
お読みいただき、ありがとうございました。
suma's occupation
0コメント