Entries

統計学的多重性:日眼会誌第112巻第5号

統計学的検討を行った論文数:2。
---------------------------------
第1論文:多群比較のデザインなし。

第2論文:ある疾患を有する患者群とコントロール群との間で、特定のHLAサブタイプの出現率を比較。あるいは、特定の症状を有する群と有しない群との間で、同様に特定のHLAサブタイプの出現率を比較。Bonferroni補正法を用いFisherのp検定を行ったと。2X2分割表における独立性の検定の集まり(検定数が多すぎる!)なので、Bonferroni法で補正する必要はない。同一の群を様々な尺度でグループ分けして検定するデザインにも検定の多重性における問題がある。
この記事に対してトラックバックを送信する(FC2ブログユーザー)
http://naderdotcom.blog39.fc2.com/tb.php/102-0b6cd032

0件のトラックバック

8件のコメント

[C18] Statistics

はじめまして。
突然の訪問で申し訳ありません。
現在、整形外科領域で研究を行っている理学療法士です。
統計でつまづき、色々と探しているうちに貴HPにたどり着きました。

もしよろしければご助言いただければと思います。
発表前なので例で申し訳ないのですがおねがいします。
現在、SPSSを用い、反復測定二元配置分散分析を行い、post-hocとしてTukey-Kramer法で検定を行おうとしています。
しかし、2群であるためにSPSSのソフト上でpost-hocがかからずに困っています。
たとえば捻挫後の足関節前距腓靱帯損傷群と健常群で各背屈角度における距骨の前方変位量を検討したい場合、上記のようにTukey-Kramer法でよろしいのでしょうか。
また、もしSPSSに精通されているようでしたらこのような検定が可能かどうかも合わせて教えていただけると幸いです。
ちなみに先行研究では同じような内容で上記の検定方法を用いています。
以上、長文で申し訳ありませんが、宜しく御願い致します。

[C19] RE: Statistics

ご質問ありがとうございます。SPSSを使用したことはございませんが、一般的な統計学的検討とという観点からコメントさせていただきます。

「捻挫後の足関節前距腓靱帯損傷群と健常群で各背屈角度における距骨の前方変位量を検討したい」ということですので、損傷群と健常群と間で前方変位量に有意差があるかどうか、また、背屈角度を変化させることによって有意に前方変位量が変化するかどうかについて知りたいのであれば、repeated measure ANOVA(重複測定分散分析あるいは反復測定分散分析)を用いることで問題ないと思います。

ただし、健常群を含めた全例を対象として背屈角度の変化による前方変位量が有意かどうかを知ることに臨床的意義があるかどうか、ピンと来ません。むしろ、各背屈角度における、損傷群と健常群のデータを対応のないt検定(所定以上のn数があり正規分布でない場合にはMann-Whitney's U test)で比較し、それとは別に、損傷群で(あるいは健常群で)背屈角度の変化に伴う前方変位量の変化が有意か検討(後述)する方が意味があるように思うのですが・・。

repeated measure ANOVAで有意な個体内変動が認められた場合、一般に各組み合わせについて多重比較(ここではポストホックテストと同義)を行うことはできません(通常の多重比較検定は、対応したデータを配慮しない検定だからだそうです http://www.shiga-med.ac.jp/~koyama/stat/com-anova.html)。今回の研究で例えば、0度、6度、12度の3種類の背屈角度で距骨前方変位量のデータを採った場合、0度での変位量と6度での変位量との比較、0度での変位量と12度での変位量との比較、あるいは6度での変位量と12度での変位量との比較といった、2群ずつの組み合わせでの有意差をポストホックテストで調べることはできないということです。推測ですが、このような理由で、SPSSではrepeated measure ANOVA後のポストホックテストが行えない仕様になっているのかもしれませんね。

近年の統計学では、分散分析で有意差が出た場合に多重比較を行うという2段階的な手法そのものが「統計の多重性」に関して問題なのでは、と考えられるようになってきており、3群以上についてのデータを扱う研究において、データ採取前から2群ずつの組み合わせでの差を知りたいという研究デザインが決まっているならば、分散分析を行わずに多重比較を行うことで良いという流れになりつつあります。

単純に、損傷群のみに注目して、0度での変位量と6度での変位量との比較、0度での変位量と12度での変位量との比較、あるいは6度での変位量と12度での変位量との比較を行いたいのであれば、ANOVAをせずに、総当たりの対応のあるt検定(所定以上のn数があり正規分布でない場合にはWilcoxon検定)を行って有意水準をBonferroni法で補正(5群以上での比較ならHolm法で補正)することで良いようです。

[C20] ありがとうございます。

コメントありがとうございます。
お礼が遅くなり申し訳ありません。
先生がおっしゃられるようにt検定も考えなくもないのですが、水準が14もしくは15あるのでBonferroni法は適しているのか・・・・というところで疑問を持っています。
また、他の方にも色々と質問をさせていただいたのですが、単純主効果を使ったらどうかということも言われました。
SPSSでこの処理はできたのですが、当研究室のボスがこの方法には精通しておらず、これはペアワイズなのであろうか・・・・というところで頭を悩ませています。

みたいものは先生が書かれたように各角度における損傷側と非損傷側の比較です。

宜しく御願い致します。

[C21] RE: ありがとうございます。

「みたいものは・・・各角度における損傷側と非損傷側の比較」とのことですので、それは、「多重比較 multiple comparison(http://www.ibaraki-kodomo.com/toukei/posthoc.html)」というウェブサイトの「4)どんな場合に多重性が問題となるか」という項目に記載されている「経時的データの輪切り検定(例えば、A、Bの2群間の降圧作用の差を各時点について順次比較し検定する場合)」に当たります。この研究デザインは、多重性が問題となる、よくあるパターンと言えます。水準数が14か15あるとのことですので、各水準内で有意水準5%でt検定を行ったとすると、本当は差がないのに研究全体のどこかしらで偶然に有意差が出てしまう確率は約50%です。現実的には各水準内でのt検定を14回(あるいは15回)行って、その結果から導きだされる結論を控えめに述べるということになるのでしょうが(このパターンの検定には多重比較は不要です)、理想的には研究デザイン決定の段階(データ収集の前)に、代表的な背屈角度(できればひとつ)を決定しておいて、他の背屈角度におけるデータは参考程度に利用するのが統計学的には明瞭です。
研究の目的からは逸れますが、水準間を比較する場合には、今回の研究では水準数が4を超えますので、多重比較としてHolmの方法(http://blog.goo.ne.jp/self-educator/e/84933755ff279ebfdc8fc8c275d96364)で調整するのが良いと思います。

[C22]

いつも丁寧な回答ありがとうございます。
やはり、デザインの段階でしっかりしておかないといけないと再確認しました。
また、何かありましたらご助言御願いします。
ありがとうございました。

[C27] ご質問

はじめまして。
私は臨床研究に携わるものです。
統計的なことをいろいろ調べているうちにこのページに辿り着きました。
上記の方の質問とかぶるところが多々あり、また基本的な質問で恐縮ですが、教えて頂けると幸いです。
ある群の検査値のベースライン、1週後、2週後の変化を知りたいと思い、まずはrepeated measures ANOVAを施行し、有意な結果を得ました。その後、post-hoc解析を試みたのですが、ものの本によると、対応のあるデータのpost-hocはTukey方法は使用せず(SPSSでは選択できません)、どうしてもやりたい場合はBonferroni方法を使用する(SPSSではオプションで選択可能)よう書いてありました。やはりその通りなのでしょうか?
もうひとつ、ANOVAの結果、球面性の仮定を棄却してしまう場合、そもそもANOVAは不適でMANOVAを使用すべきとも書いてありました。Greenhouse-Geisserの結果を使用したとしてもダメなものなのでしょうか?この結果を用いると自由度は整数にならないのですが、論文中に自由度を記載した場合、それだけで解析が不適とみなされるものでしょうか?
よろしくお願い致します。
  • 2008-08-18
  • (名前なし)
  • URL
  • 編集

[C28] RE: ご質問

 ご質問ありがとうございます。

 3水準(1水準はコントロール)の個体内変動を見る研究デザインですね。我々臨床医学に携わる者にとっては、どんどん発生してくるデータ形式です。
 お示しいただいた研究デザインにおいて多重比較法で比較したい組み合わせが、データ収集前の仮説から、例えば「ベースライン時の平均値vs1週後の平均値」、「ベースライン時の平均値vs2週後の平均値」の2つのみなどと限定できるなら(臨床的なデータならたいてい限定できますよね)、多重比較を行う前に分散分析をする必要はなく、むしろ「統計学的多重性」の点で問題がある、と近年言われているようです(http://www.scientist-press.com/12_11.html)。実際、僕も同様な個体内変動のデザインの論文を複数書いた経験がありますが、分散分析を行わず、すぐに多重比較を行いました。
 そんなこともあり、申し訳ありませんが、球面性検定やMANOVAについてまったく考えてみたことがありません。
 もしも個体内変動のデザインで、介入後の2水準のそれぞれをコントロール値と比較したいのであれば、データが正規分布に近似できるなら対応のあるt検定、とびとびの値をとるならWilcoxon検定を用いて2つの検定を行い、得られた2つのP値を2倍(検定を2回行ったからですね)することでBonferroni補正を行う、ということで良いのではというのが僕の考えです。

[C29]

ご丁寧にお答え頂き、誠にありがとうございます。
post-hocということ自体に問題があるのですね。
大変勉強になりました。
ありがとうございました。
  • 2008-08-18
  • (名前なし)
  • URL
  • 編集

コメントの投稿

投稿フォーム
投稿した内容は管理者にだけ閲覧出来ます

Appendix

プロフィール

Nader.com

Author:Nader.com
強膜半層切開がきれいにできなくて困ってませんか?ふふふ。

目次はこちら

全ての記事を表示する

最近の記事

ブロとも申請フォーム

この人とブロともになる

管理人へメール

名前:
メール:
件名:
本文:

FC2カウンター