ANOVA君/標準化効果量の信頼区間 をテンプレートにして作成 - 井関龍太のページ
井関龍太のページ
ANOVA君/標準化効果量の信頼区間
をテンプレートにして作成
開始行:
*&color(#6A5ACD){効果量の信頼区間}; [#d2958414]
信頼区間といえば,まず平均値の信頼区間が思い浮かぶのでは...
しかし,信頼区間は平均値だけでなく,標準誤差などさまざま...
最近では,イータ二乗などの標準化効果量の信頼区間に対する...
効果量の利用を勧めるのには,帰無仮説検定の結果を受けて有...
この考えからすると,効果量の指標についても点推定の値を提...
効果量が大きくても,信頼区間の幅が広すぎるとその大きさに...
逆に,信頼区間の幅が狭ければ,小さな効果量でも確信をもっ...
それでは,効果量の信頼区間はどのように求めたらよいのでし...
標準化効果量の信頼区間を算出する方法には,現在のところ,...
以下では,これらのアプローチについて順に簡単に説明します。
*&color(#6A5ACD){非心分布に基づくアプローチ}; [#s8ec95b6]
分散分析の標準化効果量の信頼区間を計算する方法のひとつは...
非心分布とは,われわれのよく知るt分布やF分布に非心パラ...
たとえば,通常のF分布は分子と分母の2つの自由度によって...
実のところ,通常のt分布やF分布は非心パラメータが0のと...
(非心分布と検定力,効果量の関係については,[[検定力につ...
効果量の信頼区間を算出するためには,まず,標本に基づいて...
そして,反復計算の結果として得られた非心パラメータλの信頼...
具体的には,λから偏イータ二乗を計算することになりますが,...
このように,ややまわりくどい方法になりますが,この非心分...
ただし,この方法にはいくつかの限界があります。
まず,分散分析の基本的な仮定と同じく,分布の正規性,等分...
次に,効果が小さいとき(具体的には,もとの分析のF値が小...
このような場合には,非心パラメータを0とみなして信頼区間...
Morey et al.(2016)は,このような方針の恣意性を批判して...
また,この非心分布に基づくアプローチでは,反復測定要因の...
反復測定の場合の効果量の分布は極めて複雑で,通常の分布で...
よく見ると,非心パラメータに基づいて各種効果量の信頼区間...
Matlabで各種効果量の信頼区間を計算するツールボックスとし...
その代わり,反復測定効果についてはブートストラップに基づ...
このような場合には,ブートストラップ法が代案になると考え...
**&color(#000080){ANOVA君における実装}; [#za153762]
ANOVA君では,オプションとして効果量を指定するとともに“nes...
少なくともひとつの効果量の指標を指定していない場合には何...
効果量を指定している場合,分散分析表の後に以下のような効...
<< EFFECT SIZE INFORMATION >>
=== Noncentral F Distribution-Based Confidence Intervals...
=== 95% confidence intervals are calculated. ===
--------------------------------------------------------...
ES Source Estimate CI_L CI_U ncp_L ncp_U
--------------------------------------------------------...
eta^2 A 0.0441 0.0000 0.2698 NA 8.8684
eta^2 B 0.3529 0.0000 0.5346 NA 27.5738
eta^2 A x B 0.1324 0.0000 0.3186 NA 11.2236
--------------------------------------------------------...
この表の“Estimate”は,分散分析表にあるのと同じ,効果量の...
“CI_L”,“CI_U”は,それぞれ,信頼区間の下限と上限を表して...
その次の“ncp_L”と“ncp_U”はF値に基づいて推定した(そして...
非心パラメータが推定できなかった場合,この列には“NA”が表...
また,反復測定を含む効果については,信頼区間はすべて“NA”...
*&color(#6A5ACD){ブートストラップに基づくアプローチ}; [#q...
分散分析の標準化効果量の信頼区間を算出するためのもうひと...
ブートストラップ法は,標本からのデータの無作為抽出をくり...
もう少し具体的な例を使って説明してみましょう。
いま,実験に基づいて1~10までの10個の標本が得られたとし...
説明を簡単にするため,ここでは,平均値を求めることにしま...
標本に基づく平均値は5.5です。
さて,ブートストラップを実行するために,10個の標本から無...
たとえば,1,2,3,3,4,5,6,7,9,10です。
この例からわかるように,ブートストラップ法では,値の重複...
このようにして作成したデータをブートストラップ標本と呼び...
ここで,標本に対して行ったのと同じように,ブートストラッ...
この手続きを一回行っただけではたいして意味はありませんが...
100個のブートストラップ標本に基づく,100個の平均値が得ら...
この100個の平均値は少しずつ値が違いますが,もともとの標本...
この100個の平均値を使うことで平均値の分布を描くことができ...
もとの平均よりも小さな値もあれば大きな値もあるでしょうが...
このブートストラップ平均の分布を用いることで,真の平均値...
最も素朴な直感的にもわかりやすい方法は,ブートストラップ...
これらの値がそれぞれ,平均値の上側と下側の95%信頼区間の...
ブートストラップ法の強みは,統計量に対する理論的な仮定を...
たとえば,統計量の分布について正規分布であるとか,等分散...
ブートストラップ標本に基づいて計算できる統計量であれば,...
おかげで,非心分布アプローチの場合のように効果量の種類ご...
また,分布の形状に対する仮定を必要としないので,反復測定...
もちろん,被験者間計画のデータであったとしても,正規性や...
こうしてみるとブートストラップ法はいいこと尽くめのようで...
ひとつには,計算のためのコストが大きいということです。
先ほどの例では100回のくりかえしを行うことにしていました。
くりかえしの適切な回数については統計量の性質によって経験...
標準誤差の場合には100~200回で十分とされていますが,信頼...
そうすると,ブートストラップ標本を作成し統計量を計算する...
このコストはPCによる実行時間に反映されます。
次に,サンプルサイズが少ないことによる影響があります。
ブートストラップ計算を何回くりかえしたとしても,もともと...
サンプルサイズが小さい場合には,よい精度で信頼区間を計算...
具体的なサンプルサイズについてはいろいろ議論のあるところ...
シミュレーション研究の結果によるとn=5ではかなりエラーが...
n=15でよい結果が得られたとの報告もあるようですが,n<20...
最後に,ブートストラップ法に基づく信頼区間は,その性質上...
基本的に無作為抽出に基づいて再抽出した結果をまとめる方法...
この点に不満を感じる方もおられるかもしれません。
ただ,逆に考えれば,実行のたびにずれる程度の幅は誤差であ...
**&color(#000080){ANOVA君における実装}; [#s607b6d7]
ANOVA君では,効果量とともに“besci = T”をオプションに加え...
ひとつ以上の効果量の指標を同時に指定していない場合には何...
効果量を指定してあれば,分散分析表の後に,以下のような効...
<< EFFECT SIZE INFORMATION >>
=== Bias-Corrected and Accelerated (BCa) Confidence Inte...
=== 95% confidence intervals based on 2000 replications ...
--------------------------------------------------------...
ES Source Observed CI_L CI_U Bias S.E.
--------------------------------------------------------...
eta^2 A 0.0441 0.0000 0.2090 0.0220 0.0643
eta^2 B 0.3529 0.1114 0.5381 0.0555 0.1185
eta^2 A x B 0.1324 0.0118 0.2969 0.0600 0.1012
--------------------------------------------------------...
この表の“Observed”は,分散分析表と同じ,効果量の点推定値...
“CI_L”,“CI_U”は,それぞれ,信頼区間の下限と上限を表して...
“Bias”はブートストラップ標本に基づく効果量の平均から効果...
“S.E.”はブートストラップ標本に基づく標準誤差です。
Biasが大きすぎる場合,BiasがS.E.よりも大きい場合には,ブ...
その場合は,サンプルサイズが小さい,データが正規性から極...
上の説明では,簡単さのために,ブートストラップ統計量の上...
このような方法は,パーセンタイル法と呼ばれます。
現在では,単純にパーセンタイル法を適用したのでは精度が高...
ANOVA君でも,このBCa法を用いてブートストラップ信頼区間を...
ブートストラップ標本に基づいて信頼区間を構成する方法には...
ANOVA君では,反復測定データからブートストラップ標本を作る...
このような方法は,ペアドブートストラップ,クラスターブー...
しかし,反復測定データなどの相関関係のあるデータからブー...
総じて,ここで採用している方法だけが妥当であるというわけ...
besciオプションの実行には,相応の計算コストがかかるので注...
具体的には,ANOVA君では,デフォルトの反復回数は2,000回に...
実際の所要時間は実行環境やデータそのものの性質にも依存す...
いったんブートストラップなしで出力の量(要因効果の数と単...
また,ブートストラップの途中で計算を停止したい場合にはエ...
なお,WindowsよりもMacかLinuxのほうが実行時間が安定して短...
*&color(#6A5ACD){参考文献}; [#l815768b]
Fidler, F., & Thompson, B. (2001). Computing correct conf...
南風原朝和 (2014). 続・心理統計学の基礎-統合的理解を広げ...
Kelley, K. (2005). The effects of nonnormal distributions...
Kelley, K. (2007). Confidence intervals for standardized ...
Kirby, K. N., & Gerlanc, D. (2013). BootES: An R package ...
Kline, R. B. (2013). '''Beyond significance testing: Stat...
Kromrey, J. D., & Bell, B. A. (2010). ES_ANOVA: A SAS® ma...
Morey, R. D., Hoekstra, R., Rouder, J. N., Lee, M. D., & ...
汪金芳・桜井裕仁 (2011). Rで学ぶデータサイエンス4 ブー...
終了行:
*&color(#6A5ACD){効果量の信頼区間}; [#d2958414]
信頼区間といえば,まず平均値の信頼区間が思い浮かぶのでは...
しかし,信頼区間は平均値だけでなく,標準誤差などさまざま...
最近では,イータ二乗などの標準化効果量の信頼区間に対する...
効果量の利用を勧めるのには,帰無仮説検定の結果を受けて有...
この考えからすると,効果量の指標についても点推定の値を提...
効果量が大きくても,信頼区間の幅が広すぎるとその大きさに...
逆に,信頼区間の幅が狭ければ,小さな効果量でも確信をもっ...
それでは,効果量の信頼区間はどのように求めたらよいのでし...
標準化効果量の信頼区間を算出する方法には,現在のところ,...
以下では,これらのアプローチについて順に簡単に説明します。
*&color(#6A5ACD){非心分布に基づくアプローチ}; [#s8ec95b6]
分散分析の標準化効果量の信頼区間を計算する方法のひとつは...
非心分布とは,われわれのよく知るt分布やF分布に非心パラ...
たとえば,通常のF分布は分子と分母の2つの自由度によって...
実のところ,通常のt分布やF分布は非心パラメータが0のと...
(非心分布と検定力,効果量の関係については,[[検定力につ...
効果量の信頼区間を算出するためには,まず,標本に基づいて...
そして,反復計算の結果として得られた非心パラメータλの信頼...
具体的には,λから偏イータ二乗を計算することになりますが,...
このように,ややまわりくどい方法になりますが,この非心分...
ただし,この方法にはいくつかの限界があります。
まず,分散分析の基本的な仮定と同じく,分布の正規性,等分...
次に,効果が小さいとき(具体的には,もとの分析のF値が小...
このような場合には,非心パラメータを0とみなして信頼区間...
Morey et al.(2016)は,このような方針の恣意性を批判して...
また,この非心分布に基づくアプローチでは,反復測定要因の...
反復測定の場合の効果量の分布は極めて複雑で,通常の分布で...
よく見ると,非心パラメータに基づいて各種効果量の信頼区間...
Matlabで各種効果量の信頼区間を計算するツールボックスとし...
その代わり,反復測定効果についてはブートストラップに基づ...
このような場合には,ブートストラップ法が代案になると考え...
**&color(#000080){ANOVA君における実装}; [#za153762]
ANOVA君では,オプションとして効果量を指定するとともに“nes...
少なくともひとつの効果量の指標を指定していない場合には何...
効果量を指定している場合,分散分析表の後に以下のような効...
<< EFFECT SIZE INFORMATION >>
=== Noncentral F Distribution-Based Confidence Intervals...
=== 95% confidence intervals are calculated. ===
--------------------------------------------------------...
ES Source Estimate CI_L CI_U ncp_L ncp_U
--------------------------------------------------------...
eta^2 A 0.0441 0.0000 0.2698 NA 8.8684
eta^2 B 0.3529 0.0000 0.5346 NA 27.5738
eta^2 A x B 0.1324 0.0000 0.3186 NA 11.2236
--------------------------------------------------------...
この表の“Estimate”は,分散分析表にあるのと同じ,効果量の...
“CI_L”,“CI_U”は,それぞれ,信頼区間の下限と上限を表して...
その次の“ncp_L”と“ncp_U”はF値に基づいて推定した(そして...
非心パラメータが推定できなかった場合,この列には“NA”が表...
また,反復測定を含む効果については,信頼区間はすべて“NA”...
*&color(#6A5ACD){ブートストラップに基づくアプローチ}; [#q...
分散分析の標準化効果量の信頼区間を算出するためのもうひと...
ブートストラップ法は,標本からのデータの無作為抽出をくり...
もう少し具体的な例を使って説明してみましょう。
いま,実験に基づいて1~10までの10個の標本が得られたとし...
説明を簡単にするため,ここでは,平均値を求めることにしま...
標本に基づく平均値は5.5です。
さて,ブートストラップを実行するために,10個の標本から無...
たとえば,1,2,3,3,4,5,6,7,9,10です。
この例からわかるように,ブートストラップ法では,値の重複...
このようにして作成したデータをブートストラップ標本と呼び...
ここで,標本に対して行ったのと同じように,ブートストラッ...
この手続きを一回行っただけではたいして意味はありませんが...
100個のブートストラップ標本に基づく,100個の平均値が得ら...
この100個の平均値は少しずつ値が違いますが,もともとの標本...
この100個の平均値を使うことで平均値の分布を描くことができ...
もとの平均よりも小さな値もあれば大きな値もあるでしょうが...
このブートストラップ平均の分布を用いることで,真の平均値...
最も素朴な直感的にもわかりやすい方法は,ブートストラップ...
これらの値がそれぞれ,平均値の上側と下側の95%信頼区間の...
ブートストラップ法の強みは,統計量に対する理論的な仮定を...
たとえば,統計量の分布について正規分布であるとか,等分散...
ブートストラップ標本に基づいて計算できる統計量であれば,...
おかげで,非心分布アプローチの場合のように効果量の種類ご...
また,分布の形状に対する仮定を必要としないので,反復測定...
もちろん,被験者間計画のデータであったとしても,正規性や...
こうしてみるとブートストラップ法はいいこと尽くめのようで...
ひとつには,計算のためのコストが大きいということです。
先ほどの例では100回のくりかえしを行うことにしていました。
くりかえしの適切な回数については統計量の性質によって経験...
標準誤差の場合には100~200回で十分とされていますが,信頼...
そうすると,ブートストラップ標本を作成し統計量を計算する...
このコストはPCによる実行時間に反映されます。
次に,サンプルサイズが少ないことによる影響があります。
ブートストラップ計算を何回くりかえしたとしても,もともと...
サンプルサイズが小さい場合には,よい精度で信頼区間を計算...
具体的なサンプルサイズについてはいろいろ議論のあるところ...
シミュレーション研究の結果によるとn=5ではかなりエラーが...
n=15でよい結果が得られたとの報告もあるようですが,n<20...
最後に,ブートストラップ法に基づく信頼区間は,その性質上...
基本的に無作為抽出に基づいて再抽出した結果をまとめる方法...
この点に不満を感じる方もおられるかもしれません。
ただ,逆に考えれば,実行のたびにずれる程度の幅は誤差であ...
**&color(#000080){ANOVA君における実装}; [#s607b6d7]
ANOVA君では,効果量とともに“besci = T”をオプションに加え...
ひとつ以上の効果量の指標を同時に指定していない場合には何...
効果量を指定してあれば,分散分析表の後に,以下のような効...
<< EFFECT SIZE INFORMATION >>
=== Bias-Corrected and Accelerated (BCa) Confidence Inte...
=== 95% confidence intervals based on 2000 replications ...
--------------------------------------------------------...
ES Source Observed CI_L CI_U Bias S.E.
--------------------------------------------------------...
eta^2 A 0.0441 0.0000 0.2090 0.0220 0.0643
eta^2 B 0.3529 0.1114 0.5381 0.0555 0.1185
eta^2 A x B 0.1324 0.0118 0.2969 0.0600 0.1012
--------------------------------------------------------...
この表の“Observed”は,分散分析表と同じ,効果量の点推定値...
“CI_L”,“CI_U”は,それぞれ,信頼区間の下限と上限を表して...
“Bias”はブートストラップ標本に基づく効果量の平均から効果...
“S.E.”はブートストラップ標本に基づく標準誤差です。
Biasが大きすぎる場合,BiasがS.E.よりも大きい場合には,ブ...
その場合は,サンプルサイズが小さい,データが正規性から極...
上の説明では,簡単さのために,ブートストラップ統計量の上...
このような方法は,パーセンタイル法と呼ばれます。
現在では,単純にパーセンタイル法を適用したのでは精度が高...
ANOVA君でも,このBCa法を用いてブートストラップ信頼区間を...
ブートストラップ標本に基づいて信頼区間を構成する方法には...
ANOVA君では,反復測定データからブートストラップ標本を作る...
このような方法は,ペアドブートストラップ,クラスターブー...
しかし,反復測定データなどの相関関係のあるデータからブー...
総じて,ここで採用している方法だけが妥当であるというわけ...
besciオプションの実行には,相応の計算コストがかかるので注...
具体的には,ANOVA君では,デフォルトの反復回数は2,000回に...
実際の所要時間は実行環境やデータそのものの性質にも依存す...
いったんブートストラップなしで出力の量(要因効果の数と単...
また,ブートストラップの途中で計算を停止したい場合にはエ...
なお,WindowsよりもMacかLinuxのほうが実行時間が安定して短...
*&color(#6A5ACD){参考文献}; [#l815768b]
Fidler, F., & Thompson, B. (2001). Computing correct conf...
南風原朝和 (2014). 続・心理統計学の基礎-統合的理解を広げ...
Kelley, K. (2005). The effects of nonnormal distributions...
Kelley, K. (2007). Confidence intervals for standardized ...
Kirby, K. N., & Gerlanc, D. (2013). BootES: An R package ...
Kline, R. B. (2013). '''Beyond significance testing: Stat...
Kromrey, J. D., & Bell, B. A. (2010). ES_ANOVA: A SAS® ma...
Morey, R. D., Hoekstra, R., Rouder, J. N., Lee, M. D., & ...
汪金芳・桜井裕仁 (2011). Rで学ぶデータサイエンス4 ブー...
ページ名: