たいしょう‐じっけん〔タイセウ‐〕【対照実験】
対照実験
対照実験
対照実験
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/12/06 04:44 UTC 版)
グループ分けの最も簡単な例は「対照実験」といわれ実験手法であろう。「対照実験」とは、二つの状況を設定して、一つだけ条件を変え、他の条件は同じにしておくように設定された実験のことである。条件を変えてない方を「実験群」といい、変えた方を「対照群」と言う。即ち、対照実験とは、 集団/サンプル:均質な被験者の集団(例えば「風邪を引いた人達」)や均質な測定サンプルの集団を、 因子:一つの因子について(例えば「風邪薬を投与」)に関して"のみ"、 グループ分け(属性A):因子有の群(実験群,本例では「風邪薬を投与した群」)と、因子無しの群(対象群,本例では「風邪薬を投与しなかった群」)に分けて 比較(属性B):効果を比較する ような1因子実験のことである。このような実験デザインによって、「特定の一つの観点や因子の“有無”が、効果の有無につながるか否か」が鑑別出来る。対照実験の結果の解釈について、科学哲学者の戸田山和久は、「四分割表」(統計学でいうところの2×2分割表の1種)という表を用いて解釈するとわかりやすいと述べている。四分割表とは、以下の表のように、縦の見出し列を「因子の有無」(原因)、横の見出し行を「効果の有無」(結果)にわけてデータを整理するための表である。このように区分することで、表は、以下の (イ)因子有、効果有 (ロ)因子有、効果無 (ハ)因子無、効果有 (ニ)因子無、効果有 の4つのセグメントに分かれる。被験者の集団や測定サンプルの集団のうちそれぞれのセグメントに何人(何サンプル)が入るのかから、その因子の程度がある程度わかる。(実際にはきちんとした検定が必要であるが、検定をする上でもこのような考え方を知っておくと説明がしやすい。)尚、「独立性の検定」という観点からは、科学哲学者の戸田山和久は「四分割表」を「対照実験」の観点に限って説明しているが、統計学における2×2分割表は、属性A(本例では、因子の有無)、属性B(本例では効果の有無)がそれぞれ2つの階級(水準)(A1,A2,B1,B2)を持つというような問題において、属性Aと属性Bの独立性を検定するというより一般の問題を取り扱うことが出来る(属性Aが原因で、属性Bが結果である必要は必ずしもない)。さらに、属性A,Bの階級がそれぞれm,nの場合にも問題(m×n分割表の問題)は拡張可能で、この問題も「独立性の検定」の話である。 表:四分割表 効果有効果無因子有 (イ) (ロ) 因子無 (ハ) (ニ) 例えば以下の問題を検討してみよう。 1000人の風邪の人がある薬を飲み、XX人が回復したとしよう。これに対して薬は風邪に効くと結論付けてよいか? より正確な設定は以下のとおりである。 サンプル:「風邪を引いた人2,000人を」 グループ分け:「ある風邪薬を投与した群1,000人」と「そうでない群1,000人」とに分け 効果の測定:「2日以内に治ったか否かを評価する」 結果の例を以下の表に4例上げてみる。尚以下の(イ)〜(ニ)は四分割表のそれぞれのセグメントである。 (イ)(ロ)(ハ)(ニ)合計例1 999 1 1 999 2000 例2 999 1 999 1 2000 例3 800 200 600 400 2000 例4 990 10 999 5 2000 例1は、自然治癒した例(ニ)は1,000件中1例しかなく、薬を投与しても治らなかった例は1,000件中1例しかない。圧倒的に効果有りと推定されよう。 但し「効果の測定」が「2日以内に治ったか否かを評価する」という手法だが、薬を飲んだ群のほとんどがぎりぎり2日以内に治っていて、そうでない群がぎりぎり2日以降に治っていた等という可能性もあり得る。閾値の設定の問題が恣意的でないということは前提にある。 例2は、薬を飲んでも飲まなくても結果が同じであり、「薬を飲んだ人はほとんどみんな治っている」けれども、「薬の効果は無い」と推定されよう。 例1同様に閾値や効果測定の設定の問題はある。今回は「治るまでの期間はかわらないが、だいぶ楽に過ごせた」といった効果を効果とは見なしていないが、効果測定の観点をどうするかによって、結論が変わる可能性はある。また、今回の例では薬の量は投与するか否かの2択しかないが、量が妥当だったかという問題もある(⇒一因子実験)。 例3については、実験群の中での治癒率((イ)/(イ+ロ))=80% は、対照の中での治癒率((ハ)/(ハ+ニ))=60%に対して大きい。この差が“優位ではないか”と思われるほど大きい。正確な検定が必要である。 例4では、実験群の中での治癒率((イ)/(イ+ロ))と、対照の中での治癒率((ハ)/(ハ+ニ))の差がたいしてかわらない。従って効果がないと思われる。 但し、上記の閾値や効果測定法の問題に加え、「特定の機序の関与」がある場合も考えられる。これについては、イレッサの例で見てみよう。 総じて、対照実験というのは例2のような愚を犯さない上では有効だけれども、「介入の有無」、「効果の有無」を二値化していることにより 介入の強さ(薬の投与量)は妥当だったのか?(主に効果が見られなかった場合) 効果判定の閾値設定が恣意的でなかったのか?(効果があった場合もなかった場合も) という問題がある。そこで、(一つの因子に対する)介入の強さと効果判定のそれぞれを多段階にした一因子実験という考え方が出てくる。一因子実験においても、実験条件(介入の強さ,横軸)と効果判定(効果の強さ,縦軸)に取り、適切に象限を分けると、四分割表の考え方である程度理解可能である。 一方で、作用機序の問題は残っている。作用機序の問題とは、例えば以下のような事例が存在する。 このうち、海外で行われた1つの試験(INTEREST試験)では、イレッサによって、従来型抗がん剤と同程度の延命効果が得られることが証明されていますが、ほぼ同じデザインで行われた国内の試験(V15-32試験)では、延命効果を明確に証明することはできませんでした。また、海外で行われたもう1つの試験(ISEL試験)では、プラセボよりも延命効果がありそうだったのですが、明確な証明には至りませんでした。(より引用) この事例は臨床薬の治験の事例であるため、上記の例4に比べ、はるかに高度で精密な条件設定がなされているわけだが、簡単に考えれば上記の例4と似たような事例である。イレッサのような分子標的薬は、「特定の機序でがんになった人にはよく利くが、そうでない人には殆ど効果がない」という性質がある。例4の場合でも、「(イ)に相当する10人の一部は、この薬のおかげで治ったかもしれない」という可能性が残る。こういった場合には、「薬が効いた群とそうでない群」に何らかの違いがないかを検討することが望まれる。
※この「対照実験」の解説は、「科学的方法」の解説の一部です。
「対照実験」を含む「科学的方法」の記事については、「科学的方法」の概要を参照ください。
対照実験と同じ種類の言葉
- 対照実験のページへのリンク