ううセキが止まらず、苦しい。
今日はdisjucntive causal factorsの問題(Eells, Humphreys, and Hitchcock)。
probabilistic causalityのbasic ideaは原因(X)が結果(Y)の確率を上げるということ。つまり
X causes Y iff P(Y/X)>P(X) or P(Y/X)>P(Y/~X)(この二つは同じことだが)。
ここでP(E/~C)をどう計算するかというのが問題になる。Cがbinaryな事象なら(e.g., スイッチを入れるか入れないか)話は比較的単純なのだが、そうでないことがあり、それが今日の問題。
たとえば、
E=ある病気pが治癒する、
A=新薬qを100mgを投与、
B=新薬qを10mgを投与、
C=偽薬を投与、
として、P(E/A)=0.9, P(E/B)=0.4, P(E/C)=0.2だとする。そこでP(A)=P(B)=P(C)=1/3だとすると(たとえば新薬の治験で各100人づつにA,B,Cを投与したとする)、
P(E/~B)=P(E&(AorC))/P(AorC)=[P(E/A)P(A)+P(E/C)P(C)]/[P(A)+P(C)]=.55
したがって
P(E/~B)>P(E/B)。
ってBはEの原因じゃないのかよ!ということになる。
これに対してHumphreysはneutral stateという概念を持ちだす。つまりBというvariableに対応するpropertyがない状態(B')を考えて、P(E/B)とP(E/B')を比べたらよいという。この場合だと、B'というのは薬効がない状態だから、結局B'=CということでP(E/B)>P(E/C)。したがってBはEの原因ということになる。
しかしこれはたとえば血圧の健康に対する影響を調べるときに血圧のneutral stateってなに? となったときに困る。血圧ゼロがneutral stateということになると、ほとんどどんな血圧でも健康によいということになるが、高血圧が健康によくないということはよく知られているところである。
Eellsは各被験者あるいは被験者の傾向性を調べろという。つまりBに分類される人がいて、「もしBでなかったらどこに分類されたか」ということを考えろと(この書き方だとcounterfactualsを前提としているように見えるが、Eellsはこれをpropensityと考える)。たとえば被験者が当該新薬の供給が乏しい国にいたとすると、BでなかったときにAだったということは考えにくい。むしろ偽薬を投与されていただろう。もしこれが正しいとするとこの状況で問題になるのはP(E/B)とP(E/C)の比較だけで、これだとBはEの原因だということになる。
しかしこれは人工的な文脈設定によってBがEの原因かどうかが決まってしまう可能性があるということである。
Hitchcockはcausationていうのは本質的に3項関係なんだという。つまり、たんに「XはYの原因」というのではなくて、「XはX'とくらべてYの原因」というのが正しいと。 上の例だと、BはCとくらべたらEの原因だが、Aと比べたらEの原因ではない、ということになる。
Hitchcockはこの考え方はcounterfactual theory of causation(CFC)にも応用できるという。CFCの基本的なアイデアは、
C causes E iff ~E in the closest possible world in which ~C occurs.
たとえば「A氏の喫煙(S)が彼の肺ガン(L)の原因だ」(SL)を取り上げると、A氏が喫煙しない最近接可能世界(これをどうやって決めるかは今は考えないことにする)で彼が肺ガンにならなければCFCだとSLが正しいことになる。
しかし、「A氏が日にタバコ2箱喫煙したこと(S2)が彼の肺ガン(L)の原因である」という言明の場合、A氏が日にタバコ2箱喫煙しない最近接可能世界が、実はA氏は日にタバコ4箱喫煙する(S4)世界だったとすると、彼はなおも肺ガンになるだろう。
しかし、「S4にくらべてS2がLの原因か」という問いなら、私たちの直感はNoというだろう。また(SL)というのは、多くの場合は「A氏が喫煙しなかったときに比べてSがLの原因である」ということを意味しているだろうから、この場合~Sの成り立つ最近接可能世界で~Lならば、SLは正しいことになり、直感と一致する。
ということで、この授業ではHitchcockの論文をいくつか読んだが、いつもおもしろい。