「AB型を一言でいうと「変人」となります。より正確にいうなら「AB型の常識、世間の非常識」ということです。AB型は知的活動に適応した人間です。頭で考えて生きる人たちです。怠け者で、執着心があまりありません。」
さて、これは正しいだろうか?
http://www.catv296.ne.jp/~butakusa-no-niwa/kannjyou.htm
こちらのページからの引用トリックなのだが、AB型を「AB型は社会の中では少数派です。」としている。
もし、貴方が血液型占いが大好きだったら、これが真であると思うかもしれない。だが、この占いは、巧妙なトリックがある。
それは、事前確率を織り込んでいる、という点だ。
http://www.fukushima-bc.jp/new_page_70.htm
こちらのページで、日本人の血液型分布が見れるが、AB型の日本人は、全体の10%しかいない。
つまり、「AB型が社会の中で少数である」というのは性格上の問題以前に、すでに分布的に「少数」なのである。これをもって、性格的に少数であるというのは正しくない。すでに、分布的に少数なのだから。
つまりだが、事前確率についてまるで言及していないのである。たしかに、AB型は少数だが、それは分布の時点で少数なのである。
他にもそうだが、血液型占いは、事前確率を無視している。血液型占いが、正しいとするならば、それぞれの占いにある性格の分布は、日本人においては、
A型性格 40%
O型性格 30%
B型性格 20%
AB型性格 10%
とならなければならない。
ただ、ほとんどの占いは、そういう事を無視している。僕が血液型占いとかを信じていないのも、これが一つの理由だったりする。もっとも占いなんて何一つ信じていないけれど。
これは、事前確率がしばしば、社会で無視されているケースの一例だと思うので、あげたわけだけど、今日、問題にしたいのは、もうちょっと数学的な問題である。
感染者問題
http://www.kit-rg.jp/rg2003/rep2003/rep1.htmlより
ある国に1000人に1人の割合である病気にかかっている人がいます。その感染判定をできる検査薬を使うと、感染している場合には98%陽性反応が、非感染の場合には99%陰性反応が出ます。ある人がこの検査薬で陽性反応が出た場合、この人が本当に感染している確率はどのくらいか。
この問題を見たとき、感染していれば、98%の確率で陽性反応が出るという事から、もし貴方が、検査で陽性がでたら、「もう終わりだ」と思うかもしれない。
ただ、実は、これは、上記の占い問題のように、事前確率を無視した考え方である。
血液型占いは、事前確率である日本人の血液型分布を無視していたり、それを巧妙にAB型にだけ適用していたりするケースがある。
こういったある仮説の正しさに対する事前確率と、その仮説のもとでデータが得られる条件付き確率から、仮説の正しさを確率的に求めることはできないだろうか?
それを証明するための定理がベイズの定理となる。
いま、AおよびBを離散確率変数とし、
* P(A) = 事象Aが発生する確率(事前確率, prior probability)
* P(A|B) = 事象Bが発生した下で、事象Aが発生する確率(事後確率, posterior probability)
とする。 事象 B が発生した下で事象Aが発生する確率は P(A|B) であるが、ベイズの定理によればこれは、
P(A|B)=P(B|A) * P(A) / P(B)
と表わされる。
ベイズの定理とは上記のようなもので、最近は色んな分野で使われている模様。
では、感染者問題を例にして、ベイズの定理を使って、感染している確率がいくらであるかを計算してみよう。
まず、感染者問題においては、
患者が感染している事前確率とは、
↓
1000人に1人の割合である病気にかかっている人の割合になるので
↓
1÷1000=0.001
となる。
で、次に、
感染していて、かつ、陽性反応がでる確率は、
↓
感染者の分布確率×陽性反応で出る確率なので
↓
0.001 * 0.98 = 0.00098
となる。
一方、非感染の場合には99%陰性反応が出る。
つまり、非感染の場合で、陽性反応がでる確率が1%存在する。
↓
ということは、
↓
非感染者で、かつ陽性反応がでる確率が存在することになる。その場合の確率は、
↓
非感染者の分布確率×非感染で陽性反応がでる確率 なので、
↓
0.999 * 0.01 = 0.00999
となる。
この場合、感染者が検査で陽性反応がでた場合に、実際に感染している確率は、
(感染していて、かつ、陽性反応がでる確率)÷((感染していて、かつ、陽性反応がでる確率)+(非感染者の分布確率×非感染で陽性反応がでる確率 ))
となる。
つまり、(実際に感染している確率)を、(実際に感染している確率)と(実際には感染していないが、検査で陽性とでる確率)を足したもので割ってやれば、答えがでるわけである。
その場合の答えは、以下のようになる。
0.00098 / (0.00098 + 0.00999) = 0.0893345488
つまり、この検査で、陽性が出た場合に、実際に感染している確率は8.9%となるのである。
感染している場合には98%陽性反応が出るのだが、感染しているという事前確率が、0.001と小さいこと、感染していなくても陽性反応がでる確率が1%もあることが、事後確率に大きな影響を与えてしまうのである。
と、感染者問題は、言葉でも理解しやすいのではなかろうか。
だが、
三囚人問題
3人の囚人A、B、Cがいる。三人とも処刑されることになっていたが、王子が結婚するというので王様が一人だけ恩赦にしてやることになった。誰が恩赦になるのか決定されたが、まだ囚人たちには知らされていない。
結果を知っている看守に、囚人Aが
『BとCのうち、どちらかは必ず処刑されるのだから、処刑される一人の名前を教えてくれても、私に情報を与えることにはならないだろう。一人を教えてくれないか。』
と頼んだ。
看守は、その言い分に納得して『囚人Bは処刑されるよ』と教えてやった。
囚人Aは、
「はじめ自分の助かる確率は1/3だった。いまや助かるのは自分とCだけになったので、助かる確率は1/2になった」
と喜んだ。
さて、看守の返事を聞いた後の囚人の助かる確率はどれだけか?
この問題も、又、ベイズの定理を使わないといけないが、これを感染者問題のように言葉で説明するのが、結構難しい。
一見、パラドクスである。何故なら、「はじめ自分の助かる確率は1/3だった。いまや助かるのは自分とCだけになったので、助かる確率は1/2になった」と囚人が考えるのには、一見、妥当性があるように思えるからだ。
しかし、ベイズの定理を使えば、結局、助かる確率は、1/3なのである。
ここで、ベイズの定理を使った場合には、
P(A恩赦|看守「B処刑」)
とあらわすことが可能になる。
つまり、(B処刑と看守がいう事象)が発生した下で(A恩赦という事象)が発生する確率が、Aが助かる確率である。
この場合、ベイズの定理を使うと、
(Aが恩赦される場合に看守がB処刑という確率)÷(((Aが恩赦される場合に看守がB処刑という確率)+(C恩赦の場合にBが処刑される確率))
となるので、
((1 / 2) * (1 / 3)) / (((1 / 2) * (1 / 3)) + (1 * (1 / 3))) = 0.333333333
となる。
つまり、(Aが恩赦される場合に看守がB処刑という確率)と(C恩赦の場合にBが処刑される確率)を足し合わせたもので、(Aが恩赦される場合に看守がB処刑という確率)を割って数が、正確なAの助かる確率となる。
要するに、結局、変わらないのである。
ちょっと理解しにくい。そもそも、自分のこの考え方が、正しいかどうかも怪しい。
同じように、
モンティ・ホール問題
も、ベイズの定理を使って、言葉で納得いくように説明するのが難しい。ベイスの定理を使って説明できるようなんだけど。
これが、ベイズの定理を使って説明できることは、つまり、「ベイズの定理を理解していないと確実に負ける賭けが存在する」事を意味するので重要だと思う。
プレイヤーは、三つのドアを見せられる。ドアの一つの後ろにはプレイヤーが獲得できる景品があり、一方、他の二つのドアにはヤギ(景品がなく、ハズレであることを意味している)が入っている。ショーのホストは、それぞれのドアの後ろに何があるか知っているのに対し、もちろんプレイヤーは知らない。
プレイヤーが第一の選択をした後、ホストのモンティは他の二つのドアのうち一つをあけ、ヤギをみせる。そしてホストはプレイヤーに、初めの選択のままでよいか、もう一つの閉じているドアに変更するか、どちらかの選択権を提供する。プレイヤーは、選択を変更すべきだろうか?
結論からいうと、これは、選択すべきとなる。論理的には正しいが、納得しにくい。
事前確率とベイズの定理のような問題は、直感的には、非常に納得しにくい部分があったり、あるいはそれを最初っから、人間は無視してしまう傾向があるため、社会における「情報の非対称性」が解決しないという問題がある。
このあたりのことを、ネットで探しても、なかなか文系でも納得のいくように説明がされているのがないので、個人的に非常に苦労している。
確率分野だけでなく、行動ファイナンスとかの分野や検索などの分野でもベイズの定理は、使われているようなのだけれど、納得するのが難しいんである。
wikipediaによれば、
ベイズの定理は社会科学の分野にも応用されている。たとえば生活環境的に兄弟の多い人Aで思想が共産主義になるB確率を求める。一般的にはそのような因果関係はないかもしれないと思われている場合にそのような因果関係があるのか、ないのかをベイズの定理は調べることができる。
だそうで、こういう風な因果関係があるのかどうかを調べるときに、非常に有効なのだそうだけれども。
ゲームといじめの関係や、携帯メール多用する若者ほど性体験早いとかの話も、これを使って、ある程度因果関係が、どの程度あるのか調べれそうだけど。
あと、グーグル、インテル、MSが注目するベイズ理論とかにあるように、ベイズ理論は、最近の検索にも使われているらしい。
このあたりは、弾さんに聞いてみるのがいいのかな。ちょっとTBしてみよう。
なお、計算とか論理に間違いがありましたら、ご指摘願います。よく理解できているとは言い難いのです。
タグ:統計


ドアを開けたあとに全く知らない第3者を登場させます。回答者とちがって、第三者にとっては、どちらのドアも確率は1/2になります。
この解説で「確率というのは観察に依存するんだなぁ」と腑に落ちました。
囚人が助かる確率=囚人が死ぬ確立
がそれぞれ相互に関係しあっていない
ということをピックアップすれば文型にもわかりやすいと思いますよ。
囚人Aが助かる確率 = 1/3
囚人Cが助かる確率 = 2/3
ということになるの?
囚人Aが「Cは処刑される」という情報を得る場合も確率には含まれるから、囚人Bが助かる確率1/3は不変。
ドアとヤギのケースでは、囚人Aが情報を得た後に王様がもう一度恩赦を与える囚人を選び直すってことに相当すると思う。
この時点で確率を定義しなおすと、囚人Bは助からないから囚人A,Cが助かる確率は1/2。
囚人Aが「Cは処刑される」という情報を得る場合も確率には含まれるから、囚人Bが助かる確率1/3は不変。
ドアとヤギのケースでは、囚人Aが情報を得た後に王様がもう一度恩赦を与える囚人を選び直すってことに相当すると思う。
この時点で確率を定義しなおすと、囚人Bは助からないから囚人A,Cが助かる確率は1/2。
感染していなくても陽性反応がでる確率が
1%ではなく、0%だったら、
0.00098 / (0.00098 + 0) = 1.0 となり、
陽性が出た場合に、実際に感染している確率は100%となります。
何が間違っているのでしょう。
この式は間違ってますね。分母は排反事象の総和になっていなければならないから。
あってる