ベイズ統計その3 ニュートン2020 年9月号より

不思議大好きの、まんぼうです。
どうも別人格のはしびろこうが、新しい趣味を見つけたもので、こちらがずいぶん空いてしまいました。
本当はかなり前に下書きを完成させていたんですけどね。
まあ、人格が多数あっても、ボディーは1つなので仕方ないんですけど。
ということで、すっかり鮮度が落ちてしまった、ニュートン2020年9月号のネタ最終回です。
それではお届けしていきましょう。

ベイズ統計(推定?)の使い方1。今の状態から、過去にどうなっていたかを推測する。

未来を予測することも大事ですがね。
過去を知ることもまた、大事です。
人生においても、自然科学においても。
なぜなら、過去を知り、そこからの現在に至る流れを知ることが、未来を考える非常に良い手段だから。
では、ニュートン2020年9月号で、どんな例が出てきたかを見てみましょう。

宇宙論の研究や、病気の診断に応用できる様です。

実際に使うのは、ベイジアンネットというやつだそうで。
これは、

  • ベイズ主義に基づいたベイズ推定で統計処理したベイズ統計を、複雑な因果関係のある系で使う時の概念

だそうです。
本当にベイズだらけで、まさに「ベイズさん大活躍の巻」、ですね。
まあ、大元がベイズ主義なんで、ベイズ主義という言葉を中心に考えを進めていきます。
(つまり、ベイズ推定とかベイズ統計という言葉は、ちょっとわきに置いておきます)

宇宙論の研究にどうやって使うかというと、
宇宙の初期状態を乱数で発生させて、それらがどのくらい今の宇宙を言い表しているかをベイズ主義でもって考える
ということのようです。
”ようです”、と言いながら、何をどうするのか、わかりません。
このあたりが野良学者(しかも化学専攻)の限界と思ってください。

これに比べると、病気の診断への応用の方がわかりやすいですかね。
どんなふうに使うかというと、
「ある症状があった時に。
その元になる症状や状態について、ベイズ主義で重みをつけつつ確率を計算して、
最もそれらしい病気を見つける」
というように使う様です。
共通しているのは、「どちらも、わかっている今から、隠された過去又は原因を探る」という事ですね。

ベイズ統計(推定?)の使い方2。経験を革新に変えるために使うそうです。

ベイズ主義の特徴は、何か起こるたびに確率をアップデートするところだと思います。
前回の恋愛の例なんかがそうですね。
素人の考えはこの際置いとくとして、ニュートン2020年9月号で紹介された例は、”迷惑メールの検知”でした。
迷惑メールの判定を最初は人間がしますが、それを経験としてアルゴリズム(?)が蓄積して、迷惑メールの検知精度を上げるんだそうです。

あと、例として挙げられていたのは、オオカミ少年。
いきなり何のことかと思うでしょうけど、ベイズ主義(推定)のキモが見えるお話でしたね。
ベイズ主義を使って考えると、少年がオオカミが来たと嘘をつくたびに、”少年のオオカミが来た”という発言が嘘である確率が上がるんだそうです。
こういうのをベイズ更新というそうで。
これによると、最初に「少年が嘘をつく確率を10%」とした時に、2回嘘をついたところで、嘘つき確率が50%を超え、4回目には90%を超えるようです。
しかも、5回目以降に本当のことを言っても、なかなか嘘つき判定(嘘つきの確率)が下がらないようで。
ほんと、嘘はつかないほうがいいですねぇ。

なんかもう、「全部ベイズ主義でいいじゃないか」、となりますがそうではなくて。

本当にね、私もそう思いかけました。
面倒な繰り返し思考もいらないし、外したら確率を変えればいいし。
そもそも、人生は繰り返し思考できないものだし。
”頻度主義はカビ生えているもので、もう使えないんじゃないか”って。
でも、その考えに”待った”をかけてくれたのが、東京工業大学の渡辺先生のスライド資料でした。
googleで「ベイズ主義 頻度主義」と打ち込んで検索すればトップで出てきますが、念のためリンクを貼っておきます。
主義を心配する皆様に
これで私は思い出しました。
自然科学において新しい理論が出てきたときに、古い理論は破棄されず”身近にある事象だけを考えるときの近似的手法として生き残ることがある、ということを。
一番良い例としては、特殊相対性理論が出てきたときのニュートン力学みたいなものですね。
身の回りの事象はニュートン力学で計算して、光速に近い物体の事象を考えるときは特殊相対性理論を使う、の様に。
ベイズ主義が出てきたときの頻度主義も、似たような状況なんだと思います。
ただし、ちょっと、しかも大きく違うのが、”どちらも違う”ということ。
・・・え?なんだそれは?

確率を考えるときの”主義”というやつは、考える人が決めるもの。確率を考えるというのは、「私の考えた分布と、見えていない分布(知りたい分布)の誤差を知るという事。

つまり、確率を考えるということは、「自分の予想が、真の事象とどのくらい差があるか、を計算する事」のようです。
つまり、「確率が〇〇。その誤差は△△」というように出すことで、今回の推定がどの程度の確からしさかを確かめるということですね。
目的は、予想や推定を、本当に近づける事。
そのためには、繰り返し試行ができるならそれをすればいいし、過去に繰り返し試行を行っていて、その結果がわかっているならそれを使えばいい。
わからない部分はベイズ主義による主観で埋めてうまく計算すればいいわけです。
つまりどちらも、「絶対に真の事象を言い当てていない」ということですね。

要は、見えない未来を見つめるために、主観・客観織り交ぜて、予測する手を探しましょうってことで。

とにかくやりたいことは、「見えない未来を予想する事」なので。
そのために使えるものはみんな使って、”主観で”主義を取捨選択し、一番未来をよく予測する手を探すのが正解なんでしょうね。
よく言われる、目的と手段を取り違えないということです。
ただ、人生においては、目的のための手段、と考えていたものが、あまりに面白くて一時的に”目的”に変わってしまったということもあったりして。
それはそれで、また楽しいものなんですが。
そういう余談はここではさらりと流しておきましょう。
(私の人生なんざ、まさにこういうどんでん返しの連続だったりしますから)

ここからは、ニュートン編集部さんへのちょっとした要望。ベイズ推定について重要なのは、”主観”なわけですから、それがどこに使われているのかをはっきりさせる方がよいでしょう。

これは記事中にもありますが、ベイズ主義(ベイズ推定のもとになる考え方)のキモは、”主観”が大きく作用するということ。
これがために、従来の頻度主義者から非難を受けたのではないかと、記事でも書いてありました。
であれば、記事中で紹介された様々な例でも、主観が置かれた部分があるはずです。
私が理解した例で言いますと、
「架空の感染症において、正答率99%の検査方法で、1回陽性と出た場合に本当にその感染症にかかっている確率は、わずか3.2%である。」
という記事。
そのころ話題となっていた新型コロナにうまい具合に合わせて、検査の陽性率はあてにならないとさも言いたげですが。
(まあ、科学雑誌に限ってそういうことはないのでしょうけど)
ここでさらりと書いてあるのが、この感染症の感染率が0.1%であるということ。
実はこれが主観です。
なぜなら、この感染率は出しようのない数字だから。
だって、この数字を出す検査方法の正答率を今検証してるんですし。
感染率を頻度主義に基づいた手法で出そうとすれば、途方もない数の検査が必要ですし。
つまり、この感染率は、この状況を考えている人が主観で決めた数字です。
なので、でたらめかもしれませんし、そうでないかもしれません。
もし、この感染率が実は10%であれば、この記事の通りの結果にはなりません。
実は、主観といっても、むやみやたらと適当なことを言っているとはかぎらないので。

別の例においては、新説「まんぼう主義による推理」も頭に浮かんだりして。

他の記事で、目撃されたタクシーの色は青か緑か?という例の場合は、ちょっと主観がどこにあるのか見えにくかったですね。
私の理解では、「暗がりで青いタクシーと緑のタクシーを間違える確率」あたりに主観が入るのかなと思いました。
それでも、この確率について、十分な人数に対して統計を取ったのであれば、かなり客観性は出てきます。
そしてニュートンにおいては、
「その町に走っているタクシーが緑色のほうが圧倒的に多いため、目撃者が青のタクシーを見たといっても、実際は緑のタクシーだった可能性が高い。」
と結論付けています。(もちろん、計算した上でですけど)
しかし、まんぼうの考えた主義(名付けてまんぼう主義)で推定したところ、正反対の結論になりました。
その思考過程はこうです。
「目撃者はこの町に走っているタクシーの色は、緑が多いことを知っている。
なのに事件を目撃したときにタクシーが青色だったということが心に残ったとしたら。
”あまりないこと”だからこそ、心に強く残ったのではないか?
そうであれば、実際にこの男性が見たタクシーが青であった可能性は、何気なく町中でタクシーを見てその色を当てさせる場合の正答率よりも、高いと考えるのが適当なのではないか?
無差別にとった場合は青いタクシーを青いと答える正答率は80%だが、この場合は99%と考えてもいいのではないか?
そう考えれば・・・本当に見たのは青色のタクシーだったのかもしれない。」
どうですか?それっぽく数値も使ってみましたし。
皆様の中で”なるほど!”って思ってくれた方が多ければ、まんぼう主義も一躍ベイズ主義と肩を並べるものになる?、わけはないですけど。
でも、こうやっていろいろ考えるのも、科学の楽しみの一つかもしれません。
(ただし、素人の考えはほぼ間違いなく、「間違っている」ことが多いのですけどね)

ということで、3回にわたってお届けしたベイズ統計超入門については、これにて完結といたします。
きっかけとなった、「モンティホール問題を理解したときの快感」、は近年まれにみる衝撃でした。
また、何かでそういう経験をしたいなぁと思っています。
(もしかすると、ハシビロコウの方の人格で、DTMに関して味わっているのかもしれませんが)

それではまた、次のおもしろ不思議でお会いしましょう。

前の記事:ベイズ統計 その2 ニュートン2020年9月号より

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です