・公共政策大学院を読み解く ・文書の可読性(リーダビリティー)と記述の信頼性 ・目次を読み解く ・「モンテカルロ分析」 ・専門家による「確率的感度解析」の検討 ・いま、再び「モンテカルロ分析」 ・センセイはこう書く ・経済(社会科学)と物理(自然科学)
(約18000字)
よそさまの実習の成果物として提出および公開されたレポート(報告書ただし実務でない)に、横から(「上から」ではありません)あれこれ云々できる、いい時代になったなぁ、と実感されます。
よその大学(や大学院)のことが、あるいは中高生でも(大学=学部を飛び越えて大学院のことを=4年「先取り」で)、垣間見ることができるのです。まずは見えないと、そこに大学院があるということすら知られません。いろいろと取り繕った、いわゆる「MOOC」もいいですが、もっと生のレポートを、そのまま見る(「読める!」かどうかは、ちょっと難しい面もあるわけですが)ことが第一歩です。
・(参考)JMOOC
http://www.jmooc.jp/
●公共政策大学院を読み解く このたびはまことに「炎天下の中」…(略)以下のレポートを読もうと思いました。しかし、本稿では「読む」ところまではいかれません(稿を改めて読みたく思います)。
・「京浜東北線におけるホームドア導入に関する費用便益分析」東京大学公共政策大学院(2014年)
http://www.pp.u-tokyo.ac.jp/courses/2014/documents/graspp2014-5113090-2.pdf
まず、いかなる課程の、いかなる段階にある学生の、いかなる成果物であるのか、注釈が必要かと思います。
・東京大学公共政策大学院
http://www.pp.u-tokyo.ac.jp/overview/index.htm
> 定員は、1学年110人。
「修士課程未満」といわれることもある(悪い意味ではありません:間口を広げ、より多くの人に「学部以上」の教育機会をもたらす施策です)「専門職大学院」で、あまり(学術的に)キツキツなことをいわれず、それなりにノビノビと、端的に、ワクワクしながらまとめられたのではないかなぁ、と思われる、ちょっと楽しそうなレポートです。(論文ではありません。実習科目の課題ですね。)
その「楽しさ」は、定員の多さにも、1つの課題に4名で取り組む(※列車の分割併合のうち併合が乗務員を節約する施策であるのと同じように、教員を節約する施策にほかなりません)ところにも表れています。修士課程なら、一人で取り組むところです。そこが、修了後の実際の仕事(実務)がチームワークであるのに沿っているということで、しかし、本来なら「1人でもできる!」人が「3人寄ればナントヤラ(ただしフゲンでない)」であって、そうではない人が何人集まっても、総和が1を超えることはきわめて難しいようにも感じます。(感想は個人ですが実感です、ゲフン。)
※ましてや福岡ブルックス…いえ、ブルックスの法則([2984])が効いて…いえ、容赦なく「ふりかかって」きますから、業務というものはどんどんつまらなく、そしておもしろいように遅れ、停滞していくのです。大げさです。何でもとりあえずは1人でしてみなはれ、役割の違う3人で集まってみなはれ、といってみたいですが(Googleの社内では言われているというウワサですが)、いえいえ、ブルックスの法則など考えもせず「遅れているプロジェクトに『サポート』などと称して応援要員を追加する」ようなことをしている業界は、あちこちにあるのではないかと想像します。(あくまで想像です。)
学生については、「1年生」ですね、わかります。大学院に行っていない、いまさらとはいえ行こうかなぁ、と迷われている社会人の方にあっては、確かに、いますぐは自分では取り組めず(取り組み方がよくわからない)、行ってすぐ、あるいはその年のうちに仕上げることができる(書ける)成果物として、このくらいなんだ(決してむずかしいことや高尚なことをしているわけではないが、確かに職場の上司の「指導」だけではできず、やっぱり大学のセンセイは違うなぁ、と一応は実感される、の意)というのが、なんとなくわかる、活きた資料でもありましょう。
・同
http://www.pp.u-tokyo.ac.jp/divisions/economicpolicy.htm
> 公共政策の経済評価、公共政策の経済評価実習
大学院とはいえ、ひたすら「授業」を「46単位以上」も「修得」し、しかし修士論文は課されず「修了」されていくということで、いわば学部の3・4年生をやり直しつつ、修士の1年生だけで終えるような、という感じがします。いわゆる「学び直し」(専攻を途中で変えた、あるいは実務で必要になった)としては申し分なく親切で充実したカリキュラムですが、これをもって(これだけを)大学院だと思っていただいては困ります。いえ、私は困らないですが、将来的に、社会的に、困ったことになるかもしれないということですね、わかりませんわかりません(わからなくても大丈夫です、そこまで「大きなことや重たいこと」は私もわかりませーん、の意:恐縮です)。
そして、カリキュラムの上で「メーンイベント!」(ハイライトのようなもの)といえるのが「実習」だとわかります。調査や分析の方法や最新の事例などを「座学」で学ぶ科目と、それを踏まえてグループで課題に取り組む「実習」がセットでおトク…いえ、不可分の一連の科目として設計されていることがわかります。どんな学部でも、こうした「専攻の核となる『科目セット』」がありますから、みなさま、何か一つは「○○概論」や「○○方法論」と「○○実習」(○○の部分は4年間通して同じ:学科や専攻の名称とも同じの場合が多い)をこなしてから社会人になられているはずですが(学部卒の場合)、それをもう一回、そして、学部よりはちょっとレベル(難易度や精緻度のようなもの)を上げて取り組むということですね、わかります。
●文書の可読性(リーダビリティー)と記述の信頼性 文書の形式的な可読性と、記述された内容の信頼性は、一般にかなり相関があると実感されましょう。
・「構文的特性に着目した可読性診断技術」東芝レビュー Vol.66 No.4(2011年)
http://www.toshiba.co.jp/tech/review/2011/04/66_04pdf/f06.pdf
実習のレポートを、いま、可読性やいかにという目から(目だけで)見てみます。(見るだけで、読みません。)
すると、目次(後述の「メタ目次」に沿っていない)や文章(段落の分け方など形式面)、図表の入れ方(上寄せに揃っていない)、改ページ(していない)などが、かなりグダグダであると気づきます。論文でなくても、論文に準じて書くよう指導…は、されなかったようですね。
※「論文じゃないんだから、適当でいいよ」とまでは言われてはいないと信じたいですが、しかし、定員あたりの教員の少なさからして、現実的には教員の指導は内容面だけに留まり、形式的な面をミッチリと鍛え上げるのは修士課程の学生だけ、といった一種「線引き」がされているのではないかと想像されます。ちょっと(かなり)もったいないです(ここまで取り組んでおきながら形式がグダグダだということがもったいない、の意)。
なぜ形式が大事かといえば、形式を厳格に運用すること自体が1つ(!)の能力になっていくということも、もちろんですが、それにもまして、形式に当てはめてみることで、「自分なり」に素朴に取り組んだときに起こしやすい「漏れ(抜け)」と「重複(ムダ)」の両方を、第三者的な目で(自分で取り組みながらも自分ではない目で)チェックできるということがあります。いわゆる「精神論」ではなく、たいへん実用的な面から大事なことなのです。
…と、こんなことをなぜ最初に(内容に言及するより前に)述べるかといえば、5章だけ先に読む、そして1章を読む、3章を読んでから2章を読み、最後に(やむをえず…いえいえ、たいへん興味深く)4章を読むという、いわば「形式的な読み方」ができなくて不便を被ったといって、ちょっと不満そうに述べているわけですね、わかります(わかってくださぁい)。
※余談ですが、こういう話、理系の学生がうっかりすると、ともすると「TeXも使わないなんてありえない!」「しょせんWordしか使えない人たち」といった、一種、見下すような何かを持ってしまいがちですが、そうではありません。Wordでもできますし、そこは本質的なことではありません。TeXを使っていながらグダグダ、という例もなくはないでしょう。
●目次を読み解く まず、目次だけを見て本稿(実習のレポート)の骨格を見定めたく思います。(誰もが思います。)
・1. はじめに
・2. 「研究の背景」
・3.A 費用の推計
・3.B 便益の推計
・4.および5.「本研究の結論と限界」
※番号は「メタ目次」([3093],[3094])に沿って振り直して示しています。
実習とはいえ「研究」と称されるんですね。失礼しました。ならば、本格研究([3091])…いえ、本格的に、研究の形式にならって見ていこうではありませんか、と意気込まれます。(誰もが意気込みます。)
目次では「3. 本研究における分析手法」「6. モンテカルロ分析」という章が設けられていますが、これらはいずれも、著者らが提案するものではなく(既知の手法で)、単に「今回はコレを使います」という宣言(=プログラミングでいうところの)ですから、研究であれば3章の中で手短に述べたり、(この分野で)あまりにも一般的なことがらであれば、脚注で済む話でしょう。(この分野について詳しくなく恐縮ですが一般に、の意。)
※例えば、「XXX解析にはXXXXX Ver.x.xxを用いた。」と記すかどうかで、分野の微妙な違いや、当該の著者のレベルまでがわかるとまでいわれるかもしれません。
とはいえ、学生として、レポートとしては「ココを勉強しました!」とアピールしたい箇所でもありましょう。独立に章立てしたくなるお気持ちはわかります。しかし、「研究」と称するのであれば、あくまで3章に入れましょう…と「朱っ☆」([3041])されるはずです。
「6. モンテカルロ分析」の本文を見ますと(読まずに「見る」!)、「本節では、」より前がえらく長いです。これは、前の章や節に入れることがらでしょう。そもそも、章や節の冒頭が「以上の分析で算出された…」と始まるのはおかしく(他の章や節とは独立していてこそ、章や節に分ける意味があるのです)、また、「どの分析」を指すのかあいまいです。本稿での分析の全体を指すなら「本分析」「本研究での分析」といえばよいのです。そして、「本分析」の中に「モンテカルロ分析」も含まれ、これ全体が3章に収まれば収まりがよい、ということにも自然に気づかれましょう。
…しかじか、かなり専門外でむずかしいのですが、「モンテカルロ分析」は、「費用の推計」「便益の推計」の両方に対して、事後的に適用するものであるとわかりました。なるほど、目次の立て方に悩まれる姿が思い浮かびます。
※「次のようなコンピュータ プログラムにより求める。」が、うーん、あくまで経済学研究科をベースに専門職大学院だというと、そういうお立場なんだろうとは思いますが(自分ではコードを1行も書かないまま「研究」する人が、教員でもいるかもしれません)、世の中はそうではないんだ、という「世の中のことも知っています感」のようなものが、ちょっと(かなり)足りないようにも感じられます。(あくまで文面上の話です。本当はわかっているんでしょうけれども、それを書くと書かないとでは大違いで、書いていないことは知っていない=ここでは知らなくていいとみなした=とみなされるのが研究であり論文です。)
図(「図表23」※)がExcelっぽいので、「モンテカルロ分析」もExcelの上でがんばったのかなぁ、と想像されます。(あくまで想像です。)そして、え゛ー(「図」なんですか「表」なんですか、図と表は分けて番号をふりましょうよ、の意)、と絶句されます。
※もっとも、番号がついているだけ、まともではあります。([3027]では番号なし。番号を振らない話については[3050]も参照。)
●「モンテカルロ分析」 「図表24」の「(ヒストグラム)」を見ますと、えー、これを分析というのかなぁ、と、専門外ながら感じます。(あくまで感想です。)
・「さまざまな確率分布 (probability distributions)」
http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/statdist.html
・手塚太郎「ベルヌーイ分布と多項分布」
http://www.slideshare.net/TaroTezuka/bernoulli-distributions-and-multinomial-distributions
http://karasuma.univnet.jp/teachers/detail/9
※「まるっと」発泡スチロールで川下り…いえ、文中に出てくる「ナントカ分布」をいきなり「ググ」れば、「詳しすぎるスライド」が出てきてしまいます。これは、もっと基礎がわかってから参照すべき資料ですね、わかります。そうした意味で、ちょっと立ち戻って「さまざまな確率分布」を読んでみましょう、というわけです。
専門でないので恐縮ですが、専門でない人が確率分布を云々しなければならなくなったときにどうやって「安全に逃げる」かといえば、「ナントカ分布」という名前にはあえて無頓着になって、グラフの線の傾きや散布図の点の濃さなど、徹底して「見た目」だけで云々することだ、と(仮に)ココロエております。
そして、統計的な操作(悪意をもってのソレでなく、一種「ピュア」な意味での操作≠統計ソフトの操作とは限らず)として、いかなる手法を選べば妥当なのかも、なかなかわかるものではありません。教員でも、統計は「使うだけ」という立場ですと、なかなか自信がない(人もいる)ようです。
※大学院まで行けば、そうしたことはいくらでもあります。「センセイにきけば何でもわかる」「センセイがいった通りにすればマチガイナイ!」などとは、決して思わずいただきたくございます。
もちろん、しっかり勉強すればいいんだという話ですが、統計の勉強が難しいのは、ありとあらゆる分析法を「ぜんぶ学び倒す」(※)か、あるいはよほど抽象的に、もはや数学だという(ちょっと統計したいだけなのに、えらく本質的な数学に立ち入らざるを得なくなる)両極端のどちらかを究めない限り、自信を持って「このケースではこの手法でいいんだ」と自信を持つことができない、という部分にあります。
※そんなことは現実的ではありません。現実には、分野や業務を絞って、その範囲で「よく使う手法」だけを学び、それだけでも(その業界では)専門家扱いされて重宝されるということです。ここには「RubyでRailsしてます!」([3071])と似た「あやうさ」があって、未知の種類の問題や新しい手法が出てきたら、どうなってしまうんでしょうか。かなり、人や業界による部分がありましょう。
そうした中で、次善の策となるのが「見た目」で云々するということです。データとしては、そこにあるデータがすべてであり、正しく作図すれば、図の中にはデータのすべてが描ききられるわけです。そこを注意深く見る、あるいは何かパラメータを変えながら何通りか描いてみたものを見比べるという作業は、小学校の算数でも、ちょっとがんばればできるくらいの一種プリミティブな作業ですから(モノや絵を見分けるのと似た、生き物として本来持つ力そのものです)、大人として本気で、十分に注意深く行えば、それなりに適切に考察していけましょう。
そして、一種「後付け」で「こういう分析には、この手法がもっともよくあてはまる」ということがわかってから、あるいはカナシイことに、それがわからなかったときは、「…と、しかじか、こういうデータなんですが、どの手法を使えばいいんですかぁ?」といって、小さくなりながら統計の専門家に(企業にあっては、いまはやりのナウでロング型な「(他称)データサイエンティスト!」に=自称するのは恥ずかしそう、の意)聞きに行くというわけでございます。
※そして相談された統計の専門家が何をもって「選択すべき統計手法」を決めているかといえば、その実、やはり線の形や、点の集まりの形や濃さなど「見た目」で(時系列的なデータであれば「動き」も見て)決めている…のではないかなぁ、とうかがわれます。「この流れは『○○囲い』だな」などと、一種「群管理」のような情報処理を一瞬ででき、そしてそれこそ「十分多くの回数」(後述)のシミュレーションをウンウンと(黙ったまま:表情にも出さず)「回す」という、将棋(囲碁もそうでしょうけれども)の人(ただしタイトル保持者に限る)のようでもあります。(日野原センセイの「幅広いプライマリケア医学」[2987]も参照。)
・「(将棋の)囲い」
http://ja.wikipedia.org/wiki/%E5%B0%86%E6%A3%8B%E3%81%AE%E6%88%A6%E6%B3%95%E4%B8%80%E8%A6%A7
・「地下鉄飛車(ちかてつびしゃ)」
http://ja.wikipedia.org/wiki/%E5%9C%B0%E4%B8%8B%E9%89%84%E9%A3%9B%E8%BB%8A
正式な論文ではもっともらしく「ナントカ分布」の「ナントカ分析法」だのと書いてあっても、その実、実質的な研究の段階(お手元のExcelなどでペチペチ、グリッ、それにペッ、などとしている段階)では、「このへんの(データの線や点)がアレ(突出しているなど)だから、こう引っ張って(ナントカパラメータを増やして)薄めて(なだらかにして)」などと、かなりアレな表現で、逆に直感的に云々しているということが、結構あるはずです、たぶん。
そのような『屁理屈』から(ええ、『屁理屈』だということは認めますとも)「図表24」の「見た目」だけを見ますと、何度見ても(ためしに目をこすってみても)、もともと仮定した1種類の分布が形そのまま、3つ並んだだけ、と見えます。
「図表23」については、「(自殺)」においてはおそらく「30分未満の遅れ」が統計に入っていないとみられることについて触れられていません。「(接触等)」については、「0-10分」にも値があり、事業者として全件を把握しようとした結果、全件が入っているのだろうとみられますが、0分、30分、それぞれをピークとする2つの分布が混ざっているようにも見え(※)、また、「100-110」はその実「100分以上」という合計の値が表示されているはずです。(横軸のラベルが不正確です。)
※軽微な接触であれば0分をピークとする分布、重傷となる接触では30分をピークとする分布になるということで、「死亡:重傷:軽傷」の割合も、「重傷:軽傷:無傷」の割合も、ともに「1:29:300」だろうと決めつけられます。(誰もが安心して決めつけることができるとされます。)
・「ハインリッヒの法則」
http://ja.wikipedia.org/wiki/%E3%83%8F%E3%82%A4%E3%83%B3%E3%83%AA%E3%83%83%E3%83%92%E3%81%AE%E6%B3%95%E5%89%87
ヒヤリ・ハットの発生確率は、かなり本質的なものとされていますから、ホームドアが完備されても、完備されたうえでなお起きる事故やヒヤリ・ハットに対して、例外なくあてはまると期待されます。
そして、「1万回ずつ」の試行に意味があるのか、よくわかりません。
最も単純化する場合、「遅延時間」の平均、最小、最大という3つの値について「場合分け」して見積もるだけで十分でしょう。
「1万回」というのは、まあ、「モンテカルロ法」の成り立ち(「カジノで思いついた」などと、冗談交じりでいわれましょう)や、教科書での説明では確かに1万回くらい試行せよということでしょうけれども、既に信頼できるデータ(事業者による統計、しかも全数)が得られている以上、なぜ改めてサイコロをふる必要があるのでしょうか。
この統計と別の統計(例えば他社の統計や、自分たちの実地調査で得られた部分的な観測値、あるいは経験的に知られている傾向など)を組み合わせ、「酔客が絡む事故では遅延時間は短くないが、朝ラッシュ時ほどには遅延時間に対する影響人員が少ない」のは本当かどうか(どのくらい本当らしいか)を検討したり、「事故が起きる日は立て続けに事故が起き、相互に影響し合って遅延時間が極端に増える」と仮定して、ならば「事故の発生確率」でなく「同じ日に複数の事故が起きる確率」を使わなければ正しく推定できないんだ、などと議論したりする、そうしたときに使うのが、モンテカルロ法などの手法(再標本化法)ではないでしょうか。
・「ブートストラップ法」
http://ja.wikipedia.org/wiki/%E3%83%96%E3%83%BC%E3%83%88%E3%82%B9%E3%83%88%E3%83%A9%E3%83%83%E3%83%97%E6%B3%95
※「ナントカ法(手法)」といって、その実、具体的な名前のついた個別の計算法と、「こういうときに何を考えればよいか」を規定してくれる一般化された方法と、いろいろレベル(深さ、段階のようなもの)があるということに、まず気づかなくてはなりません。そして、具体的な計算法には似たようなものがいろいろあり、その中で、なぜ「モンテカルロ法」だけがよいのか(それだけを採用するということは、それ以外を採用できない理由があるということでなくてはいけません:そこを検討していなかったり、できなかったりするのであれば、同種の計算法を軒並み並べて比較するところから始めなければなりません=それをしている先行研究があれば、それを引用すれば済みます)、しっかり説明しましょうと、これまた「朱っ☆(イラッ☆)」とされましょう。たぶん本当です。
●専門家による「確率的感度解析」の検討 私には「モンテカルロ分析」というものが本当にあるのか(定番の分析手法として広く知られているのか、今回と同様のテーマであれば必ずこの手法を使うのかどうか)も含めてわからなかったので、もう少し別の資料も見てみます。
・「観察研究におけるバイアスの感度解析」統計数理 Vol.62 No.1(2014年3月27日)
http://www.ism.ac.jp/editsec/toukei/pdf/62-1-077.pdf
> これらのリスク要因の評価では,そもそもの関連が非常に強いため,高度な統計手法などを利用しなくても,関連を検出することができた.
> しかし,現代の疫学研究では,相対リスクがたかだか2倍にもならない比較的軽微なリスク要因の評価が中心となっており,これらの因果関係は,観察研究では避けることができないバイアスや交絡因子などによるさまざまな系統的な誤差の影響によって,たやすく捻じ曲げられてしまう.
※研究が進んで「微に入り細に入り」した結果、小さすぎるものをネチネチと…いえ、きわめて詳細に検討するようになった=いわば分解能が上がった=ので、これまで「無視できていたレベル」の誤差が「無視できないレベル」に(相対的に)なった、ということです。
※論文において「捻じ曲げられてしまう」と表現するのはよほどのことですが、それだけ「悪意のある論文」または「拙い論文」が通ってしまう状況が現にあることを憂いているということですね。よほどのことです。
> 20世紀後半からの統計理論のめざましい発展によって,複雑で高度な数理モデリングや統計解析手法の利用が可能となったが,これらによって得られるP値・信頼区間はそもそも「系統的な誤差がまったくない」という前提のもとで,ランダムな誤差のみを評価したものである.当然ながら,この仮定が成り立たない場合,これらの手法は妥当な解釈ができない.
※「系統的な誤差」と「ランダムな誤差」:植物の生育のばらつきでいえば、「ある部分だけ建物の影になる時間が長いので生育がよくない」といったものを「系統的」、「まったくの個体差」だけを「ランダム」という、ということですね、わかります。最近の「東京都心の最高気温」には、何か「系統的」なものが重なっているんではないかと疑ってみたくなります。本当でしょうか。その答えはぜひ、気象庁の夏休みイベントにでも行って(子どもに質問させるという形で)説明員に確かめてみてください。(タテマエ上、)「系統的な誤差」は「ありません」と回答されましょうが、本当でしょうか。もっと疑ってみたくなります。
> 近年では,モンテカルロシミュレーションによって,曝露効果の推定量の不確実性を総合的に評価する,数値的な感度解析の方法論が発展しており,モンテカルロ感度解析(Monte-Carlo sensitivity analysis)やモンテカルロリスク評価(Monte-Carlo risk assessment)という名称で,広まりつつある.
> その数理的な枠組みは,モンテカルロシミュレーションに基づく比較的簡便なものであり,(…)
※「比較的簡便」:ですよねぇ。数学のセンセイや機械学習の専門家などが無邪気に「あちらが小学生のおもちゃなら、わたくしどものはiPadみたいなものだ」などといってヒンシュクを買うかもしれません。分野間での「現在の水準」の落差のようなものは、これほど深刻です。本当でしょうか。
> (…上の引用箇所から続く)複数のバイアスの影響を同時に評価する場合にも,複合バイアスモデリング(multiple bias modeling; Greenland, 2005)によるベイズ流の枠組みのもとで,共通のモンテカルロ感度解析の方法を利用した評価が可能である.
> ここでは,喫煙を未測定の交絡因子と考え(略)感度解析を行うことを考える.
> 十分多くの回数(数万〜数十万回)
> ここでは,50,000回のサンプリングを行い,ORDX,k (k=1, 2, ..., 50,000) の分布を求めた.
※うーん…、「サンプリング回数mを50,000とし」「k=1, 2, ..., m」などと書きたい気もします。「..., 50,000」のあたりがムズムズと、落ち着かないです。できれば、m=50000で大丈夫かどうかを簡易にでも示されたく思います。(意味は同じでも、字面上「50,000回のサンプリング」と一種「平たく」書かれてしまいますと、これが鵜呑みにされて「50,000回やれば十分なんですね、わかります!」とか「1万回しかやらなくてもいいのは『小学生まで』だよねぇ」などと、実験や調査の内容やサンプル数(標本数、データ数)、そもそもの測定精度などに由来する有効数字などを踏まえないままいきなり言われてしまわないように、一種「先手」を打っておかなくてはなりません。)
疫学ですが、徹頭徹尾、統計の話ですので、分野を問わず参考になりましょう。ここで、「モンテカルロ感度解析とかいうもの」があるらしい(しかも最近、人気があるらしい)ので、とりあえずソレを使ってみよう! などといっていては、ちょっと(かなり)まずいんだと思っていただければ、とりあえず十分なのではないでしょうか。
※少なくとも、「これからは『モンテカルロ感度解析』の時代だ!(修了後、さっそく業務に活かそうと思います!)」とか、「わが社としても『モンテカルロ感度解析』とかいうものを1つ!」などと(学生や修了者が)いってしまわないように、気を付けていただきたいものです。
そして、この論文、環境と健康について研究するセンターの方と、統計数理研究所のセンセイの共著で、さらに謝辞によれば大学病院の教授と工学部の准教授の助言を受けているということで、統計的操作の妥当性、現場の感覚から言っておかしくないか(臨床での「観測値」と極端にずれていないか)、計算方法がちゃんとしているか(あるいはプログラムは私が書いてあげましょう的な)という、実に「全方位」から検討のなされた、たいへんキッチリとしたものであることがわかります。その秀逸さは「4. おわりに」を読むだけでもヒシヒシと伝わってきますので、中身は読まずとも「おわりに」だけはご一読されることをおすすめします。
※この「おわりに」の内容を、一字一句たりとも「なんとなく読み流す」ことなくきちんと読んで、(自分でここまでの議論や検討を行なうことはたいへんむずかしいですが)少なくとも人に説明できるようになりたい、と思わせてくれます。そういう、一種の「(目指したくなる)お手本」といいましょうか、そうしたことを指して「秀逸」といいたく思います。
・(参考)
http://www.kenbi-navi.jp/nintei/report/
> 「サイエンスで情報を読みとく」講師の竹内文乃さん。
> 特に受講生の注目を集めたのが、研究の進め方や方法によってその成果の“重みが”変わるというエビデンスレベルの解説。「メディアでは、○○博士、○○大学教授などのコメントともに研究成果が紹介されることが多いですが、こうした肩書に惑わされずに冷静・正確に研究成果を判断する際、エビデンスレベルが役に立ちます」と竹内さん。
※「コメントともに」は原文ママですが「コメントとともに」ですね。講義や講師はしっかりしていても、(たった一つの脱字だけで)主催者のレベルに疑問符が付きます。完ぺきを期してください、ぜひ。
・「疫学研究で必要とされる計量生物学」(2012年12月)
http://www.biometrics.gr.jp/future/all/mirai_110_2.pdf
> コストの高い生体試料分析の効率的な実施,各種情報の欠測や測定誤差への対応,希少疾患等に対するデザイン上の工夫など,計量生物学の視点から考慮すべき課題は山積みです.調査票の作成やフォローアップ等に関する各種会議への出席やデータ収集状況の確認に追われつつ,大規模コホート研究で計量生物学がいかに必要とされているかを日々実感しながら研究生活を送っております.
> 数万〜10万人規模の出生コホート研究は,現在世界の多くの地域で計画・実施されているのですが,小児がんに関しては10万規模の例数でも検出力不足になるというのは各国共通の懸案になっています.この問題に対して,各国のデータを個票レベルで併合しようとする国際的な取り組みがI4Cです.
なぜ、この著者が上掲の論文のような関心を持つ(そして秀逸な「おわりに」が書ける)のかが、たいへん立体的にわかります。関わっている調査の規模が大きく、期間も長く、それでもなお集めきれないデータを、いかにして補うか、という面から、総合的に検討する立場にあるということです。(長期的な取り組みが難しい)企業でも、(担当者がすぐに変わる)官公庁でも、なかなかない立場ではないかと思います。
※全体を通して責任を持つという意味で「本格研究」([3091])といえましょう。そして、「読み解く」シリーズの大センパイとして(勝手に)ひそみにならってみようかと思います。恐縮です。
●いま、再び「モンテカルロ分析」 冒頭の実習のレポートに戻りましょう。
きわめて俗には「確率的ナントカ=ちょっとカッコいい」的なものもあります。それをきっかけに勉強しようというのもよいことです。しかし、(統計または数学の専門家でない人が:そのココロは上述の通り)研究や実務ですぐに使おうというのは無謀です。
「モンテカルロ分析」としても、「1万回ずつ試行しました!」といってExcelの上で1万行の「サイコロを振った結果」を並べればいいんだということでなく、(あえて言葉だけで表現しますと)「1万回やると『こう』なります」の『こう』を、数式上、たった1つの項<こう>なり何なりで表現できて、そこは実際には展開したり計算したりしないまま数式の上で変形ができて、「要はしかじかの計算をすればいいんだね」といって、最終的にも(この項に関して)具体的な値は1度も出さず(サイコロなど振らず)、答え(近似した結果:結果はリストや多次元配列であるかもしれません)がバーンと出てくる(あくまで統計を「使うだけ」の立場から見て)というものでありましょう。
もう一つの要点としては(上述のように)、自分たちで測定や観察を行なう場合に、その誤差を考慮して云々する、というのが、再標本化やスムージングと呼ばれる操作の目的ですから、それがない研究においては、そもそも誤差云々まで云々するほうがおかしい(そこまで云々できるほど数値的な意味で厳密な議論ではない=定性的な議論である)、ということもありましょう。(「B/Cの値を金科玉条のごとく」[2938]も参照。)
●センセイはこう書く 実習のレポートの謝辞で挙げられているセンセイ(※)の論文も見てみます。
※この実習の担当教員で、採点や審査もするでしょうに、謝辞されちゃったりしていて、いいんでしょうか、とちょっとだけ心配されます。
・岩本康志ら「医療・介護保険の積立方式への移行に関する確率シミュレーション分析」(2012年9月)
http://www.jbaudit.go.jp/effort/study/mag/pdf/j46d02.pdf
> 将来の医療費または介護費用は,上記の想定による確定的変動部分(Mt)と確率的変動部分(at)の積になるとし,基本ケースは岩本・福井と同じく,atの確率過程は,
> (数式)
> にしたがい,eは平均0,分散0.0204の正規分布にしたがうと想定した。
> パラメータを推定するにあたっては,『国民医療費』(厚生労働省)の医療費増加率の要因分解(人口増,価格変化,人口の高齢化,その他)のなかのその他の要因による増加率から1983年から2007年までの水準の変数を作成し,そこからトレンドを除去したものをatの定常値からの乖離(at−1)として回帰分析をおこなった。
※人口動態と賃金(≒物価)は明示的に扱うので、その外の要因を一式(「外一式」とは異なります=「外」だけです)、ブラックボックスのまま加味しましょうということで、適切な操作になっている…とは思いますが、単に私が煙に巻かれているだけかもしれません。
> 確率シミュレーションでは,医療費と介護費用それぞれについて,シミュレーション期間中の毎期のショック(et)にあたる系列を正規分布に基づく乱数発生により10,000 通り生成し,2節で説明した確率過程に基づいて計算した確率的変動系列(at)を毎年度の確定的医療費あるいは介護費用に乗じることで予測分布を生成している。
> 感度分析では,3節でのべた基本ケースでの確率シミュレーション以外に,医療費・介護費用の確率過程について1通り,金利と成長率の差の確率過程について2通りの異なる想定を組み合わせ,基本ケースを含め合計6通りの確率シミュレーションをおこなった。
図を見ますと、しっかりシナリオを練って「場合分け」すれば、それで十分(※1)で、ことさらに「感度分析」だ、「1万回」だ、とはいわずとも十分なのではないかと感じさせられます。(誰もが感じるのではないでしょうか、たぶん。)もっとも、実習のレポートとは違って、こちらの論文の本文中には(※2)「モンテカルロ法」の「モ」の字も出てきませんから、その点では安心して読める論文になっているかと思います。
※1 線の形が場合によらず同じで、違うのは(縦軸で見ての)高低だけ(横軸方向に通しで見ても、線と線の高低の逆転がない)、ということから、そのように感じられます。何かもっと動的に、連鎖的に変動するモデルを入れるのでない限り、どうにもこうにも「鉛筆でノコギリの歯の形をなぞりました」的な何か(なぞるまでもなく歯の形が明らかである⇔何回なぞっても同じ形しか出てこない)しか感じられません。
※2 参考文献では「モンテカルロシミュレーション」をタイトルに含む2003年の論文が挙げられています。ただし、同じジャーナルの掲載論文で、限りなく「内輪感」があります。(あくまで印象は個人です。)
●経済(社会科学)と物理(自然科学) 以下は完全なる余談でありますが、そもそも経済学という立場が、人によってとらえ方がばらけているという微妙な位置(ただし時間軸上での位置:歴史上の特筆すべき時点のようなものをいま迎えている)にありましょう。
ちょうど先日、こんな書評が出ていて、え゛ー、と絶句していたところでありました。
・朝日新聞「(書評)『善と悪の経済学』 トーマス・セドラチェク〈著〉」(2015年8月2日)
http://www.asahi.com/articles/DA3S11894370.html
> 経済学は、自然科学と人文科学のどちらに近いのか。(略)現代経済学は高度に数学化され、大量の統計を扱う実証科学として発展してきた。
> しかし、経済学がどんなに自然科学に近づこうとも、それは完全に自然科学にはなれないし、またそうなるべきではない、と主張するのが本書である。人間は、原子のように自然法則にしたがって動くわけではない。天体の運行に関する予測と異なって、経済予測がほとんど当たらないのは、人間行動の複雑性や、その背後にある動機の多様性のためだ。残念ながら経済モデルは、これらすべてを記述し尽くすことに成功していない。
> ここから道は二つに分かれる。一つは、人間の複雑な行為動機をさらに詳細に分析し、現実をよりよく説明できる理論を再構築する道である。もう一つは本書の立場だ。
前者を目指さずして、どこが科学ですか、とイッカツされましょう(そこは迷ったり悩んだりするところですらない、の意)。経済学のセンセイがまともに書評するには値しない本なのではないかと心配されます。
・文部科学省「学術研究体制特別委員会 人文・社会科学研究に関するワーキング・グループ(第3回) 議事録」(2000年9月27日)
http://www.mext.go.jp/b_menu/shingi/old_gijyutu/gakujyutu_index/bunkabukai/bukaiiinkai/gijiroku/1314807.htm
> 自然科学の側からは、もっと社会的発言をすべきである。ただ、社会科学の研究者に自然科学の意味合いを含んだ発言が少なすぎるのも困る。
> 政策提言については、傍観者的な研究と現実者的な研究に基づくものがある。傍観者的な研究は、制度や政策について分析するのものである。現実者的な研究は、データに基づいて研究をするものである。日本の場合は、データがないために現実的な研究に基づく政策提言ができない。
> 経済学の95%は過去の解析である。いろいろなデータが蓄積されているが、それらは良くて3年前のものまでである。それまでどうだったかは説明できるが、自然科学者が望まれるのは、われわれに対して将来に向かって社会に働きかけてほしいということである。その場合、過去の知見の延長でしか話ができない。われわれが直接社会に向かって働きかけるということは、学問から逸脱した世界になると思う。
> 家族社会学の研究者は、「家族の起源」は科学では扱えない問題であるといって考えようともしなかった。自然科学者はサル、チンパンジーから類推して人間の家族の起源を自由に議論した。その議論が正確、不正確とかではなく、これこそが科学であるという立場であった。そのとき自然科学者が考える科学と、人文・社会科学者が考える科学が全く違うと思い知った。
> 研究者は社会の外にいるのであろうか。(略)時代の中で仕事をしないということはあり得ない。「役に立たねばならないからやる」というようなメッセージを専門家が出すのはよくないのではないか。われわれも社会の中にいて、どうしても問題が浮かんでくるから、それに対して自分のプロフェッショナルな力を使っていくという考えで対応していくべきではないか。
全般に、「自然科学」とされる立場の発言のほうが、きちんと、(日ごろからも、その場でも)一から考えて発言されている感がある(ために、新しい問題や未知の問題にも対応できる柔軟さがあるとみられる)のに対し、「人文科学」「社会科学」とされる側は、自分では考えずに発言している感があり(手持ちの材料がなくなると黙ってしまう感があり)ます。(偏見ですが実感です。)
ここに出てくる経済学の人(委員)の慎重さには、ちょっと好感が持てます。限界を踏まえつつベストを尽くす、すなわち、何でもできると過信はせず、できることは何もない(≒自分の仕事ではない)と投げ出すこともなく、というところでうまくバランスをとるということは、たいへんむずかしいことです。
・経済産業研究所「中島厚志のフェローに聞く 第3回「理学博士がみる経済学の可能性とは」」(2012年12月21日)
http://www.rieti.go.jp/jp/special/af/i03.html
> 「自己組織化現象」という現象として捉えられていますが、個々の主体は、全体がこうなるようにと思って行動しているわけではなく、個々の行動原理に従って別々に行動しているのに、相互作用する過程で、全体として普遍的な現象が現れることが社会では頻繁に生じています。
> このようなことから、経済学者がその本質を知ろうとしたときに、物理学や自然科学に興味を持ち、複雑系を解析する手法が、自然科学と社会科学の両方で共通する言語として出てきたのかと思います。経済学者と物理学者のモデルのつくり方は随分違いますが、説明したい現象としては共通のものができたということだと思います。
> 実証研究をするには、物理学では、大規模な実験などをするため、時間もお金もかかり、たくさんの実験はできませんが、経済学では、情報化の中で何もしなくても自然にデータがたくさん集まってくる状況があります。人間の社会活動の履歴が、自然にログデータとしてどんどん蓄積されて、実証研究に用いることが出来るのです。
> 物理学者はそこに注目しました。物理学では、実験が大掛かりなので、実験と理論の両方に取り組むことは難しいのですが、経済学では、理論と実験の両方ができます。私自身も、経済学を始める過程で、そこに興味を持ちました。
> 誰も災害が起きるとは分かりませんから、それを見越して行動しているわけではなくて、突然ショックがあって、その段階でみんなどうしようかと考えて、取引先を変えるなど、いろいろな行動をします。そうすると、ピュアな行動が見られるということがあります。災害など、いろいろな外的なショックの後に、もっと学問が進んでいくことがあります。
> 昔は、経済学では、思想に近いところが結構ありましたが、データを見て、理論を検証していこうというように、理系に少しずつ近くなってきていると思います。
しっかり科学ではないですか。安心です。
|