・目次をきちんと読み解いてから読む【帯なし】 ・「めのこ」とはにわ ・だっ…だれかっ……編集者を呼べっ ・うっかり「ベイズ推定」が読み解かれる(談) ・諸君が愛してやまない多変量解析とはその程度なのかね(仮) ・2019年度「(仮称)応用統計概論」の教科書を書くつもりで既存の教科書を遠目に眺める(談)
(約45000字)
[3581]からの続きで、分野としては環境心理学、内容としては多変量解析の話題です(※)。「10年後に読む」としては[3494],[3495]の続きです。
※ですから、あなたが専攻する(した)分野が何であれ、多変量解析の話題としてお役に立てればと思うわけです。
この技報堂出版「よりよい環境創造のための環境心理調査手法入門」をいつ買ったかなぁ…と思ったら、購入日がふせんで貼り付けてあるなどの(大巾に中略)じぶんGJ!(違)「2005年1月×日」だということです。それでも「1版1刷」なんですよ。(棒読み)
※買ってから(実質的に)読む(ことができるようになる)までが概ね10年程度ということで「10年後に読む」と題しています。実際には、買ったのが刊行から5年遅れだということであります。(恐縮です。)このようなタイムラグは無数にあるのですよ。だって、大学には毎年、まったく新しく新入生が入ってくるんですよ!! …いやー、それを新入生とも入学者ともいうんですけど。「大学!」といっただけで、じぶんの入学と卒業しか考えないひとって、いますよねぇ。(棒読み)
※2000年5月に出版された本にむかって2017年12月現在の視点でああだこうだというのはアレですって? とんでもない。先述の通り出版社で「在庫僅少」、まだ新しく買える本ですから、いわば「現行の教科書」なんです。改訂版や増補版が出るでもなく漫然と在庫され、教科書扱いされ続けているのですから(あるいはほかの教科書や論文からコンスタントに参照されてきているのであれば、もはや「原典」扱いされているとみなせるということでもあり)、現在の視点で何かいおうというのは成り立つとの認識にございます。
・「GJ」は英語圏のBBSが発祥だと思うのだけれど(中略)全日空「○○さん、GJです!」2004年10月のイメージです
https://www.ana.co.jp/ana-info/ana/csr/report/pdf2008/CSR2008_P34-35.pdf
> ANAでは2004年10月より、社員に毎月渡される賃金明細書の表紙にお客様からいただいたお褒めやお礼の言葉を掲載しています。
> フロントラインでは、互いの仕事の良いところを見つけたら、それをカードに記入して本人に手渡す「Good Job Card」を推進しています。
・「じぶん銀行」(2008年6月17日)のイメージです
https://ja.wikipedia.org/wiki/%E3%81%98%E3%81%B6%E3%82%93%E9%8A%80%E8%A1%8C
> 「KDDI THE CARD」の提携関係を譲受し「auじぶんcard」に転換。
3DCGみたいなのでプラカードを掲げて練り歩きながら、ザ・「○○(※ここにブランド名称等が入ります)・ザ・カード」みたいなのーっ!!(違)
・あなたにとってのザ・「○○・ザ・カード!」はどれですか?(違)
https://upload.wikimedia.org/wikipedia/en/7/77/Sb16waveffects.jpg
http://advdownload.advantech.com/productfile/PIS/PCI-1604L/Product%20-%20Photo(Main)/PCI-1604L_3D%2020161207134321.jpg
https://images-fe.ssl-images-amazon.com/images/I/41zV7q9I6WL._SL500_AC_SS350_.jpg
https://c.76.my/Malaysia/dell-perc-h700-k883j-512mb-sas2108-6gb-s-sas-raid-controller-pci-e-bee-1704-21-bee@1.jpg
http://fururingo.cocolog-nifty.com/blog/images/2012/09/02/2_6.jpg
http://fururingo.cocolog-nifty.com/blog/2012/09/fm-xfm-7-1459.html
> FM-Xは、1983年12月発売の富士通で唯一のMSXパソコンであります。統一規格でありながら他社との差別化を図るということだったのでしょうか、FM-7との接続ができる仕様となっておりました。
> 両機種を接続するためのオプションは『FM-7インターフェース』。そのパッケージ内容はFM-7用拡張カード、FM-X側カートリッジ、拡張F-BASIC1.0(カセットテープ)、RGBケーブル、マニュアル2冊となっております。
> FM-7につないだFM-XをZ80カードの代用として使用することは残念ながらできません。
> FM-7につないだFM-XをZ80カードの代用として使用することは残念ながらできません。
えーっ…。
・[3581]
> > 調査に際して明確な目的意識をもつことの重要性を強調し,体系的であるよりも,マニュアルとしての使い勝手のよさを優先させて調査目的別の構成とした.
> かえって、ぜんぜんわからん(=当時)との…げふ。
本書の構成によって(本来わかるものが)わからなくなったのでなく、そもそもわたしがわからなかった(基礎がなかった)ということを(いまの)わたしのほうから補足させて…うわぁ『わたしのほうから補足させて』みたいなのと『いまのわたし』みたいなのからなる『ダブルパンチ』みたいなのキターッ!(棒読み)
・[3518]
> 「文字面に従った思考」という専門用語っぽいのが、素人(=わたし)にはわからないんですけども、アレですか、講演者が使った用語や名称でなく、じぶんが知っている用語や名称にぜんぶ『訂正』しないと気が済まない感じのひとですか世紀末バニラ大納言ですかスナック菓子由来の油脂のほうなどベタベタさせながらJRマークの印刷がズレていたら返品するひとですかっ(違)。発達の途中にあるという意味では、そういうひと、結構いるかもですよ。
・[3500]
> へー…本当に初めてかどうかを調べ尽くしたと宣言できるのもすごいことです。(棒読み)
> 同じかたのその後の集大成と見受けられる著書のほうなど参照してみます。
> おおー(略)ここまで総合されるのに9年ほどかかってですね(略)さすがです。そして、それでもなお「試みる」との謙虚さはスバラシイなぁ。(感想です。)
9年かかって謙虚さを獲得するとはこういうことなんですよ。ええ。最初は「素」で「謙虚じゃない」んですよ&これはしかたないことなんですよ。(※あくまで感想です。)
・教えて!goo「主成分分析の結果から一次元構造が確認される」の用例です(2010年5月5日)
https://oshiete.goo.ne.jp/qa/5874524.html
> 今扱っている論文に「主成分分析の結果から一次元構造が確認される」という言葉が何度か出てきます。
> 何となく研究の正当性を主張するのに使っているというのは分かるのですが、詳しい意味がよく分かりません。
> 結局一次元構造とは何なのでしょうか?
・推定(※独自に推定)
http://www.takamatsu-u.ac.jp/library/06_gakunaisyupan/kiyo/no24/24_01-09_tsubota.pdf
> 平成6年1月31日
平成6年は1994年です。2010年5月5日に焦ってお読みになるというのは、きっとフレッシュマン(あるいは卒論のためのゼミが4年生の4月から始まって最初の当たり番ですとか)ですね、わかります。そこでは1994年くらいのを読ませたり、あるいはじぶんで選んだりするのだと想像されましょう。おぬしういういしいですのう@このこのぅ!(※表現は演出です。)
> (3ページ)
> 主成分分析を行った(表1)。そして,第1主成分に,.45以上の負荷を示している4項目の合計得点を,**性の得点とした。
> 第1主成分
> .826
> .809
> .745
> .476
> .007
> 分散説明率 42.5%
> (4ページ)
> 因子分析(主因子法,PROMAX解)を実施した。
> 第1因子
> 第2因子
> Carmines&Ziller(1979)の結果とほぼ同じ結果であり,彼らにならって第1因子を****の因子,第2因子を****の因子と命名した。また,彼らはこのような2因子に分類されたのは,**によって**によって生じたためであり,この2因子それぞれと,**性,**態度などの外的変数との相関係数が非常に類似していることから,この2因子は単一の次元を測定していると解釈している。
現在の読者は、どのように読むでしょうか。(棒読み)
> nは,それぞれ,283,80,203である。
> (6ページ)
> Franzoi&Reddish(1980)では,この尺度の構造を検討し,尺度の一次元性を明らかにしている。本研究では,主成分分析により,その一次元性を検討したが,5項目の内,1項目は除外される結果となった。
紀要なので追試みたいな内容だけで1報というのもあって、それがまたそのまま教材にできるという有用性はありそうなのですが、うーん。これは原典をじぶんで読め、同じ計算をじぶんでもやってみなはれということを促している文章ではないかなぁ。(※あくまで推察です。)
★目次をきちんと読み解いてから読む【帯なし】
技報堂出版です。…いえ、この内容ですから(著者らがじぶんたちで大まかな編集もこなした本ですから)技報堂出版から出たかどうか(出版社の編集者が活躍したかどうか)はあまり重要な情報ではないんですけれども、しかし、結果として技報堂出版から出ている(技報堂出版から出た本として買うことができる)という、このこと自体はひとつの大きな情報ではあるんですよね。…えーっ。(※表現は演出です。)
[3494]の図書では「帯あり」でしたが、本書は「帯なし」でございます。販路によってはついてくるのかはわかりません。「帯」をおつけして『はん促!』するような図書ではないということでもありましょう。本当でしょうか。
※Google画像検索で検索する限りは「帯なし」に思えます。もっと本当でしょうか。
あらかじめわたしたち、2017年12月の空気をおなかいっぱい吸っておくことにしましょう。あわせて『空気を詰めた瓶!』みたいなのもつくっておくとよいでしょう。
・八重洲ブックセンター(鹿島建設グループ)では3階と7階をいったりきたり(※あくまでイメージです。)
http://www.yaesu-book.co.jp/floors/f3/
http://www.yaesu-book.co.jp/floors/f7/
http://www.yaesu-book.co.jp/images/yaesu-bg-c.jpg
http://www.yaesu-book.co.jp/images/yaesu-bg-b.jpg
> 自然科学 農林水産業 電気・機械・化学工業 建築・土木 コンピューター
> 建築工学 ブルーバックス 情報工学 安全衛生 科学一般
> 心理 専門医学・看護 福祉・介護 教育 洋書・洋雑誌
> 薬学
> コミック ライトノベル 美術 写真集 映画・演劇・音楽 書道・茶道・華道 八重洲ギャラリー
おっと、そっちは8階だっぜ★。(※演出は表現の一部です。)
> 理工学 ベストセラー 2017年11月26日〜2017年12月2日
> 01. 天文年鑑 2018年版 天文年鑑編集委員会 (編) 誠文堂新光社
> 02. 図解「なぜ?」「なに?」ナリアと学ぶ食品工場マニュアル 源竜弥 日本食糧新聞社
> ナビゲーターを務めるのは、人の役に立つ菌に生まれ変わりたいと願うカビ菌の「ナリアちゃん」。
> 個性的なキャラクターと一緒に、食品工場で守らなくてはならないルールやその理由、根拠を、パンチの効いたイラストを見ながら楽しく分かりやすく学べます。
> 06. 深層学習 岡谷貴之 講談社
> 09. マンガでわかるベイズ統計学 高橋信 他 オーム社
> 18. 公共建築工事積算基準 平成29年版 建築コスト管理システム研究所 (編) 大成出版社 8300円+税
うーん。八重洲ブックセンター(鹿島建設グループ)「理工学 ベストセラー」の1位(…『ベストの1位!』っ)は天文年鑑っ!! 11月末ですからねぇ。
> コミック・ライトノベル ベストセラー 2017年11月26日〜2017年12月2日
> 01. 空母いぶき(8) かわぐちかいじ 小学館
> 02. 宇宙兄弟(32) 小山宙哉 講談社
> 06. この素晴らしい世界に祝福を!(13) 暁なつめ KADOKAWA 2017/12/1
> 08. とある科学の超電磁砲(13) 冬川基/鎌池和馬 (原作) KADOKAWA 2017/11/27
八重洲ブックセンター(鹿島建設グループ)ですからねぇ…八重洲ブックセンター(鹿島建設グループ)で買うんですかっ!!(棒読み)…さて、『2017年11月26日〜2017年12月2日の空気を詰めた瓶!』みたいなのはこれでいいかしら。(※表現は演出です。)
Amazonでは、うーん。見なかったことにしよう! …みたいなカスタマーレビューが1件きりでございます。Googleで検索すると、槙センセイによる書評(※)が3番目に出てきます。
・槙センセイ
http://www.jissen.ac.jp/kankyo/lab-maki/maki/book1/mbook04.html
> ドクターの頃から関わって、10年近くかかってやっとでた本。
…えーっ。
> 前半は秀逸。
えーっ!! いったいいつ書かれた書評(※)なんですか。日付が書いてなくて困ります。(既に用意された)様式を満たせるけれどもじぶんでは(じぶんで使うための&じぶんしか使わない)様式をつくれないひとなんですかっ。(棒読み)
ここでいう「前半」とは、実質的に「第2章」を指していると見受けますが、うーん。(このあと見ていくように)「秀逸」とはとてもいえない&(いつの)誰にとって「秀逸」ということなのか(2000年代前半において実用的に役立つという意味でなら否定されないでしょう)&そもそも関係者が「秀逸」といいきってはいけないよ。(※見解です。)
※これは書評なのか:槙センセイはまぎれもなく本件専門家であり、本書に言及するということは即座に書評とみなされうるという理解であります。そのようにみなされる本件記事の内容や分量がこれだけ…ということ自体が書評なんだと、こういうわけです。(※かなり強弁してますすみませんすみません。)
・関係者付近
http://naoyuki-oi.la.coocan.jp/books/booklist.html
> 使っている本ばかりなので、貸し出しは困難です。購入するか図書館でさがしてください。
あなた(もともとは)貸し出すつもりで紹介してたんですか。ふーん。ほー。へー…
> いわゆる入門書。卒論や修論に取り組もうとする学生諸君や、実務に環境心理的な手法を使ってみようとする設計者、ファシリティー・マネージャーといった方々に読んでいただくことを目指して書かれています。
あなた教材の設計など学んでいない感じではなくって? あらあら、まあまあ! 「入門書」と自称しさえすれば入門書だと思ってませんこと? …えっ、違うんですかッ!!(※表現は演出であり、あくまで個人の感想だというひともいます!)
> 「図解事典 建築のしくみ」
> 建築の初学者にも理解しやすいように,建築の基本的なしくみを図解することによって,複雑に成り立っている建築のあり方を丁寧に解き起こした本です。157のキーワードが5つのカテゴリーに分類されて各2ページで解説されています。
こちらのほうが明確に「入門」に向く構成と内容になっており、書名として「入門」とは自称せずとも、機能的には「入門書」であるとわかります。…こういうのを「入門書(=初学者が実際に学習に役立てることが自力でできる本)」というのですよ。(※見解です。)
・[3330]
> 解説と事典が1つになって登場だっ。(およそ198円くらいで売られてさえいれば)どの本でもいいですから、体裁や文体などお好みのもの(しっくりくるもの)を選べばいいんです。
これはあくまで「Excel」ですよ。「Excel」だから本が(新古書店で)198円にまでなって「普及」するのですよ。遊び半分(※ふざけるという意味ではありません、まじめですよ&しかし「切実感」がない、の意)でも勉強できてしまう。これだね。我々むずかしい顔をしながら3,600円(+税)むずかしい本を読んでるじぶんかっけー(違)3,600円もかけたのだから勉強せねばなるまいて。そこまではいいんですけど、そうやって勉強したじぶん(たち)はえらい(※本流である)けれども遊び半分みたいに勉強しようとする輩はケシカラン(※邪道である)みたいにまでなっちゃうと、ちょっと違うんですよね。(※見解です。)
・(再掲)「よりよい環境創造のための環境心理調査手法入門」技報堂出版(2000年5月)
http://gihodobooks.jp/book/2444-2.html
目次にある「<コラム>」について、執筆者(所属)を補います。
> <コラム>構築法と構造同定[(竹中工務店技術研究所企画部)]
> <コラム>パーソナル・コンストラクト理論[(日産自動車商品企画本部商品戦略室)]
> <コラム>尺度水準[小島隆矢]
> <コラム>SD法の設定のあれこれ[宗方淳・小島隆矢]
> <コラム>統計量はやわかり[小島隆矢]
> <コラム>因子分析の用途の今昔[小島隆矢]
> <コラム>リサーチを役立たせる秘訣[朝野熙彦]
> <コラム>企画・計画時に,設計者に必要な情報:FMの視点から[(大成建設営業推進本部FM推進部FM計画室)]
> <コラム>当たり前品質と魅力的品質[小島隆矢]
> <コラム>グラフィカルモデリングとは[小島隆矢]
> <コラム>説得的コミュニケーション[小島隆矢]
> <コラム>ワーディングに命をかける[久野覚]
> <コラム>フィッシャーの3原則:実験計画法のこころ[小島隆矢]
> <コラム>物理量の探索[中村芳樹]
> <コラム>ジャックナイフ:結果の安定性を検証する[(竹中工務店技術研究所研究開発部)]
> <コラム>POEを実施して[(北海道電力札幌支店総務部建築グループ)]
> <コラム>POEM−O:オフィスのための居住後評価システム[大井尚行]
> <コラム>自動車開発における事前評価[(日産自動車商品企画本部商品戦略室)]
わたしたちFM(ファシリティマネジメント)してまぁーす! わあぃステキなFMでしたっ&次のかたどうぞ♡(⇒「省察」[3358])みたいな(略)あえていおう! なにもいわないでおこうと!!(棒読み)「「読者より格下!」のマスコットキャラ」([3174])も参照いただきながら、営業というのはだなぁ(諸事情により略)営業を成功させるために演じきるキャラみたいなのになりきっていないといけなくて、そのキャラでは技報や論文は書けないよね。んだんだ。営業の部署に所属している間は営業だけしてなさいってこった。(営業の経験も踏まえての)技報を書くためには、まずほかの部署に異動して『キャラ変!』してからですよね。(※見解です。)
※POEM-O:Post-Occupancy Evaluation Method-Office(ハイフンは原文ママ)。POE:建物入居後評価(原文ママ)。「Eカード法」:「Evaluation(評価)の頭文字に由来する」との記述あり。
> (120ページ)
> 施設の利用者人数が数百人・数千人と多人数を対象にする場合は,SD法などで統計的な評価分析は効果があるが,営業所といった所員が20名以下の小さなオフィスの場合はどうであろう.(略)対象人数が少ないほど評点の平均など統計的分析値の意味は薄れてしまう.
『だが〜どうであろう』構文みたいなのキターッ!! あなたはアツアツの鮭のグラタンを食べたいとする。だがどうだろう。…じゃなくて、ここで「(1)はじめに」が唐突に終わり、いきなり「(2)Eカード法とは」といって「「Eカード法」は,(略)といった定性的調査を実施できる手法として開発した.本手法は,(略)を使って行う.」という文から始まるんですよ。「(2)」には「Eカード法は〜である.」という定義の文もないんですよ。本来、「(1)」の最後の段落で「このため「Eカード法」を用いることにする.」と書かなくてはならないのに、書いてないんですよ。(=理解に必要な事実はすべて羅列されているけれども文章としては説明できたことになっていないのですよ。)あなたは既にわかっているからいいけど、読者はこれからわかろうとして読むのですぜ。…なんだかなぁ。
> (128ページ)
> 「寝た子」問題
そして御社の取り組みについて熱心にレポートいただいたところで『最後の最後』、ここで「「寝た子」問題」みたいなのを書いちゃいますかっ(※そこを議論するのは分野が違うんです&議論そのものとしても技報の域を超えるんです&議論を紹介するというほどあなたが詳しいわけでもない、の意)。なお、本報の途中に挿入された形となっている「<コラム>POEを実施して」は、まるごと「お客さまの声」を転載したものとなっています。…えーっ。
※転載するのはいいんですけど&たぶん報告者より年上と思われるお客さまさすがいいこというなぁ的な「声」なんですけど、それに対するじぶんの見解を何一つ述べていないんですよ。それを「<コラム>」とはいわないよね、の意。
・…なんとNHK「だがどうだろう。」みたいなやつ!(12月4日)
https://www3.nhk.or.jp/news/business_tokushu/2017_1204.html
> 夕食用に安い輸入牛肉を買おうとスーパーにいくあなたを想像してください。売り場に着くと、棚には3つの商品が。下の棚には100グラム300円のオーストラリア産、真ん中には800円の国産牛、そしていちばん上には2000円の高級黒毛和牛です。
> 買おうと思っていたのは下の輸入牛肉のはずなのに、上の棚の高級黒毛和牛が目に入り、迷ったあげく…なぜか真ん中の棚にあった予算オーバーの国産牛を買ってしまった経験ってありませんか?
> コツコツと貯金してきたBさん。同じ3万円なはずなのに想定外の臨時収入が、Cさんの行動を変えてしまいました。
やーい、りー・んー・じ…、(ふーっ)しゅー・うー・にゅー・うーっ(…ぜぇぜぇ)&このこのぅ!(=おごってくれよぅ&アハハハハ、の意。「臨時収入」と発音するのにここまで肺活量が要るとは思ってもみなかったよ。…えーっ。)
> ナッジ=nudgeとは、英語で注意や合図のために人の脇腹をひじでやさしく押したり、軽くつついたりするという意味です。「おいおい、それでいいの?」とひじでつっつく、そんなイメージが行動経済学なのです。
・(再掲)北野浩章「レポートを書く際に最低知っておいてほしいこと」
http://www.nihongo.aichi-edu.ac.jp/~kitano/writing.html
https://web.archive.org/web/20161115105735/http://www.nihongo.aichi-edu.ac.jp/~kitano/writing.html
> 以下の例は実際に学生が書いた表現をもとに作成した。雑誌などではよく目にしそうである。
> 「この二つはどこがどのように違うのだろうか。そこで私が考えた相違点はこうだ。」
> 「次の例を見て気になる点があるかもしれない。そう、この多くの**の中で、**の混じったものがいくらかあるのだ。」
> 「***によって伝えられるのは、その**や**など、***には真似できない、**らしさ。***とは、***’だけでは伝わらない**味をあらわす部分なのだ。」
・(先述)
> にょほほほっ! 「こうだ。」キターっ。「そう、〜のだ。」キターっ。「だけでは伝わらない(お伝えしきれなくて残念です)」キターっ。高まってまいりました! ええ、高まってまいりましたとも。雑誌の売り上げは減っているはずなのに雑誌のような文体を学生が使うのは、どういうソレなんでしょうか。いや〜、雑誌のような文体なんて、そんなの、雑誌がなくても容易に『再発明!』されるんですよぉ。やだなぁ! 電話1本、雑誌のもと! さあさあ電話加入権を質屋で仕入れさえすればキミもきょうからひとり出版社だっ。廃業した出版社が手放した電話番号のほうなど狙い目ですぞ! …えっ。(なにかがおかしいよ@ゼッタイおかしいよっ。)
(たぶん年上の)「お客さま」がおっしゃった「いい話®」みたいなの(仮)に、じぶんが何かコメントしようだなんて、という引け目みたいなのもあるかもですけど、技報ならコメントしないといけないんですよ。そのときどうやってコメントしようかといって、下書きの段階では「語りかけ口調!」みたいなのでいいんですよ。上述の「(先述)」だって、ちょっと整えるだけで「雑誌の売り上げは減っているとされる。それにもかかわらず学生たちが『雑誌のような文体』を獲得するのはなぜだろうか。その昔、「電話さえあれば1人で出版社ができる」といわれた。作家には原稿を催促し、印刷所には印刷を催促する。極端には、じぶんでは文章が書けなくても本や雑誌を世に送り出すことができてしまうのである。そのような出版社でひとやま当てたというだけで、いわゆる「知識人」の仲間入りをしたかのようにふるまう輩が闊歩しているという状況を、かの有名な火災予防運動の標語になぞらえて憂いていたのである。それはともかく、催促される側の作家にしても、まだ新人かもしれない。印刷所の職人は原稿の通りに印刷するだけだ。およそ雑誌というものはその程度のものだという共通理解があった。『雑誌のような文体』は、雑誌を読むことで獲得されるのではなく、自然発生的に生じるものなのだといえよう。」みたいな文章になるんですよ。…その発想はなかった!(棒読み)
★「めのこ」とはにわ
技報堂出版に戻ります。
> (131ページ)
> 弘法筆を選ぶ
> 今日なお,古典的調査手法を,その手法の本来の狙いとは異なった場面に平然と適用した調査や,実験装置やデータ解析に最新の技術を取り入れていながら,肝心の調査目的に対しては,さほど有意義な結果を導き出せずに終わってしまっている調査が見受けられる.これらの調査には,実際に何か問題意識が背景にあって計画されたというよりは,論文にしやすい,あるいは新しい技術(アイデア)を人に先駆けて使ってみたいといった理由から,手法が先に決まり,調査目的はあとから設定され,最終的に目的と手法との間に不整合が生じてしまったというケースが少なくないようである.
> (略)一連の調査手法を組みなおすことが大切である.(略)手法ありきではなく,目的ありきの調査をすることが大切であることを,あらためて強調しておきたい.
この「第6章」は3ページの長さで、分担が示されているわけでもないのですが、「WG!」の主査である日産自動車氏と、同「WGメンバー」であるT工務店氏の連名となってございます。
そして、うーん。
・[3581]
> コラムみたいなのだけで1冊ちゃんと書いてよみたいなもどかしさのある…げふ。(※現在の感想です。)
つまるところ小島氏が1冊…げふ…という意味では、本書の2.3節「データ分析法についての基礎知識」(※30ページから51ページまでぜんぶよ:137ページの本書中、15.3%ですのよ)が相当します。…うーん。そして36・37ページに「愛読者カード(切手をおはり下さい)」を挟んだまま放りだした(中略)じぶんGJ!(違)
※上述のように(そのときのわたしに)「基礎がない」ということが2.3節でわかったので、本書はあきらめて別の勉強に向かったのですよ、の意。
> (36ページ)
> 図2.3.8 多次元的な外れ値
> (37ページ)
> 図2.3.9 横軸の変数を対数変換
> 質的変数におけるカテゴリーの整理
2.3.4項には、2.3.4項のみだと明示されての参考文献があるのですけれど、2.3.1から2.3.3までについては参考文献なしで小島氏が『書き下ろし!』なさっているという形式になってございます。…ハハー! 『歩く教科書!(こうえんもできるよ☆わかりやすいとひょーばんだよ)』小島氏が書いたので正確です!! …そういうことでよかったんですかねぇ。(棒読み)
※内容に疑義があるというのでなく、形式を満たしていない、という指摘にございます。小島氏の講演や講義を聞いたことがあるわけではないですが、文章を読む限りおぬし、かなりの世話焼きタイプですな&あれもこれもと芋づる式にその場で補足の上に補足を重ねていって時間切れになるみたいなひとっぽいですな…ギクッ。ひとのことはいえまいて〜。(棒読み)
> 質的変数におけるカテゴリーの整理
> (全略)意味の上で似ているカテゴリーの統合や,5段階の順序尺度を3段階に統合するといった場合は問題ないが,分析を進めつつよく似たふるまいをするカテゴリーを統合するといった技法が要求されることもある.
なるほど主成分分析ですね、主成分分析ですねっ…と、あくまで『いまのわたし!』は思うところ(…『思うところ』!)ですが、以降、「統計的推論入門」「多変量解析入門」といって、うーん。48ページに進むまで主成分分析の本質には入っていかないのですよ。(『初見!』の)わたしたち、『「よく似たふるまいをするカテゴリーを統合するといった技法」が「主成分分析」なんですね、わかります!』のほうなど、おそらくできまいて。(※見解です。)
> (48ページ)
> (6)因子分析・主成分分析
> ここまでに,重回帰分析,分散分析,パス解析と,名称こそいろいろ出てきたが,いずれも因果関係を分析するための手法について解説してきた.ここでは,40ページで述べた多変量解析の用途の2「相関の高い変数をまとめて総合指標化する」ための手法について解説する.因果関係の分析における「多重共線性」という大問題に対処するためにも,相関の高い変数を整理・統合して,互いに低相関の少数個の総合指標とする方法は,ぜひとも習得してもらいたい.
> <ノート>多重共線性と「向き合う」方法
(あくまでいまとなっては)…なんだかなぁ。「多重共線性」って、そんなに『おおごと』(※解決するのが困難)なんですかっ&(目的変数もコミで)行列全体を主成分分析にかけさえすれば「まるっと」解消されるという1点だけ覚えて帰れば(…そこで帰っちゃいますかっ)とりあえず問題ないと早合点のほうなど…あくまで早合点です。
> 2次元解の場合は「めのこ」で軸を設定してもよいが
> 2次元解の場合は「めのこ」で軸を設定してもよいが
…はひ!?
・『「めのこ」とはにわ』現代っ子ですみませんすみません
https://www.weblio.jp/content/%E7%9B%AE%E3%81%AE%E5%AD%90
> ダイキン 実用空調関連用語
> 目の子勘定の略。ざっと目で見ただけで判断すること。
建設省そして日本建築学会な小島氏がいう「めのこ」なんですから、どの辞書を引けばいいかといって、とりあえずダイキン「実用空調関連用語」を引けば過不足ないとの理解にございます!!(棒読み)現場には計算機がないよ(あるわけないよ)さる連盟みたいなのが発売してるナントカ紙にプロットしたあと「めのこ」でいいんだよッ。…えーっ。「「累積ハザード紙」を『買物カゴへ』」については[3571]を参照。その時代にはまっとうな仕事のしかたであったと申し添え…げふ。
そして「多変量解析入門」の節の参考文献はなんと、▼同じ本にも出てくるひと「入門 多変量解析の実際,講談社,1996」と、▼「大隅,ルバールほか」、▼「田口玄一:実験計画法 上下巻,丸善,1957,1956(初版)1976,1977(第3版)」、それに▼「実験計画法入門(改訂版),日本規格協会,1997」の4点となってございます。(執筆時=概ね1999年度までの)実務者として(は)過不足のない参考文献(職場の本棚に置いて本当にいつでも参照できる文献)ではありますが、そのレヴェルのサーベイ(文献探索)だけで…いえ、じぶんではサーベイをしていないかのような状況で、本章をお書きになられたというわけです。(※参考文献を見ての決めつけです。読者によってどのように決めつけられるかということは、著者が挙げる参考文献によって決まるのですから、何を挙げるかというのはとてつもなく重要です。)
この1つ目の参考文献が(※『あなたの職場できょうから使える!』的な意味で実用的すぎるので)いけないんだと思うんですけど、この文献で学ぶとどういう理解になるのかということを、なんと著者じきじきに52ページにまとめておられます。
> 表1 データ解析の区分
> 量的データ / 質的データ
> はじめの言葉 データを単純化することで仮説を発見したい
> 終わりの言葉 因果関係の測定を通して実は管理・統制を行いたい
うーん。上野センセイみたいな(略)これでは主成分回帰やPLS回帰それに回帰木、ファジィC-meansを理解していけないと思うんですよぉ。もっとはやりどころ(…『はやりどころ』!)でいうとベイズ推定はどこに入るんですかっ。(※見解です。)
・[3494]
> 本書では「日本鉄道建設公団三十年史」が挙げられてはいますが、公団、地下鉄、私鉄系の車両メーカーなどへの言及は見られないことをあらかじめ申し添えます。国鉄の最後まで鉄道総研におられたかたとして、職場の環境として入ってきにくい類の情報(≒知らなくても仕事ができるとみなされる情報)は、退職後にもじぶんから探そうとはされていないということを疑います。
> 人的交流はあって、著者自身が土木学会構造工学委員会鉄道構造小委員会の「線路研究のグランドデザイン」研究会で委員を務め、「大学、JR各社、鉄道建設公団、公営鉄道(地下鉄)、私鉄の部長クラス」「若手職員を幹事として合計47名に国土交通省鉄道局からオブザーバーを得て」(276ページ)との説明が見られます。
> では参考文献に不備があるかというと、そうではないことがわかります(=後述)。参考文献というより、研究に用いたデータセットともいえる「国有鉄道 鉄道統計 累年表 CD-ROM版」「日本の研究所要覧」「数字で見る鉄道 1990−2000」「運輸経済統計要覧平成3年度版」それに土木学会「1980年版全国土木系教官・教員名簿」「1999年版全国土木系教官・教員名簿」(=を使おうというところに「確かな論文指導の痕跡」のようなものが感じられるという意味で)が手堅いので、これでじゅうぶんだという印象もございます。これ以外の一般向けの図書や報告書、それに新聞記事などをぜんぶ挙げておられるのは、正直だなぁ、…実に正直だなぁ、ということです。
・「はやりどころ」←「などころ(名所)」
http://www.ndl.go.jp/landmarks/column/1.html
> 文学、故事、神話、伝説に登場する名所、旧跡が「などころ」に当たり、実際にはない場所もありました。しかし、江戸時代になって旅行が盛んになると、名所は実際に訪れることができる場所を指す言葉として用いられるようになり、各地に「名所(めいしょ)」が誕生します。
聞きまして!? 「はやりどころ」は実際にはなくてもいい(※どこかにあるような気がしていさえすればいい)んですって!! あらあら、まあまあ!(棒読み)「かっぱ石」ほかの「などころ」については[3109],[3113]を参照。
★だっ…だれかっ……編集者を呼べっ
再び技報堂出版です。これより多変量解析に入ってまいります。
「(柳井氏の図でクラスター分析が)おぬしどこから湧いて出たみたいな扱い」([3571])も参照いただきながら、小島氏もまた苦心なさっておられる気配が紙面に漂います。
※本書の紙面上での改ページを、ここでは空行で示します。
> <コラム>統計量はやわかり
> 図 相関係数と散布図
> 図2.3.1 多変量データ
> 図2.3.2 3相3元データ
> 図2.3.3 1相2元データと2相3元データ
> 図2.3.4 個々の変数の分布をながめる
> 図2.3.5 2つの変数の関連をながめる
> 図2.3.6 多変量連関図(MAチャート)
> 図2.3.7 3変量解析
より一般化された「散布図行列」という呼びかたは示されません(=後述)。
> 図2.3.8 多次元的な外れ値
> 図2.3.9 横軸の変数を対数変換
> 図2.3.10 正規分布
> <ノート>ケチの原理とF検定
> 表2.3.1 x1とx2の2元配置(nはその条件で測定するサンプル数)
> 注)実験条件とするx1やx2の値のことを「水準」という.x1が質的変数ならば3カテゴリー,量的変数ならば3つの数値のことを指す.
> <ノート>偏回帰係数の安定性
> 図2.3.11 多重共線性と変回帰係数の安定性
※図のキャプション「変回帰係数」は原文ママ。
> <ノート>変数選択の実際
> [ A ]は多重共線性の回避に重きをおいた方法,[ B ]は統計的有意性に重きをおいた方法である.
…おおっと、「空欄に適切な語をあてはめよ。」みたいな問題文ができそうですよ。(※恐縮です。)
> 図2.3.12 図2.3.13
> 図2.3.12 図2.3.13
> 図2.3.14
> 図2.3.14
…えーっ。これら3つの図にはキャプションがなく、しかも3つに分かれ、あまつさえ3つ目は紙をめくって次のページに飛んでいるときたもんだ。編集者が不在なのでお答えできませんみたいなのって、こうですね、わかります。(※できあがりに近い状態での総合的な校正みたいなのができてない、の意。)
※あくまで日経リサーチ「パス解析」の図([3572],[3576])を既に見てしまったいまのわたしたち、本書に必要だった図は日経リサーチ「パス解析」の図みたいな図であったと、いまさらですけど逆算的にわかるというものです。(きわめて恐縮です。)
> <ノート>多重共線性と「向き合う」方法
> (全略)そのような問題に配慮しつつ,変数を選んでパス図を作り,結果を評価・解釈するという一連の手続きを首尾よく行うのは,単なる重回帰分析よりもずっと難しく,分析者の技量を要求されるところでもあるが,また,そこがパス解析の醍醐味でもある.
> 表2.3.2 相関係数行列
> 図2.3.15 5科目の成績の潜在因子
わあぃ、…えーと、わあぃこくごしゃかいえいごりかすうがくっ。もっかい? こくごしゃかいえいごりかすうがくっ。(※この順に並べられた表と図です、の意。)パス解析が既にわかっている(あるいはわからないけれども既に実務で使っている)ひととの間での「デスヨネ〜!!」を喚起したいかのような(説明したいのでなく共感されたいだけなのではないかと疑われすらしうる)「醍醐味でもある」みたいな文章で『初見!』のひとが学べるかといって、うーん。
※『疑われすらしうる』:中立を装って「疑われます」と書きたくなっちゃったり「すら」するかもしれない、の意。
※そもそも本書は実務者に向けたものであるので、この内容がまったくの『初見!』だという読者は想定しなくてよいということでもあるわけですが、しかし、それなら本書は不要であり、実際に本書を手に取るのは学生や新入社員であろうと、こういうわけです。『学部不問!』などといいながら(略)場合によっては、かなりの部分が『初見!』である読者もいるかもしれないと想定せずして本書を出版してよかったんですかねぇ。…そこまで戻っちゃいますかっ。(棒読み)
> 図2.3.16 バイプロット
> <コラム>因子分析の用途の今昔
> 本書で説明のために取り上げた例は学力であったが,因子分析は,そもそも歴史的にも,人間の能力はいくつの側面からなっているかという心理学者の議論から発展したものであるという.
> (全略)因子分析を行っただけで「これが基本因子である」ということを強行に主張しても仕方がないということになる.(大略)それどころか,どのように解釈できる因子が得られたかを報告して終わり,という安易な研究が横行したので,一時期,批判の対象となった.
> (さらに略)48ページのバイプロットなどは,(略)因子分析ないしは主成分分析を用いることが可能であることを示している.
うーん。
> 図2.3.16 バイプロット
> は,第1,第2主成分スコアを標準化して散布図として表示し,さらにもとの観測変数軸の向きを因子負荷量を成分としたベクトルとして示したものである.このような図はバイプロットまたはジョイントプロットなどと呼ばれ(略)便利である.
> 48ページのバイプロットなどは,(略)因子分析ないしは主成分分析を用いることが可能であることを示している.
このあと「(企)東武動物公園スーパープールきっぷ」…じゃなくて、「(7)(非)類似度データの分析」といって、その実、「MDS(多次元尺度法):似ているものを近くにおく」「クラスター分析:似ているものをグルーピングする」「非階層型クラスター分析」「階層型クラスター分析」という順番で続くのですが…なるほどなるほど。
> 非階層型というのは,(略)分類する対象の数が膨大な場合によく用いられる.最も代表的な「k-means法」あるいは「重心移動法」についてごく簡単に説明すると,
…バキバキッ。じぶんは使わないけど感みたいなのを濃厚に漂わせながら、知らないとはいわずに一応…『一応』説明しておくよ的なニュアンスが感じられてきそうです。(※感じかたには個人差があるというひともいます!)
(小島氏だけがというのでなく、およそこの時代に多変量解析を使いこなしてきた世代のひとが)どうして「クラスター分析」の理解に到達せずに「じぶんは使わないけど」みたいになっているのかがわかる“痕跡”が、この近くに残っているんです&行きましょー行きましょー。(棒読み)
> (49ページ)
> これまではサンプル×変数の行列形式の「多変量データ」の分析法について解説してきたが,ここでは類似度,非類似度データに対して行う2つの分析法を取り上げる.
なるほどねぇ。…実になるほどねぇ。k-means法(k平均法)にほうり込む行列は、(※クラスタリング結果の妥当性を考えるのとは切り離して、アルゴリズムの挙動だけ知りたいとかデータ構造の探索が目的だという限り)なんでもいいんですよ。…なんでもいいんですよ! 行列(多変量データ)の内容あまつさえ意味なんて知らんですばい。それがアルゴリズムというものですよ。(※中央線の各駅停車電車っ!! 2分に1回の頻度で棒読みしてみせるとGOOD!! お客さまにとって意味のある自動アナウンスになっているかなんて知らないのだわ。ブリは照り焼きとは限らないのよ。)
※いえ、▼「距離行列とは、ウォード法などのクラスタリングのアルゴリズムの内部で用いられるデータ表現である」という理解でなく「ウォード法には距離行列を入れる!(=「(非)類似度データ」という形式のデータが取れたときだけ使える!)」と理解する=あるデータ表現が、アルゴリズム側に属するのかデータセット側に属するのかが意識されていないという、そこも大きいとは思われますけれども、▼「デンドログラムではお伝えしきれないのが残念です!」ならびに▼「k平均法の結果について定量的に考察を述べる『論文レポートの報告文例』みたいなのが見つからないよ!」というのが大きいんですよね。念のため。
※「探索的な分析(exploratory analysis)」の初期の段階での『報告文例!』みたいなのは、通常ほとんど個人のメモみたいなものであり、部内だけで通用して外には出てこないわけです。あるいはそもそも文章にはなっておらず、図表だけで口頭で説明しておしまいにするくらいのゾンザイな(略)こんなことでよかったのでしょうかといううしろめたさはありながらも、それっきりという(以下略)。
・(♪〜)「2秒に1回、3秒に1回、4秒に1回、5秒に1回、6秒に1回、7秒に1回、秒に1回9秒に1回、10秒に1回瞬時に点灯する9種類の電球」とはにわ付近の通過には19時間30分、影響で東京港トンネル…(※東京港トンネルは無関係です)
https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q14181151264
https://goo.gl/maps/KeffWLKrfZL2
https://goo.gl/maps/xtCc7QFAqJR2
https://goo.gl/maps/nBGEqhbuuZU2
https://goo.gl/maps/Ae6mzUWpwz62
https://goo.gl/maps/WYx4KskZ7KN2
https://goo.gl/maps/c9Qz87DYz3H2
…JIT! JIT! われわれハンドルを握ったまま難しい顔で時計とにらめっこ&にらめっこなのですよ。休んでるんじゃないやい、JITのためにじっとしてるんだい。(※あくまで演出です。)
> 12月24日の午前0時ちょうどに全部の電球を同時に点灯させたとき、クリスマスパーティが開かれる同日の午後7時30分ちょうどには、何種類の電球が点灯するか
…うへー。(以下略)隣の部屋(※そこにコンピューターがあるようですよ)でBASICとか使っていいっスか? …デスヨネ〜。(※なまじ先にプログラミングを覚えてしまうと、直近の授業で習った単元の知識を使えるかどうかみたいないかにも学校っぽいことは検討しようとせず、いきなり文章題の通りのプログラムを愚直に書いてみたくなってしまって、点数も取れなくなっていくんです。)もっとも、「19.5×60×60」を「(19.5×2)×30×60」と変形させるというのは…きわめて都合のいい(中略)なんだかなぁ!! 70200秒が割り切れるの割り切れないのをFOR文で2から10まで回しながらIF文をつごう9回ほど実行するだけの簡単なプログラムです! …いやいやいやCPUのかけ算って、そういう感じでしょ&何がいけないんスか!!(※つっぱりはイメージです。やーいつっぱりつっぱり! …いよいよもって何らかの心象みたいな点数は下がるよね。)一番下の桁が0なんですから、2、4、5、8、10は剰余の計算すらしなくていいよね。3を計算すれば6と9もわかるよね。あとは7だっ。わあぃ7っ。なんとなく最初から7を計算してみたかったんスよ。ぜんごしょーっ!! 70199秒でも70201秒でも「17秒に1回」や「1439秒に1回」の電球でもなんでもどんとこいってんだ!(違)
※「直近の授業で習った単元の知識を使えるかどうかみたいないかにも学校っぽいこと」という文脈なしで、いわゆる「社会人(笑)」がいきなり解けるかって? …ギクッ。
・各社「つっぱり」ございます付近のイメージです
https://kotobank.jp/word/%E7%AA%81%E3%81%A3%E5%BC%B5%E3%82%8B-571950
入力(値)はいくらでもいい、所定の計算や処理をして自動的に出力しまっせ。それがプログラムってもんですぜ★お客さーん。(※あくまで演出です。)「正の約数の積の末尾の0の個数を2進法で問う融合的なかなりの思考力を要する設問」については[3404]を参照。えっ…もっかいぷりっ? 「正の約数の積の末尾の0の個数を2進法で問う融合的なかなりの思考力を要する設問」については[3404]を参照。…えーっ。(※あくまで演出ですが「正の約数の積の末尾の0の個数を2進法で問う融合的なかなりの思考力を要する設問」は実際の出題です!)あまつさえ秒数だって足し算や引き算(中略)電球ごとにRGBの色が違っていて「午後7時30分ちょうど」にRGBが各2個ずつ点灯するためには何時何分に電源を入れればいいか(※点滅サイクルを一斉に開始すればいいか)などと(以下略)ま、結局「サイコロの目や壺の中の赤い玉と白い玉」([3574])みたいなのになっちゃうんですねぇ。
・「カラー点滅球(※生産完了品)」のイメージです
http://www.elpa.co.jp/product/page_img/li03/2422-0.jpg
★うっかり「ベイズ推定」が読み解かれる(談)
再び技報堂出版です。
われわれ長靴で(中略)水源もこの近くなんですけど…行ってみます?
> 図2.3.2 3相3元データ
> 図2.3.3 1相2元データと2相3元データ
調査の設計(企画)上の注意点を強調すべく、ことさらに「p相k元」(または「m相n元」でもなんでも)と呼ばせて注意喚起されてきたことの『深刻な副作用』がありそうだと見受けました。(※独断です!)
※注意を促すため特別に呼び分けるということ自体は大切です。大雪からの「「除雪OK!」などと一種『低解像度!』に把握されているのでは不十分で、「新幹線用除雪車による除雪OK!」だとか「標準軌除雪!」だとか、注意すべきことがらを十分に明らかにして呼ばないと、(作業者や直属の監督者において)意識されない(在来線用の除雪車でヨシとしてしまう)ことがわかります。」については[3183]、「さすが「薬理」!」からの「「α過誤」だけを(ことさらに『α過誤』という専門用語を強調して)注意させる指導のしかたというのは、あなた、「薬理」という実務でミスをさせないための(センセイの)おせっかいなのであって、これで統計学を修めたかのようなこと(「じぶん、統計学にはちょっと詳しいんでいわせてもらいますけど」みたいなの)をのうのうと述べてはいけないのですよ。」については[3514]を参照。
> 3相ではあるが3元ではないデータというのも決して珍しくない.(略)建物ごとに評定者が異なるので,3元ではなくなる.
> 3相データの場合は対象×評定者をサンプルとすることが多いため,対象の個数が極端に少なくても,評定者数が多ければ一見それなりのサンプル数となる.しかし,例えば対象5個×評定者20名のデータと,100名に自宅を対象として行った調査データが,同じ100サンプルの情報を持っているとは考えにくい.
えーっ…そんな『簡単なかけ算!(なかけ! なかけっ!!)』しちゃうひとって本当にいるんですかっ。こうやってみそ汁にごはんをだなぁ(略)自分が考案した『早食法!』(※読みかたは不明です)を自慢げに後輩に披露してみせるみたいな…げふ…大昔にはいたかもですけど、いまはいないよね。…わあぃTKG! TKG! 「ベスト・オブ・TKG」については[3213]を参照。
※じゃあ(※)どうかけ算(…どうかけ! どうかけ! 腕組みした前掛けの店主が不満そうにかけうどんをお出ししそうな…違いますってば!)すればいいのかといって、情報を「量」だと考えたとき、「自宅しか評定しない」「100名の自宅は100個ある」といって「(あなたが評定した)対象は1/100個ですね」からの、えーと、まずは「対象1個×評定者20名のデータ」と同じ『量』を持つためには「対象1/100個×評定者20000名」じゃないとだめってことですね。本当でしょうか。「対象5個」のほうは、評定者が同じ尺度を使って別の建物を評定しても、評定者が各々に持っている(はずの)判断の基準みたいなのが揺らぎませんよ(あるいは揺らぎますよ)という「尤度みたいなの(仮)」を意味していますから、こちらは5倍というわけにはいかないのですよ。うん。
※そういう意味では『情報』は「量」と「尤度」の2次元からなる…そこをかけ算して出てくるのは「サンプル(サイズ)」ではないよね。本当でしょうか。(棒読み)
・「量(密度)」と「尤度」って、直交ですよね〜(どっちも確率だけど)
https://kotobank.jp/word/%E5%B0%A4%E5%BA%A6-682842
> 原因の確率(事後確率)は、結果の確率(事前確率)と事象が発生する確率(尤度(ゆうど))の積に比例する、というベイズの定理を用いる。
この続きは有料です!! …じゃなくて、いまをときめくプレミアム☆はなのベイズ推定すたぁずぅ…みたいなの(仮)を参照せよとのコトバンクさんにございます! …えーっ、ちょっと、ちょっと待って! ベイズ推定はちょっと待って。いいこと?(※あくまで映画の字幕みたいな演出です!)
・「割増価格」などとにべもない
https://kotobank.jp/word/%E3%83%97%E3%83%AC%E3%83%9F%E3%82%A2%E3%83%A0-22862
https://thesaurus.weblio.jp/content/%E3%81%AB%E3%81%B9%E3%82%82%E3%81%AA%E3%81%84
・まろやかにまいりましょー@まるこふれんさもんてかるろほー…はっ、はーまいおにーっ([3406])
https://ja.wikipedia.org/wiki/%E3%83%9E%E3%83%AB%E3%82%B3%E3%83%95%E9%80%A3%E9%8E%96%E3%83%A2%E3%83%B3%E3%83%86%E3%82%AB%E3%83%AB%E3%83%AD%E6%B3%95
http://www.ouj.ac.jp/hp/kamoku/H29/kyouyou/C/sinri/1529196.html
> 本講義は受講者が統計解析環境R、rstan、stanで実習することを想定しています。
> 同時分布、条件付き分布、ベイズの定理、尤度、事前分布、正規化定数、事後分布、最尤推定
> MCMC、ハミルトニアンモンテカルロ法、ウォームアップ期間、トレースプロット、収束判定指標
http://totech.hateblo.jp/entry/2016/07/28/133537
> ただHMCは正規分布から10万個程度のサンプリングであっても結構遅いように感じた。
Rだから遅いんではなくって? あらあら、まあまあ!(棒読み)
・「水産資源学で使われる回帰」のイメージです
http://cse.fra.affrc.go.jp/ichimomo/fish/okamura_R.pdf
> https://sites.google.com/site/hiroshiokamura/bayes
うーん。
> 水産資源学におけるベイズ統計の応用ワークショップ
> WinBUGSについては下記のサイトからダウンロードしてください.
> 必ず登録をして,keyの取得をお願いします.
えーっ。なんかヤダー。…『なんかヤダー。』みたいなのキターっ!!(棒読み)なぜRだけでできないのかね。…遅いからです!(棒読み)
・「MCMC計算まわりでさまようRユーザー」(2006年12月)
http://hosho.ees.hokudai.ac.jp/~kubo/log/2006/img12/Rmeeting/kuboDec2006.pdf
> 報告: 久保拓弥
> なぜ階層ベイズモデルなんかが必要なの?
> (一般化) 線形モデル的に現象を表現する場合
> [尤度をあつかうモデル]
> 「すべてのパラメーターは確率分布」とするBayes統計学
> 階層Bayesモデルなどなど
『情報』みたいな多次元空間での「尤度」という軸について最大値などの代表値だけで見てきたのが「最尤推定法」までの(『情報』みたいな多次元空間でいえば「単回帰」にあたる)回帰(推定)手法だったと、…そういう理解でもいいんでしょうか&本当でしょうか。なるほど『情報』みたいな多次元空間でいう「重回帰」にあたるのが『ベイズ回帰』! …えーっ。(※あくまで曲解です。)
> 多重nestしたrandom effectsの導入
『多重nest』っ!! 「メンガーのスポンジ」([3460])って、こうですね。(※あくまで勉強前のイメージです。…勉強後には変わるのかなぁ。)
> R package: library(MCMCpack) など(いまいち)
> 君臨しつづける老雄: WinBUGS 1.4.1
> adaptive rejection sampler
しょくん! WinBUGSのおじかんだっ&おもうぞんぶんWinBUGSしてくれたまへ…じゃなくて、「愛用!」(=後述)じゃないですけど、アレな表現ですよね。(※感想です!)
※いま探すと「adaptMCMC」など見つかりますけど、よしあしがぜんぜんわからないよ!
・英語です
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4920405/
> The posterior parameter distribution is sampled using the robust adaptive Metropolis sampler implemented in the R package adaptMCMC with the parameters from the optimisation serving as starting values.
うーん。(※読まずに「うーん。」とのみいっています。あしからず。…読んでないのに引用できるんですかっ!!)いっけなーい! わたし、えいごりか。どこにでもいるふつーのえいごりか(略)数学は大の苦手だけど実験は大好き、英語も…まあまあよ! 国語と社会は時間のむだ! 勉強なんてしなくてもできるはずなのに、なぜかテストの点数がいまいちなのが目下最大の『謎』よ。(違)
※…偏見ですっ!! ここでいう「偏見」:変数が少なく多変量データとしてじゅうぶんな表現力(説明力)を持たない状態で考察してしまうこと。人物の評価を5教科の得点だけで行なおうとすること。…ギクッ。
・日本語です
http://rstudio-pubs-static.s3.amazonaws.com/273933_423f568510814c6b99d9bd413a1d367f.html
> みんな大好きMSモデル(Markov Switching moel)をみんな大好きGARCHモデルに適用した、MSGARCHモデルを扱うパッケージ{MSGARCH}を触ってみました。 なんと2016年12月に出たばっかりのパッケージです。
> ベイズ推定も出来る。内部では、Rパッケージ{adaptMCMC}を用いたMCMC(Markov Chain Monte Carlo method)サンプリングによりパラメータ推定を行っている。
うーん。「tDiaryみたいなにおい!」([3526])って、こうですね。
・朝日新聞「記述式に懸念「自己採点で迷う恐れ」 センター後継試験」(2017年12月5日)
http://www.asahi.com/articles/ASKCZ6H26KCZUTIL057.html
> 模試の採点実績などをもとに選ばれた採点者が2人1組で行う。「80字以上120字以内」「2文で書かれている」といった条件に沿ってそれぞれ採点し、2人の採点結果が一致したら登録していく。
> 条件のうち一つでも2人の採点が一致しないものがあれば、資質と経験のある採点リーダーへ、そこで一致しなければ統括採点リーダーへと回す。それでもだめなら、教科の専門知識を持つ担当社員らが協議する。
・はふはふ(2017年12月4日)
http://www.huffingtonpost.jp/2017/12/03/history-textbook_a_23295874/
> 入試科目である世界史B、日本史Bの主な教科書の用語数は1950年代の3倍近くに増え、学校の授業の時間内では教科書が全然終わらない。難関大学を目指す生徒は多数の用語をひたすら暗記し、さらに補習が必要になる。「これではコスパ(効率)が悪い」として、入試で歴史を選択する高校生が減っている。歴史で受験しない生徒は補習を受けないから、教科書の途中で勉強が終わってしまう。理系の歴史離れは特に深刻だ。
(朝日新聞の本紙では)この記事には続きがあるということなんですけど、たぶんいいんちょーいいんちょー、かなり私見を述べたのでしょうか、それとも持論を述べたのでエッセイ(作品)扱いされたのでしょうか、「この続きは有料です!」枠に追いやられてございます。ここまでがニュース(事実の報道)であり、この続きはニュースじゃない(論評である)ということですね、わかります。(棒読み)
・「質的データに対する非計量三相主成分分析法」(2015年)
https://www.jstage.jst.go.jp/article/jbhmk/42/2/42_105/_article/-char/ja/
https://www.jstage.jst.go.jp/article/jbhmk/42/2/42_105/_pdf
> 引用文献
> 足立浩平・村上隆 (2011).非計量多変量解析法 −主成分分析から多重対応分析へ.朝倉書店
「3相」といって「Tucker3」を使って考えていくことと、「尤度」を扱いたいといって「ベイズ推定」していくことは、数理的には大差ないことなのではないかと仮に早合点してみながら、追って勉強できればとは思いました。(※「は」に傍点。)
・「3相3元データに対するTucker3モデルを用いた正準共分散分析について」(2015年11月27日)
http://ci.nii.ac.jp/naid/40020673265
https://www.jstage.jst.go.jp/article/jscswabun/29/1/29_99/_pdf
・…あるよ。
https://www.rdocumentation.org/packages/rrcov3way/versions/0.1-10/topics/Tucker3
「Mathematical Geology」2003年を引いての実装だということです。
> from ThreeWay: 7x5x37, unfolded to 7x185
そういう感じの規模感の3相データをささっと計算するくらいならRでもいいよみたいな…本当でしょうか。(※ぜんぜんわかってませんので、あしからず。)
★諸君が愛してやまない多変量解析とはその程度なのかね(仮)
再び技報堂出版です。
説明や図の中で、中途半端に「評定者」「評価対象」と「固定的に呼びつけ!」てしまっているんです。あくまで多次元の行列だと見たときに、どの軸(多次元配列でいえば添え字)を数えれば「サンプル」なのかというのは、そのときそのときであるので、そこを「呼びつけ!」しちゃうのはいかんですばい。(※現在の見解です。)
似たようなことが「多変量連関図(MAチャート)」の説明にも見受けられます。
> 図2.3.6 多変量連関図(MAチャート)
> 図2.3.7 3変量解析
> 多変量解析など行わなくても,この「2変量解析」を丹念に行うことによりわかることは意外に多い.
> 分析ソフトによっては,すべての変数間の関連や個々の変数の分布を,図2.3.6のような「多変量連関図(MAチャート)」として出力できるものもあり,データの概要を大まかにつかむには便利である.
上述のように「散布図行列」という『数学用語!』で説明される(一般化して述べられる)ことはなく、あくまで「分析ソフト」(…『ソフト』!)の機能だとのみ捉えられているようすがうかがえます。これは、昔から大型計算機センターに行列してうやうやしく計算してきたひと(※)にしてみれば、真に計算機が活躍するのは計算プログラムの部分だけであって、見やすい図表は手でつくるものだと、そんなことに電気代を…じゃなくて、手で図表をつくること自体が検算でもあったので、あまり自動的に図表まで出力されてくるのは好かんと、たぶんこういうわけです。それはまったくごもっともでございます。しかし、散布図行列を間違いなくプロットするというような、難しくはないけれども量の多い仕事は計算機に任せたいと、これまたこういうわけです。
※…みたいな世代の人が教官であったとか、その時代以来のカリキュラムが温存された学科であったりすれば、若くてもそのような感覚が身につくと推定されます。最初のうち、本書での文面や多変量解析に対する認識などから、2000年に57歳くらい、現在74歳くらいのかただと思っていました! いやいやいや、それはきっと小島氏の指導教官ですね、わかります。小島氏が卒論をお書きになったときに47歳くらいの…うーん。当然ながら、研究室でCADや「各種数値計算ライブラリ」(としてのSAS)は使っても(バッチ処理と式の定義などを超える=プログラミングらしい)プログラミングはしない感じですかねぇ。…1990年ですからねぇ。何がどうしてこうなった「構造化BASIC」については[3566]を参照。その不満あってこその、その後のキャリアとお見受けします。(※あくまでタイムラインのみからの推察にございます。)
・ウィキペディア「True BASIC」「QuickBASIC」付近(1984年〜1990年)
https://ja.wikipedia.org/wiki/BASIC#.E6.A8.99.E6.BA.96.E5.8C.96
・「構造化BASIC」といって飛び出すイメージにするのがソレっぽいんですよね…構造化だけに。
http://www.emsps.com/oldtools/photos/ms/basic/qb2.jpg
※BASICというと、ハードウェアまでコミでN88だのFだの(それをウインドウズ…『イ』…の上で動かしてみせるなどの)VBAだのという界隈が想起させられましょうが、その一方では「構造化BASIC」と立体文字で書かれた表紙の教科書みたいなのを使いながら「True BASIC」もしくは「QuickBASIC」を使って、ちょうどいまでいうRやScilab(あとPython)くらいの感じに使って卒業研究などなさっていたという世代(※就職したらぜんぜん違うのを使うんでしょうけど、の意)が、この狭い年代に挟まっているのだという理解でございます。うわぁ…現代よくわかる本が256倍うらめしい本みたいなのーっ。(棒読み)就職とはいわないかもですが徳間書店にアルバイトで入って「ゲーム通信簿」のはがきを「私がQuickBasicで組んだプログラムを使って集計」してたひとについては[3402]を参照。わあぃ1-2-3それに松茸っ。学校では『QuickBasic』(※小文字=むしろ「QBasic」との表示)しかなかったんでしょ。ちょうどいまでいう「MS-OFFICE(…大文字!)は高いからケシカラン!」といってUbuntuとか入れるひとみたいな…げふ。(※あくまで想像です。表記は時代により異なり、パッケージやマニュアルと画面上とでも異なる場合があります。)
※「Basic」と小文字混じりで書いても気にしないよというのは1983年くらいまでの感覚ではなかったろうかとぼかぁ(違)起動ディスクに貼るラベルに達筆な油性ボールペンで「Basic」と書かれていたら「Basic」なんだと覚えますよね。うん。(※推定です。)教室で使うタブレット端末を一斉に充電するロッカーみたいな感じで、人数分(台数分)の起動ディスクを作成しておくのですよ。ライセンスを持ってますアピールとしてマスターディスクの箱だけ教室に飾っておくのですよ&飲食店や理髪店などの免許状の額と同じなんですよっ。…その発想はなかった!(えーっ。)
・千葉市です
http://www.cabinet-cbc.ed.jp/cec_jyoho_kouho.html
> S61 千葉市教材作成支援ソフト(MSX版)開発
昭和61年は1986年です。職員室とか、放送室とか休憩室みたいな(ホコリが立たずカギのかかる)ところに1台だけ置かれて順番に使う(時間割もこれで作成する)という時代ですね、わかります。(棒読み)みながBASICを習っているという前提ではないのでパッケージソフトがなければ本当にただの箱っ。
※PCが云々という時代より前には(支援の)専従のセンターを設けて云々というのがあったのかなかったのかよくわからないんですが(委員会や分科会といいながら持ち回りみたいな、の意)、▼リソグラフ(略)わあぃ自動プリント!(これで教材作成に専念できるよ)、▼「教室にテレビを備え付けて放送室もつくるよ(ほうそういいんかいができたよ☆こんてすともあるよ)」、▼「OHPでスライドですよ(スクリーンを備え付けて棒を置くんですよ!)」から始まって(※教育研究会が学校でできるよ=しかし児童・生徒にスライドをつくらせるかというと、うーん。研究授業の時だけ…ゲフンゲフン。修学旅行の報告会みたいなのくらいはするかなぁ=しないと修学旅行じゃないんです!)、▼職員室にコピー機、▼「ビデオデッキ」、▼「レーザーディスク」…げふ。
> H3 千葉市教材作成支援ソフトMS-DOS版への移植
平成3年は1991年です。…平成3年は1991年です。ほぉお!(違)MS-DOSとはいってもFM-Rかもしれないのですよ。『変な感じ!』に「親指シフトがー(↑)」というひとが量産されていく…ガッ。
> 7 小中22校PC室整備(小中学校PC室整備開始:Win95)
平成7年は1995年です。…平成7年は1995年です! 知らなかったなぁ!!(違)
> 15 地域イントラネット拠点機器導入と運用開始(10Mbps)
平成15年は2003年です。…平成15年は2003年です。知らないよっ!(※2000年問題で西暦の4桁表記が普及してまいります。)
> 18 学校ホームページ更新方法変更(校長承認制に)
> 19 情報教育支援体制の改善(情報技術支援員配備・コスモス先生廃止)
平成18年は2006年です。うわぁ「コスモス先生」って、開始はいつなんですかっ。
・千葉市「コスモス先生」のイメージです
http://www.city.chiba.jp/kyoiku/kyoikusomu/kikaku/documents/tenken-hyouka-houkokusyo_1.pdf
> 情報教育推進事業(コスモス先生派遣)
> 各学校へ民間の情報処理技術者(「コスモス先生」)を派遣し、コンピュータネットワークを活用した授業の補助等、情報教育の一層の推進を図る。
> 18年度で事業廃止。基本事業7中の「情報教育支援員配置事業」に発展的に統合した。
1994年に試験区分が変わる前の「情報処理技術者」をいっているのかどうか、ここだけでははっきりしないことがわかります。2006年度でやめるということは、2001年度からの「テクニカルエンジニア(システム管理)」「テクニカルエンジニア(データベース)試験」「テクニカルエンジニア(ネットワーク)試験」あたり(で定義されるコンピタンス)をいっているのかとも思われます。学校版「客先常駐SE!」の、自治体側での位置付けや呼びかたなんですよ(※市教委に常駐のうえ、各校に派遣される、の意)。…なるほどねぇ。(棒読み)
・[3402]
> > ゲーム通信簿のほうは毎号手作業で集計。私がQuickBasicで組んだプログラムを使って集計しておりました。読者アンケートの速報も同様です。一方で読者アンケートの詳細な分析集計、ゲーム大賞の集計については、業者に依頼し、クロス分析なども行っておりました。毎号何百ページにもわたるデータが出ていたのです。
※2005年ごろの感覚でいう「LAMP」くらいの、入力フォームがあってCSVなどのデータストアがあって(各種SQLでもいいけれどスタンドアローンで動かしたいのよね)、集計ができるのをPHPで書いたよくらいのソレを、1995年ごろでいうと「MS-ACCESS」(※大文字!)でやるか「マクロ」を組むんですよ。そういうやつの1985年ごろのやつ! それが徳間書店のアルバイト「私がQuickBasicで組んだプログラムを使って集計」ですね、わかります。じゃあ(※)2015年になるとどうなるかといって、そういうのは「いきなりクラウド(仮称)」みたいなのでできるのかなぁ(=使いたいだけならコードを書かなくて済むかなぁ)。…ファイルメーカーぁー(↑)って、あるじゃないですかぁ([3302])。
逆に、このような感覚(図表はじぶんの責任で、じぶんの手でつくるものだ)からは、分析だけを「分析ソフト」の所定のライブラリで行ないさえすれば(※徳間書店のアルバイトの編集部氏でいえば「業者に依頼」すれば)、図表をつくるのは得体のしれないフリーソフトや自作のプログラムでもいいんだという、計算機の出力に手で修正が加えられて写真製版されてしまった報告書を無効として破棄させたビデオリサーチ社([3569])や、FDA(に提出するデータの様式や使用可能なライブラリ等のホワイトリスト)のようなエレガントさ([3567])の正反対みたいなことをしているのだということに対して無頓着すぎるきらいがあるともいえましょう。(※時代と分野によるところが大きいですが2018年は平成30年、現代の水準では「エレガントじゃないとダメ」ということですよ。)
※結果が同じならなんでもいいとするのでなく、ホワイトリストに事前に入れてあるものしか使ってはならないとするということです。
再び技報堂出版です。
> 3変量解析となると,本格的な分析に入る前のデータのモニタリングとは言い切れない部分がある.データ分析のさまざまな段階において,分析に慣れた人ほど,それと意識せずに3変量解析を行っていることが多い.筆者の私見だが,3変量解析を使いこなせるかどうかが初級者と中級者の分かれ目であると思う.
…うわぁ「私見です。」みたいなのーっ。(※表現は演出ですが見解です。)
おっしゃっているのは、「重回帰分析を使いこなせるかどうか」ということであって、すなわち「多変量解析を(ホワイトボックスとして)使いこなせるかどうか」の『分かれ目』が、「単回帰から重回帰への拡張」「多次元空間の直感的な理解」にあるということですね、わかります。(※次元が「3」かどうかには、小島氏がおおげさに『3変量解析!』と連呼なさるほどには意味がないと思われる、の意。)
小島氏の本書での解説のねらいは40ページで簡潔に述べられていて、まったくごもっともでございます。
> 理論が厳密な本,手続きや分析オプションに詳しい本は世にたくさんあるので,本書ではそのあたりは思い切って割愛した.
> このような手法になじみがない読者でも,考え方の肝心な部分だけは理解できることを目指して書いたものであるが,普段から多変量解析を愛用している読者にとっても,知識の再確認や整理に役立てていただければ幸いである.
この、本書でなければ「愛用!」といって皮肉めいているとも思うんですけど、あくまで本書なのでストレートに読みましょう。うん。(棒読み)時間の関係でスラド「どうしてこうなった 部門より」より「諸君が愛してやまないWindows 10では、普通に『圧縮 (zip形式) フォルダー』を作成できるが、LZHには未対応だから。」の用例については[3461]を参照。
後者は本当に「役立」つと思いますけれども、前者は限りなく難しいとの…実感でございました。わたしには(本書で前者のような理解を得ることは)難しかったんですよ&『いまのわたし』がいうんですから本当ですっ!(違)
※「わからなかった」という情報が役に立つのかですって? これから教科書を書いたり授業をつくったりされるかたの参考になればというわけでございます。ええ。
> (39ページ)2.3.5
> (1)多変量解析はなぜ必要か
> 相関係数の大小(さらには相関係数の差の検定など)で,影響の大小を評価してしまってよいのだろうか?
> 答えは「No」である.
「答えは「No」である」みたいなのキターっ。…うーん。相関係数の大小では「No」だというのは相互情報量その他の情報量規準みたいなのをAからZまで並べてみせながら&それで足りなければAAからZZまでぜんぶよ(違)「見せかけの相関」…じゃなくて、「見せかけの回帰」を引き起こすような分布になっているのかいないのか、それを相関係数ではまったく見分けがつかないからだという、そっちですよね。われわれ本日の紙きれ(中略)「多変量解析はなぜ必要か」という問いかけに対するストレートまっすぐな答えにはなっていないですよねっ。(棒読み)
※「相関係数の大小がー(→)」からの「ガッ」みたいなの(仮)というのは、「『単』回帰ではだめで『重』回帰じゃないとだめ」ということでなく「『線形』回帰ではだめで『非線形』回帰じゃないとだめ」ということでもありそうですよね。…本当でしょうか。
> 多変量解析の手法は数多くのバリエーションがあるが,大なたをふるって分類すれば,ここで紹介したように,(1)因果関係を把握する,(2)変数をまとめて総合指標化する,(3)分類や布置を得る,という3つの用途に整理できるのではないかと思う.
「分類すれば〜整理できる(と思う)」構文みたいなのーっ。…それを分類とも整理ともいうんですよっ。現代の水準では「ここで紹介した各手法は、(1)用途、(2)用途、それに(3)用途のいずれかに応えるものであり、じぶんの用途に照らして適切に組合せて利用する必要がある。」みたいに書きたいところです。これ、「ここで紹介していない手法については知らない!(=わたしに聞かないで!)」ということです。ええ。(棒読み)それをじぶんでいいきるのがナウいんですよ。(※あくまで私見です。)「分類」というからには網羅的に調べ上げての体系的なソレをしないといけないですし(=それなら柳井氏の図を持ってくればいいんですし)、そうでない限りは改めて「整理」するまでもなく、ここでこの手法を紹介するよといったからサラダ(字余り)…いえ、紹介する手法を絞り込んだということ自体が「整理」なんですよ。キュウリとレタスとトマトにマヨネーズをおかけしさえすればサラダなんですよ。…その発想はなかった!
> <ノート>(非)類似度,距離をどのように定義するのかという問題
> (全略)相関係数というのはコサインであるから,
> 相関係数というのはコサインであるから,
> 相関係数というのはコサインであるから,
ぬおー(略)。コサインは説明不要(みんな知ってるよね)というニュアンスが漂います。
> 高校数学で学ぶ余弦定理により,(式略)を距離とすれば,幾何学的にも妥当な定義となる.
ぬおー(略)多次元でのコサイン距離はコサイン距離、相関係数はExcelでぱしゅーっと出てくるやつ(!)だと思って…げふ…その発想はなかった! 「相関係数というのはコサインであるから」という説明が先にほしかった! コサインは確かに習ったけれども、相関係数やコサイン距離を(※単位を取るためでなく実用的に)学ぶころにはちょっと忘れているんですよ。(※個人の感想です。)
※ところで、小島氏の解説での「クラスター分析」は『変な順番!』になっていて、ストレートに読むと「(非)類似度行列」例えば「コサイン距離」などの「距離行列」を使うんだね&「k-means法」の入力も距離行列なんだね…と早合点しそうになります。Rのkmeans関数(けーまえっ!)に入れる前に距離行列にしないといけなかったのかみたいに急に不安になったんですけど、生の変数が並んだ行列を入れればよかったんですよね。…ですよね!(棒読み)スーパーえむジンせんせいがkmeans関数にいきなりほうり込んでる「iris2」(irisデータの4列目までを採った行列)って、生の変数が4つ並んでいるんですよね。…ですよね!(棒読み)Rの関数が『便利すぎる!(実用的にすぎる!)』ということもあるのですけれど、ほうり込みさえすれば正規化(値を0〜1の範囲にする)も中心化(分布の平均が0になるよう平均値を引く)も標準化(標準偏差で割る)もしてくれるんですよね。…ですよね!(棒読み)
相関係数とコサイン距離を(小学校高学年の)「自由研究」や「算数」に持ちこむことを想定しての試み的な何かについては[3330]を参照。(※実際に試行しているわけではありませんので、あしからず。)
・(再掲)3次元の空間における「コサイン距離」のイメージです
http://www.programering.com/images/remote/ZnJvbT1jc2RuJnVybD1uQm5hdU1UTXRrRE15TVRPeGdETXlBM0xqbEdiaVZIY3ZVMlp5RkdidlVHZHY1MkwzVldhMjlTYnZObUx1Rm1ZMTlHWnVNelp0bDJMdm9EYzBSSGE.jpg
・[3330]
> やっていることはこれだけ=空間内の2点間の距離を測っているだけで、コサインなどという一種「名状しかねる便利でおトクな三角関数と呼ばれる関数のようなものッ!!」をブラックボックス化(☆ラパパ的なおまじない扱い)しさえすれば、きちんと算数の範囲ですよ。本当でしょうか。
> 実際の応用としては、ベクトル空間モデルといって、3次元どころでなく多次元の空間に持ちこむところにあってだなぁ(ここでは略)。そこを3次元までに限れば算数の範囲なのですよ。もっと本当でしょうか。
・「正規化」ウィキペディアの説明です
https://ja.wikipedia.org/wiki/%E6%AD%A3%E8%A6%8F%E5%8C%96#%E6%95%B0%E9%87%8F
・「中心化」日経リサーチの説明です
https://www.nikkei-r.co.jp/glossary/id=1661
・「見せかけの回帰」のイメージです
https://ja.wikipedia.org/wiki/%E8%A6%8B%E3%81%9B%E3%81%8B%E3%81%91%E3%81%AE%E5%9B%9E%E5%B8%B0
https://upload.wikimedia.org/wikipedia/commons/0/0e/Spurious_Regression.svg
> 統計的に独立である無関係の二つの時系列変数が最小二乗法による回帰分析において統計的に有意な係数の推定値を取ってしまうという問題
うーん。散布図上での幾何学的な理解をすればいいんですよね&変数が時系列であったかどうかは不問で(※時系列だとよくある、という注意喚起みたいなのは大切です!)こういう分布でありさえすれば起きることですよね。(棒読み)
★2019年度「(仮称)応用統計概論」の教科書を書くつもりで既存の教科書を遠目に眺める(談)
あくまで架空の、「追体験みたいなの!」としての検討ですので、あしからず。
・(あくまで参考)かえって「概論」を書けそうなひとがいなさそうな…げふ付近(※推定)
http://www.applstat.gr.jp/seminar/index2016.html
http://www.applstat.gr.jp/news/events/events2016.html
・「こんな方におすすめ」の使用例です(2013年4月12日)
http://gihyo.jp/book/2013/978-4-7741-5630-9
> 数学をやってこなかったけれども多変量解析を理解したい人
> 統計学の考え方を復習したい人
> 心理,金融,経営などに関わり,多変量解析を必要とする人
主成分分析は出てくるけれども「散布図行列」とはいわないんですか。「k-means法」も出てこないんですか。ふーん。ほー。へー…
http://gihyo.jp/book/2013/978-4-7741-5630-9/support
> キャットフード(ウェットタイプ)
> キャットフード(ドライタイプ)
> ドッグフード(大きさ・成長段階別)
> ドッグフード代謝エネルギー
> バイプロット描画(犬)
> バイプロット描画(猫)
> 犬用総合栄養食
> 主成分負荷量の計算(犬)
> 主成分負荷量の計算(猫)
…うーん。(略)主成分分析は本当に式の通りにcor関数みたいなのでコリコリと歯ごたえのほうなど…えーっ。2変数の場合のが書いてあって、3変数にするときは書き換えてね…うそーん。わたしたちが学びたいのはそういう主成分分析じゃないっ&prcomp関数を使わせてくださいーっ。(棒読み)
・YouTube ドライタイプは歯ごたえやで。「商品名、対象、タンパク質、脂質、粗灰分、粗繊維、水分、デンプン、食物繊維、リノール酸、アラキドン酸、オメガ6系不飽和脂肪酸、オメガ3系不飽和脂肪酸、EPA+DHA、尿pH、代謝エネルギー<NRC85>、代謝エネルギー<ロイヤルカナン実測値>、カルシウム、リン、ナトリウム、塩素、カリウム、マグネシウム、銅、鉄、マンガン、亜鉛、セレン、ヨウ素、ビタミンA、ビタミンD3、ビタミンE、ビタミンC、ビタミンB1、ビタミンB2、パントテン酸カルシウム、ビタミンB6、ビタミンB12、ナイアシン、ビオチン、葉酸、コリン、ポリフェノール、ルテイン、L-カルニチン、コンドロイチ硫酸+グルコサミン、タウリン」でいうところの…「コリン」ちゃうで。(違)
https://www.youtube.com/watch?v=rEhKa1MOCW0
・けんけん…けんけん!
http://www.kenken.go.jp/japanese/research/prd/Kojima/mainpaper.html
https://kodomo-anzen.org/partners/partnerslist/33/
だってURLに「kenken」って、書いてあるじゃないですかぁ。…やだなぁ。
> 建設省(後に独立行政法人建築研究所)主任研究員を経て、2007年より現職。専門分野は環境心理学。著書に『よりよい環境創造のための環境心理調査手法入門』(技報堂、分担執筆)、『Excelで学ぶ共分散構造分析とグラフィカルモデリング』(オーム社、2005年度日本感性工学会出版賞受賞)、『マンガでわかるナースの統計学』(オーム社)など。
Excelでグラフィカルモデリング…Excelでグラフィカルモデリング…うーん。プログラミングを一度も習っていない感じということでしょうか。もったいない。(※きわめて感想です。)『マンガでわかるナースの統計学』の丁寧さみたいなのは、著者の本領発揮みたいな丁寧さ(※読者のあなたはこの通りにすればいいっ!)ではなかろうかと想像してみます。(あくまで想像です。)
・「マンガでわかるナースの統計学 -データの見方から説得力ある発表資料の作成まで-」(2006年5月26日)
http://shop.ohmsha.co.jp/shopdetail/000000001734/
https://www.amazon.co.jp/dp/4274066495
> ★このような方におすすめ
> ・入職数年目の看護師
> ・医療・看護に従事している人
> ・統計学を教える先生
…うっ。「★このような方におすすめ」といって3例くらい挙げてみせるコレ、ある時代の流行りみたいな(げふ)…えっへん。「外出先で時間を気にしながらノートPCをお使いの方。」「手間をかけずにPCの時刻合わせをしたい方。」「軽快に動作するデスクトップアクセサリをお探しの方。」とか、書いちゃうんですよ。ちょうど3つくらいね。いや〜ワトソンくぅん…そうじゃないんだ。3つ書いてあっても2つくらいのことしかいっていないんだなこれがっ。「時刻合わせがしたいだけなんでしょ」「あなたのPCバナナだね」…しーっ!! お客さまのパソコンを指さすんじゃありませんっ!!(※あくまで演出です。)
> (カスタマーレビューより)
> 統計学がー!!数字苦手ー
> 統計学がー!!数字苦手ー
ガッ
> 本書は,説明や漫画の設定上,看護師が使用するイメージで進行しますが
違うよ(大巾に中略)本当に職務上、ばりばり使うんですよ。それでいて志望動機が(相対的に大きく)問われる職であり、そこと「統計学(ほとんど数学)がすんなり身につく」というところが直交しちゃっているという、構造的にナンギな職ではありますよね。(棒読み)
> クロス集計表から入るのがスタンダードなんでしょうか、とてもわかりやすいです。推測統計やるんだったら、記述統計の基礎をやって、標準偏差くらいは理解してもらってからと思い込んでいましたが、どうしても数式が避けられず統計が苦手な人には壁が高いようなので、こんなやり方もあるんだなと新鮮でした。
…うわぁ。式がわからないのでなく、標準偏差をどこで使うのか(使わなかったらどんな不都合があるのか)がわかるところまで説明がないとか、(あなたが用意した研修での)説明が逆向きだと感じられている(※中身はいいから注意点を先に教えてよ! 「おしながき」をぜんぶ見せてよ! あなたがそこで握ってる紙きれ! それを直接、読ませてよ!)とか、そういうことなんですよ。わからないひとのことがわかっていないひとって、こうですね!
> 少なくともこの本を開く人の殆どは統計授業を受けているでしょうから、そういった人には「フムフム」という感じで読み進めることができると思います。
「入門書」とはいいがたいとの認識が示されたものと受け止めております。(違)
> 以前よりこの著者の統計書のわかりやすさ・題材の面白さは新任担当者に好評であったが、「マンガでわかる」とのタイトルからして一層のわかりやすさが図られているものと思い読んでみた。
共著の「病院管理学」のセンセイのほうを指してのご感想でしょうか。
> 多変量を扱う部分については、さすがにエッセンスを示すに留まってはいるが、因子分析や共分散構造分析の考え方が非常にわかりやすく簡潔に説明されており、著者の多変量解析への造詣の深さを容易に想像させる。
うそーん。…うそーん! 「10年かかった」(槙センセイ)という2000年5月の本書(技報堂出版)では不確かだった多変量解析が、2006年5月の「マンガでわかるナースの統計学」までに「造詣が深い!」とまで形容されうるほどにまで達するのかどうか、よくわかりません。
・田久センセイ
https://researchmap.jp/read0044585/
> 本文の60%を田久が担当した
おおー!(略)40%のうちのいくらかが小島氏で、残りが編集者による貢献だということです。(※ただしマンガを除く。)
> Excelで学ぶやさしい統計学
> JMPによる統計解析入門
> 医学、看護学の修士博士課程の学生にとってExcelでのデータ解析は基本として必要であるが、多変量解析など高度な解析を行うのは難しい。そこで、統計解析ソフトのJMPを用いた解説書を作成した。本書では単に統計ソフトの解説ではなく、自分で確率分布に従う乱数を生成し、集計して解析しながら統計学の基礎を学ぶ方法を示した。
上掲のカスタマーレビューは、主に(=60%ほど!)田久センセイを指してのご感想であろうと推定されましょう。
> 統計解析なんかこわくない
> SPSSやJMPなどの高度な統計ソフトを使用しなくても、保健医療福祉の学生ではExcelのみで十分に、卒業論文レベルの解析が可能なことを示した。
うーん。学校法人がケチだからExcelしか入れてくれない(略)…じゃなくて、田久センセイが多変量解析を(授業できるレヴェルで)習得なさった(&SPSSやJMPを入れてくれる大学に移られた?)のは、2002年8月より後のことなのではないかと邪推するものであります。(※まったく邪推です。)そういう一種「下世話」なことが、Rを誰でも使えるという前提に立つと、割とどうでもよくなってくるという…(いまとなっては「Excelだけでできる!」と「強弁!」しようというのは)なんだかなぁ。
※これまた「Rだけでできる!」のほうも、いいすぎると変になってくるんですよ。われわれアイスクリームの屋台みたいなところでかっこつけて(略)「バニラ大納言」については[3507]を参照。(※バニラ部はラクトアイスになります。)
・Google 川崎アゼリア「バニラ大納言あずき抹茶キャラメルリボンなどと意味不明な」…じゃなくて、「美味しいずんだソフトクリームあります」ございます付近(※本文とは無関係です)
https://goo.gl/maps/QVzruoksyYH2
https://goo.gl/maps/5xGDj7MnNgF2
※じぶんで「美味しい」と書いちゃいますかっ。(棒読み)歯磨き指導…じゃなくて、「手洗い指導!」みたいなのをお客さまに対しても完徹できるだけの覚悟があるんですかっ。(違)
再び「マンガでわかるナースの統計学」の目次を眺めます。
> 2-2 変数の種類
> 6-2 散布図を描く
> 7-2 重回帰分析その他
> 7-3 主成分分析
> 7-7 ロジスティック回帰分析
▼多変量解析に「切迫感」を持って取り組んでいただくには「変数の種類」まで立ち戻って「多変量対応!」みたいな何かを(指導上)埋め込んでおかないといけない、▼「散布図」から「散布図行列」への拡張を難しいと思わせないようにしておかないといけない、▼多変量データを直感的に把握する方法としてのクラスタリングと主成分分析(SVD)を先に説明し、そのあとに(PLS回帰に進むための基礎としての)重回帰分析を教えなければいけないとは思われるが、▼主成分分析を使う回帰(など)に取り組ませる以上はもはや「ステップワイズ法」は忘れていいのではないか(…はもはや! はもはや!! ほら、あの、なんとかいう海峡大橋みたいなのでランしていい汗(大巾に中略)出されたおしぼりでまだ手も拭いていないのに鱧が出てきたよみたいな…違いますってば! 拭くのは手ぇだけにしとくれやすぅ)、▼あまつさえそのあとに(「確率の回帰」と説明される)「ロジスティック回帰分析」を(「尤度の回帰」とも説明しうる「ベイズ推定」とセットにするでもなく『セット割れ!』みたいな状態で中途半端に)教える必要があるのかはよくわからない、ということが見えてきそうです。(※現時点での私見です。)
・「はもはも」ウィキペディアの見解です
https://ja.wikipedia.org/wiki/%E3%83%8F%E3%83%A2
> 食感が「はもはも」しているから、という説、口を張ってもがくことに由来するとみる説など諸説ある。
> 食感が「はもはも」しているから
> 食感が「はもはも」しているから
…うーん、京都ですのう。(違)「浦安停車の/京都です」については[3424]を参照。(もっと違)
・Google ストリートビュー 京都市交通局「南北に走る地下鉄烏丸線と並行して南北に走る地下鉄東西線」付近(※方角は目安です)
https://goo.gl/maps/bPNRDPM46SS2
https://goo.gl/maps/RZEavd8jaiE2
https://goo.gl/maps/muBiuo7XwLu
https://goo.gl/maps/g4qf8jaBF162
https://goo.gl/maps/dZkK4AqjixE2
https://goo.gl/maps/ghf7JQqRCZF2
・(再掲)『カスタマーレビュー』が続々と寄せられていますっ!!(2006年7月)
https://www.amazon.co.jp/dp/4779500575
> 数学オンチの私にも、各統計手法の違いなど、わかりやすかったです。
> 数学が苦手な方も、そうでない方も。
> 現代的多変量解析入門書
> 1)統計学,および数学の予備知識をほとんど必要としない,しかしながら,2)最低限の理論的側面は知りたい,3)叙述が丁寧であるが,4)ページ数は少なく,さらには5)実践的な使用例を知りたい,という実に「欲張りな」条件を満たしてくれる最良の書ではないだろうか.
> 本書を読み終えた後は,SPSS,あるいはR等の統計ソフトを用いて実際のデータに触れることにより,さらに多変量解析への理解と興味が深まることであろう.
・[3567]
> [3469]と同様に、ハンドブックの分担執筆ならびにハンドブックのほかの稿をぜんぶ見ての書き下ろしであるということが、2006年7月の本書につながっているのではないかと想像したくなってきます。
このナカニシヤ出版「多変量データ解析法 −心理・教育・社会系のための入門」(2006年7月)の表紙に書いてある「おしながき」みたいなのの順番が、なかなか「深い」んですよ。(※個人の感想です。)
> クラスター分析
…といって、この背景の楕円なんですよ。「深い」って、こうですね。(深)
> 主成分分析
2番目が主成分分析なんですよ。(同)
> 重回帰分析
> パス解析
> 確認的因子分析
> 構造方程式モデリング
> 探索的因子分析
さあさあわけもわからずコンピューターがたくさん置かれた大部屋みたいなところにスリッパで入室の上、鉛筆と消しゴムの使用を厳禁といわれながら「事務用回転イス!」みたいなのにちょこんと座らされての「Amos入門」…じゃないんですよ。(深)ここまで分解され、この順で説明されるというのは、たぶんすがすがしいと感じられそうですよ。本当でしょうか。
> 数量化分析
> 多次元尺度法
> 判別分析
ここまでとは別の観点から実際の調査や研究の実施上、使うことが迫られてくる技法(…いわゆるひとつのわざです! テクです! わざテクです!)を、しかし「つまみ食い」ではなく、なるべく体系化(※重複を省くということを含む)しようとなさった気配がにじみます。(※個人の感想です。)
・[3264]
> Excelでもよいですから『計算機』をつかって
・[3326]
> 我々『かわいい顔』で「表計算ソフトと呼ばれるエクセル!」のほうなど使っていいんですよ、の意。
> OpenOfficeのCalc、それにGoogle スプレッドシートでいいんですよぉ。いっけなーい! エクセル買ってこなくちゃ。エクセルみなみで買えるのかしら…などと(略)。
・[3330]
> 『模擬エクセル!(たぶんみなみ!)』の操作によって「48個の相関係数!」は出てきたけれども
> Excelでぱしゅっと出てくる相関係数をむにゃーっと
(冒頭とまったく同じことを繰り返しますけど)これはあくまで「Excel」ですよ。「Excel」だから本が(新古書店で)198円にまでなって「普及」するのですよ。遊び半分(※ふざけるという意味ではありません、まじめですよ&しかし「切実感」がない、の意)でも勉強できてしまう。これだね。我々むずかしい顔をしながら3,600円(+税)むずかしい本を読んでるじぶんかっけー(違)3,600円もかけたのだから勉強せねばなるまいて。そこまではいいんですけど、そうやって勉強したじぶん(たち)はえらい(※本流である)けれども遊び半分みたいに勉強しようとする輩はケシカラン(※邪道である)みたいにまでなっちゃうと、ちょっと違うんですよね。(※見解です。)
※分譲マンションが途中から値引きみたいなやつ! …えーっ。
・[3386]
> おお、楽しんでこそ本物! わたしのともだち!([3230])
・[3093]
> > 発表者はWelcomeの雰囲気を
※専攻した分野での業績としての、見落とされていた研究課題を見つけましたとか研究を遂行して考察しましたという部分は誇っていいんですけど、分析方法は道具なんですからね、の意。ようこそ歓迎「Welcome to Adobe GoLive 6」については[3508]を参照。
同じように、(「分析ソフト!」が)Excelだというだけで見下す、(「論文レポート!」が)Wordだというだけで見下すというのも、まったく的外れなのですよ。やーいカステラは和菓子か洋菓子かっ([3485])。出ました! ハレでも(ざーざー)アメでも(ごろごろ)アラシでも(ぴよぴよぴよ)うぃーあーざあーるういずえくせらー…ズ(ぱらぼーら)「R with Excel」([3527])っ。これだね。(※演出です。)
・「主成分分析」元デンソー氏の見解です(2016年9月11日)
http://techon.nikkeibp.co.jp/atcl/column/15/415548/091100016/?P=5&rt=nocnt
> 多変量解析を使わない場合のリスクを教えてください。
…ギクッ。
> 多変量解析を使わないあなたは、電流値を変える効果の大きさを知らず、時間しか見ていなかった。それでもめっき処理はでき、製品を造ることはできる。しかし、生産効率を落としていることには気付いていません。
…ギクギクッ!(※演出です。)
> 実は、かつてトヨタグループもそうでした。理論的な説明が中心の多変量解析の研修を行っていたところ、難しくて、技術者といえども実務で使いこなせなかった。研修の講座として学んでおしまいで、実践には至らない。それでは多変量解析を学ぶ意味はありません。
> こうして理論を学んだ上で手計算する方法をやめ、計算を自動化できるソフトウエアを使うことにしました。加えて、実践形式の研修を始めました。講義に加えて、職場から持ち寄った課題をテーマにグループワークを行う方法を取り入れたのです。すると、現場での多変量解析の活用率が飛躍的に伸びました。
> 「技術者塾」の講座も同様の手法で進めます。使うのは、統計的品質管理(SQC)解析ソフトウエア「JUSE-StatWorks」。
> まず、Excelにデータを入力する。
> 次に、そのExcelデータをソフトウエアに貼り付ける(取り込む)。
> 続いて、「多変量解析」ボタンを選択し、「重回帰分析」ボタンを選ぶ。すると、「回帰式」が出てくる。
> ここで「予測」ボタンを選択し、(略)簡単でしょう?
トヨタグループの「R with Excelみたいなの(※ここでは「JUSE-StatWorks」だけが示されていますが、だからといってRをまったく使わないかどうかまでは明示されていません、の意)」が、だいたいそのような時期であるということですから、順々にみなさま、「R with Excel」することになっていく(※「なって」に傍点:ほぼ自力で研修内容を刷新したトヨタグループとは違って、じぶんではよくわからないけれどもそういうことらしいといって「なって」いく)と見受けられるところにございました。
※「ほぼ自力で研修内容を刷新した」のが「トヨタグループだけ」とはいっていないことに注意、の意。
・[3403]
> わたしたち最大にして最大を誇る(えっへん☆)弱点は、プログラミング教育といえばいかにしてその効果を最大化すべきかを単独で考えようとし、統計教育といえば、同様に単独で考えようとした挙句、既にプログラミング教育と呼ばれる至高の目標だけで「おなかいっぱい☆」だということです。これ、弱点なんです。ある1つのことをカリカリチューン([3018])で突きつめることを議論だと、それができることを専門性だと、思っていてはいけないのですよ。わあぃテストに出ます!(棒読み)
・「共分散構造分析 R編」東京図書(2014年4月)
https://www.amazon.co.jp/dp/4489021801
わあぃ東京図書! …東京図書ですよ東京図書。
> (カスタマーレビューより)
> イラストは昔の受験参考書みたいな感じですが
> イラストは昔の受験参考書みたいな感じですが
ぐふっ! HISさん扱い「知床第一ホテル」より「朝食専用マルスコイ」のイメージについては[3550]を参照いただいちゃいます! わあぃエアチェックぅ。
> 共分散構造分析をRでこなしたい人には、おすすめです。
ほぉお!(略)
> 同じ著者の書いた「共分散構造分析 入門編」を詳読することをお勧めします。豊田先生の書かれたものは、詳しくわかりやすく、手抜きは絶対にしないという気構えが伝わってきます。
> R関数lavaanの使い方をこの本で学ぶというのが良いと思います。
lavaan関数、使っていいんスね? …いいんスね!? そこがわからなくて困っていたとはこのことだよ。(違)
・本日はさいごにもう1度「主成分分析の結果から一次元構造が確認される」最新の用例です(2017年9月29日)
https://www.jstage.jst.go.jp/article/jans/37/0/37_37018/_html/-char/ja/
> 下位尺度ごとで,固有値を1以上とし主成分分析による確証的因子分析を行った.そして,下位尺度が一次元構造であるかを確認した(村上,2013).
> 下位尺度ごとに主成分分析を行ったところ,1つの主成分が抽出された.主成分負荷量は 0.811以上で寄与率は 72.8%以上であり強い一次元構造が確認された.
いわゆる『論文レポートの報告文例!』って、こうですね!(棒読み)
この話をここまでだいたい書いたときにふと、[3080]がアレだといって、いまさらながら追記しました。…いまさらすぎるって、こうですか。わかりませーん…。
|