フォーラム - neorail.jp R16

【自由研究】の話題

 → 茨城県内で必要な「主論文・野帳・掲示物」とは? 【詳細】(2017/10/19) NEW!
 → 【自由研究】の記事一覧(新着順)


【研究ホワイトボックス】

研究を楽しく「追体験」! 真っ白のキャンバスに虹色の未来を描く方法、教えます。
R with Excel prcomp | kmeans・hclust | rpart | ggvoronoi | spantree | lm NEW!


発行:2017/11/19
更新:2018/5/22

[3567]

いま問う「正射影ベクトル」からの「凸最適化」を『ほぼSVM』と読み解くココロ(試)


朝倉書店「多変量解析実例ハンドブック」かく語りき(1)・(36)
「ポリグラフ検査」を読み解く(仮)
朝倉書店「多変量解析実例ハンドブック」かく語りき(63)・(51)・(53)
表1 現代の水準で新規「TP」「TN」「FP」「FN」を見渡してみる(※用語を記号に揃えただけです)

(約23000字)

 [3564],[3566]からの続きです。


★朝倉書店「多変量解析実例ハンドブック」かく語りき(1)・(36)


※括弧の数字は章番号です。

・朝倉書店「多変量解析実例ハンドブック」
 http://www.asakura.co.jp/books/isbn/978-4-254-12194-0/

 本書の索引に「決定木」はありません。なんと、本書の索引に「決定木」はありません。同じく、索引を見る限りでは「ランダムフォレスト」も出てきません…いえ、本書は2002年6月なので、「ランダムフォレスト」が出てこないのはしかたがないといえましょう。しかし「SVM」「サポートベクターマシン」も出てこないんですよ。…なんてこったい。(※一部の表現は演出です。)

 それでは本書は(工学部の学生がいまから参考にしようとすると)まったくアレかといって、とんでもない!

・線形判別:1,4

※数字は掲載ページです。

 索引で「線形判別」を見つけて(※勉強途中の学生が見つけられるかは別の問題です)出てくるのが、最初の稿です。

・1. 判別分析法によるポリグラフ反応の識別

※数字は章番号です。

 > 分析法は線形判別,ノンパラメトリック判別やニューラルネットによる手法などを取り上げ,交差検証法やブートストラップによる方法で識別率を評価した結果,線形判別の結果をはじめ,比較的高い成績が得られた.識別の基礎になる事後確率の分布や判別手法間の類似・非類似関係も検討した.
 > [足立浩平]

 ぬおー(略)「キミたちSVMしかわからんじゃろ」みたいな解説を読むより楽しそうですよ。えー、どれどれ?(以下略)

・ご近況のイメージです
 http://researchmap.jp/read0053596/
 https://images-na.ssl-images-amazon.com/images/I/81DgQJBhZ3L.jpg

 このキャリア上、業績(論文)の数じゃない評価指標で(も)評価されないと不利であるという、このかた自身が多変量解析を欲しているようなキャリアにも見えてまいります。「いわば切実なかたちで」とは、こういうことをいうのですよ。(棒読み)

・『カスタマーレビュー』が続々と寄せられていますっ!!(2006年7月)
 https://www.amazon.co.jp/dp/4779500575

 > 数学オンチの私にも、各統計手法の違いなど、わかりやすかったです。

 > 数学が苦手な方も、そうでない方も。

 > 現代的多変量解析入門書
 > 1)統計学,および数学の予備知識をほとんど必要としない,しかしながら,2)最低限の理論的側面は知りたい,3)叙述が丁寧であるが,4)ページ数は少なく,さらには5)実践的な使用例を知りたい,という実に「欲張りな」条件を満たしてくれる最良の書ではないだろうか.
 > 本書を読み終えた後は,SPSS,あるいはR等の統計ソフトを用いて実際のデータに触れることにより,さらに多変量解析への理解と興味が深まることであろう.

 [3469]と同様に、ハンドブックの分担執筆ならびにハンドブックのほかの稿をぜんぶ見ての書き下ろしであるということが、2006年7月の本書につながっているのではないかと想像したくなってきます。

[3469]
 > わたしたち、わかった気になれる分析ツールがいいんです! メッソウもフタもあったものじゃありませんっ! …あ゛ーっ、背中のネジが飛んでゆくぅ。(※実在する背中のネジとは無関係であり、演出はイメージです。)

 …コレジャナイ。

 > 事典の執筆の直後の書き下ろしかなぁ、といって期待が高まってまいります。
 > 「現代数理科学事典」の記事に具体例を添えて講義っぽくしたような本かなぁと想像してみます

 同じ目で見たとき、索引で目に留まるのは「正射影ベクトル」でございます。

・正射影ベクトル:399

・36. 多次元尺度構成法を用いた運動イメージの分析

 > 短距離走の運動イメージを収集するため,438名の大学陸上競技選手に自由記述法による第1次質問紙調査を実施し,その内容を224項目にまとめた.次に,これらの各項目の主観的重要度を7段階評定法で評価する第2次質問紙調査を543名の大学陸上競技選手に実施した.1から相関係数を引いた身体部位別(頭部,上肢部,体幹部,下肢部)の項目間の非類似性の行列を算出し,イメージを体制化している特性の性差について(略)SEM(単純ユークリッド距離モデル)やWEM(重み付きユークリッド距離モデル)をCOS-CAL,MDSCAL,SMACOF等で当てはめて仮説を検討した.男女の次元を比較するには,一般プロクラステス回転や重回帰分析を適用した.最後に各項目の経験的重要度を主観的重要度の評定値の標本平均値で設定し,経験的重要度と次元との関係を検討するため,経験的重要度を従属変数,各次元を独立変数とした線形重回帰分析を適用した.これらの分析の結果(略)

 何の略かわからない略語が出てきます。

 > ユークリッド距離モデル(Euclidean distance model)を適合し,その適合度からどのモデルが妥当かを判断した.
 > SEM(単純ユークリッド距離モデル;simple Euclidean distance model)
 > WEM(重み付きユークリッド距離モデル;weighted Euclidean distance model)
 > モデルの適合度を比較するためには,共通した目的関数を用いるMDS(多次元尺度構成;multidimensional scaling)法を用い,その目的関数の値で比較すべきである.そこで,すべて距離における最小2乗基準を目的関数とする方法を採用した.

 このあと、IF〜ELSEIF〜ELSE文みたいなのが(文章で)ごそっと書かれてございます。この中で▼「COSCAL(Cooper,1972)を変型した手法(以下,ICOSCAL)」、▼「MDSCAL(Kruskal,1964a,b)を変型した手法(以下,IMDSCAL)」、それに▼「Krane(1978)の方法(以下,KRASCAL)」、▼「SMACOF(scaling by maximizing a convex function; de Leeuw & Heiser,1977)」がぐちゃっと使い分けられていきます。(※感想は個人です。)

 > 上記の方法はいずれも代数的に解が得られず逐次法を用いるため,初期布置(初期値)を必要とする.本来であれば多くの初期布置を用いて解析し最良の解を選択すべきであるが,本章では局所最小解や退化した解に陥る確率が少なく,かつ,少ない反復回数で収束するという点で優れていることから,Torgerson(1952)の古典的な計量的MDSによる布置を用いた.

・Wikipedia「bivariate convex function」のイメージです
 https://upload.wikimedia.org/wikipedia/commons/6/6e/Grafico_3d_x2%2Bxy%2By2.png
 https://ja.wikipedia.org/wiki/%E5%87%B8%E6%9C%80%E9%81%A9%E5%8C%96

 > 凸最適化問題とは(…ざっくりざっくり!)を見つけることである。

・ウィキペディア「サポートベクターマシン」のイメージです
 https://ja.wikipedia.org/wiki/%E3%82%B5%E3%83%9D%E3%83%BC%E3%83%88%E3%83%99%E3%82%AF%E3%82%BF%E3%83%BC%E3%83%9E%E3%82%B7%E3%83%B3

 > 最適化問題の一種である凸二次計画問題で定式化される。

 うーん。(あくまでいまとなっては)まどろっこしいとはこのことだよ。(棒読み)メニューから選ぶだけ(※)でぱしゅーっと(中略)というのでなく、あくまで自力で、中学・高校の数学からの幾何学的な理解(=ベクトルに関する単元ぜんぶ)を積み上げて同様の計算に取り組むとあらば、「凸最適化」(※「SMACOF」)なのだと、こういうわけです。つまり、2002年6月の朝倉書店「多変量解析実例ハンドブック」にあって「SVM」「サポートベクターマシン」との(一種『モダン』な)単語が見つけられなくても、「36」の稿は、(歴史的に「SMACOF」などといって)ほぼSVMと同じことをしているのだと(…『ほぼSVM』!)理解しなければならないわけです。

※このようなまどろっこしさは同ハンドブックの全域にわたって散見されるといっても過言ではなく、例えば主成分分析でいえば、(現在の読者から見て)したいことは主成分分析(による次元削減)だけなのに(慣れ親しんだ)MDSのほうのルーチンを使っちゃうっぽい…げふ。ひとのことはいえんですのう。(棒読み)

※3次元をあたりまえのように超える多変量を前提としているので、仮にセンセイが幾何学的な説明を『歴史的な経緯ゆえ「白板」と呼び下されながらも愛用される可搬式の平面上!』で繰り広げたとしても、(理系でない)学生としては実際の計算との間に著しい飛躍があるように感じられるのではないでしょうか。多次元空間上での凸関数みたいなのをきちんと説明する(センセイの)クロ