フォーラム - neorail.jp R16

【自由研究】の話題

 → 茨城県内で必要な「主論文・野帳・掲示物」とは? 【詳細】(2017/10/19) NEW!
 → 【自由研究】の記事一覧(新着順)


【研究ホワイトボックス】

研究を楽しく「追体験」! 真っ白のキャンバスに虹色の未来を描く方法、教えます。
R with Excel prcomp | kmeans・hclust | rpart | ggvoronoi | spantree | lm NEW!


発行:2017/12/3
更新:2018/5/22

[3574]

【研究ホワイトボックス】

研究ホワイトボックス(28) 多変量データの全域を考察するには〜駅弁の商品構成を例に(中編)


主成分分析とは何か【MCAあり】
「主成分得点」「構造ベクトル」を使って考察するには
表0.6 主成分分析の結果(累積寄与率)
表0.7 主成分得点
表0.8 各弁当における主成分得点の絶対値が最大となる主成分
表0.9 各主成分における主成分得点の絶対値が大きい弁当(上位3位)
表0.10 構造ベクトル(主成分と元の変数との相関係数)

(約15000字)

 前編([3573])からの続きです。


★主成分分析とは何か【MCAあり】


 これより主成分分析に入ってまいります。

※このフォーラムで主成分分析をすることになろうとは…うっうっ、の意。

■表0.6 主成分分析の結果(累積寄与率)

PC1PC2PC3PC4PC5PC6PC7
Standard deviation1.8821.2910.9820.8260.3440.1300.090
Proportion of Variance0.5060.2380.1380.0970.0170.0020.001
Cumulative Proportion0.5110.7440.8820.9790.9960.9991.000


・「主成分分析の結果(累積寄与率)」のイメージです
 https://neorail.jp/forum/uploads/pca_n18p7_bento.png

https://neorail.jp/forum/uploads/pca_n18p7_bento.png


・スーパーえむジンせんせい「逆」とは
 http://www.cis.doshisha.ac.jp/mjin/R/24/24.html

 > 主成分分析で求まる主成分および主成分得点の正負の符号は、固有値及び固有ベクトルを求めるときのアルゴリズムが異なると逆になる場合がある。
 > つまり、個体の散布図を描いたときに、異なるアルゴリズムによる結果の上下が逆になったり、左右が逆になったりすることがある。主成分分析で行う分析は、変数間、個体間の絶対的関係ではなく、相対的関係であるため、分析には問題がない。

 いちばん大事なのはここですよね&先に言ってよみたいな(略)メッソウではございました。

 > 分散共分散行列を用いる場合は、一般的には累積寄与率70%〜80%を大まかな目安とし、累積寄与率がこれを超える主成分まで用いて分析をすることが多い。
 > 相関行列を用いた主成分分析の場合は、固有値の値が1前後になる主成分まで用いるのが1つの目安である。

 Rのprcomp関数で出てくる「標準偏差」が「1前後」という見かたでよかったでしょうかからの、その基準でいっても(KY軒の弁当でいう)第3主成分は必ず考察に含めなければならないと判断できようかというところでございます。

 主成分分析(ひいてはMDS)を使いながら、(可視化の都合だという言い訳をしながら)あらかじめ第2主成分までしか使わないと決めつけてしまうような分析例も散見されましょう。

 しかし、主成分分析を使って無理にでも(=情報の一部を捨ててでも)次元を減らしたいというニーズが出てくるようなデータというのは、きっと「本質的な次元の数」がやたら多いのですよ(≒減らしようがないのですよ)。そのような「じゅうぶんに多変量な多変量データ」にあって、いずれかの基準で「第2主成分まででよい」と判断できる場合のほうが珍しいのではないかと想像するところにございます。

※まったくデータしだいであり、一般的にこうだと決めつけられない話であるとの理解にはございます。

・各社「ねんど板」ございます付近
 https://storage.topvalu.net/assets/contents/images/product/11076/4901810983315_PC_L.jpg

 「ねんどばん」に残った粉みたいなのをぜんぶ集めたみたいなのが第7主成分(固有値が最も小さいソレ)だというイメージではございました。ばんじょー!! 我々『切りたった崖の下から「てんかのけん」と書かれた矢印…いえ、いわゆる断崖絶壁みたいなのを仰ぎ見るみたいな顔!』で(中略)ここではあくまで、大きいほうから見ていきます。「「岩屑(がんせつ)」から「砂」そして「沈泥」まで」については[3566]をなめらかに参照。(※こけは含まれません。)

・ばんじょー!!「ホテル竜飛」近畿日本ツーリストのイメージです