フォーラム - neorail.jp R16

【自由研究】の話題

 → 茨城県内で必要な「主論文・野帳・掲示物」とは? 【詳細】(2017/10/19) NEW!
 → 【自由研究】の記事一覧(新着順)


【研究ホワイトボックス】

研究を楽しく「追体験」! 真っ白のキャンバスに虹色の未来を描く方法、教えます。
R with Excel prcomp | kmeans・hclust | rpart | ggvoronoi | spantree | lm NEW!


いま問うA9のココロ
信号機のG現示の色がこんなにメロンソーダなわけがない
ATC・ATSの「Aの字」も出さずに効果音と動作を実装するには
「場内信号機 作り方」「信号機に名前をつける機能」とは


発行:2017/12/19
更新:2019/3/30

[3584]

【研究ホワイトボックス】

研究ホワイトボックス(30) ハイパー・ゼロ:「主成分分析」FAQ


「主成分分析」に関する質問の例
「主成分回帰(PCR)」を回答とすべき質問の例
「判別分析」を例示すべき質問(「共分散構造分析」を回答とすべき質問)の例
「階層的クラスタリング」を回答とすべき(?)質問の例
Rの「prcomp関数」と「princomp関数」の違いに言及すべき質問の例
「いわゆるマルチコ」の指摘を回答とすべきでない質問の例
「いわゆるマルチコ」を指摘して「非階層的クラスタリング」を回答とすべき質問の例
「R」ではなく「Scilab」の入門書を紹介すべき場合
表30.0 言語としての「R」(※独自に作成)
「主成分分析」FAQ(ドラフト版)

(約59000字)

 このフォーラムでは、「研究ホワイトボックス」と題して30回、「研究を楽しく「追体験」! 真っ白のキャンバスに虹色の未来を描く方法、教えます。」とはいいながら、さらに「ハイパー・ゼロ」と副題すること既に4回というコンテキストにございます。

 このフォーラム、(従来のBBS的な運用をしていた時分の)「FORUM×ATOS」としての初期の段階(1999年度)では、きっと管理工学(『OR!』)からの(応用としての)数理計画法の話題に進んでいくものという期待もあったかもしれませんしなかったかもしれません。

 専門分野そのものには立ち入らず、しかし広範な事情を承知して社会を理解していく、16歳から19歳くらいまでの3年間に(制度としての高校と大学にまたがって)何を知りたいか(どんなテーマにワクワクするか)ということに対して、多変量解析は外せないぞと、こういうわけです。その「かんどころ」(=勘どころ&関所、両方の意味で=)となるのが「主成分分析」であろうといって、しかし、17歳くらいまでに学ぶ(理科としての)「物理」の(3次元までの)イメージに頼って「多変量」を理解しようとするのでは(のちのち)支障があるという認識にございました。

※同様に、あくまで理科としての「化学」「生物」「地学」という、試料や標本という『現物』ありきでのデータ解析だけに即して学習を進めていると、より(数学的に)抽象的な解析手法の(柔軟な)活用への(考えかたや試行錯誤の)道筋に興味を持たなくなってしまうと心配されましょう。

[3543]
 > ・島津製作所「粉博士」の見解です
 > > 「粒子の形状の影響による粒度分布の誤差はどの程度ですか?」という質問に出会うことがよくあります。
 > > 粒子の形状をあまりに複雑に表現すると、実用性が損なわれます。現状の粒度分布は、横軸に粒子径、縦軸に相対粒子量という2次元のグラフで表現できます。長径と短径を用いる場合も3次元のグラフで表現できます。しかし、それ以上のパラメータで粒子形状を表現しようとすれば、グラフで表現することが不可能になります。複雑な数表としては表現できても、その内容を人間が把握できなければ、単なる数字の羅列であって、実用性があるとはいえません。
 > > 逆に粒子の形状を単純化してしまえば、現実の粒子の形状が表現できていないという不満が残るでしょう。結果的には球相当径を用いるのと五十歩百歩ということも考えられます。
 > > 結局、多数の粒子(粒子群)をある意味で統計的に処理し把握しようする粒度分布測定においては、粒子の形状を取り扱うこと自体に無理があるのかもしれません。
 > > 研究としては、興味深いものがありますが、実用にはならないような気がします。

 このような理解や態度でも島津製作所での業務に支障はないということなのでしょうけれど、(高等)教育としては何かに大きく失敗しているのではないかという反省がないでしょうか。…ギクッ。

 これまた「主成分分析」そのものに深入りすることなく、しかし『深い』とみなされうる理解をしておきたい(≒浅いといわれぬよう&いちいちじぶんは浅学だといってみせたりしなくていいよう)という無理難題を、これ、実は無理難題ではなくて「あたりまえのこと」なのだと(※ここでぜんぶ述べるとたいへん長くなりますから大巾に中略させていただきまして)「主成分分析」をひととおり、次は深層学習ですっ! …えーっ。その前に「主成分分析」を理解できたのかどうか(じぶんで)確認しておこうではありませんか。

 そういう意味合いから、ここでは「主成分分析」に関するけれども「主成分分析」そのものに対する質問ではない質問を俯瞰しながら、「主成分分析は何ではないか?」的な見かたによって、「主成分分析」の理解を定着していこうと、このようなコンタンであります。

 なお、この記事はパスファインダーの作成を追体験いただくための記事であり、この記事をそのままパスファインダーとして使用しないでください。

・「パスファインダーとは」千葉大学附属図書館(2008年度)
 https://www.nii.ac.jp/hrd/ja/literacy/h20/txt4.pdf

 > 「わかりやすく言えば、利用者が特定の主題に関する情報収集を図書館で行う際の、最初のとっかかりとなる図書館資料のガイドもしくは要チェックリスト」

 > 「利用したことがある」は12%に留まり、「まったく知らない」が30%となり、周知がまだ充分でないことを示す。

 周知しさえすれば利用されると考えているんですね、わかります。(棒読み)

 > 教える側からすれば「せめてこの1冊はちょっと読んでみろ」的な紹介が一番なように思っています(つまり授業で「これは読め」って感じの印象をつける紹介ですね。)

 それは既に理解の過程を終えてしまった、「わからない状態とはどんな状態であったか」を忘れてしまっている者の感覚なのですよ。わかってから読むと納得感の高い「1冊」であっても、わからない状態でそれを読むことはどういうことかといってですね(以下略)うらめしやー。(※演出は表現です。)


 この記事は[3582]の補足です。「ハイパー・ゼロ」としては[3521]の続きです。本文中の記事番号は過去の記事へのリンクになっていますので、あわせて参照ください。(しないと意味不明な記述もございます=あわせて参照されることを前提としています。)

 「因子分析」については[3587]で補足しています。


●「主成分分析」に関する質問の例


 いくら困ったからといってインターネットで(第三者に)質問するのはアレです。そういう意味では逆に、よほど困ったんですね、という意味で、「教えて!goo」では「主成分分析」という文字列を含む質問が、「心理学」カテゴリでは22件、全体では290件あるということです。

 「適合度順」でぱらぱらと眺めながら、▼主成分分析そのものについて説明することが回答となる質問や、▼いくら演習であるとしても変量が少なすぎて(3つとか)意味がわからないよ、それに▼ググれと(…gooなのに!)回答されてるみたいな質問はスキップしてまいります。

※この「適合度順」の(20件ずつ表示の)8ページ目から岩石などの主成分が出てくるので、ここで閲覧を終えました。つごう、上から150件くらいまでをざっと眺めたことになります。

※あわせて、Y社サイト(「約1,260件」とのこと)については…何の順かわからないですけど何らかの順で表示されるのを上からちょっとだけ(5ページ目まで)、O社サイトについてはGoogle検索結果の上位に出たものだけを眺めます。あしからず。

※レファレンス協同データベースも見たんですけど…、▼談話分析の博士論文(「ポライトネス」)で「カテゴリ主成分分析」、それに▼「泌乳中期のサーバル」なんだねっ。ヒットする4件とも、「主成分分析」に関するレファレンス事例ではなかったことを申し添えます。ほかに「多重共線性」は0件、「因子分析」は7件でございます。

・(再掲)レファレンス協同データベース「統計の取り方で、多変量解析の一種である数量化III類について、具体的な数式やプログラミングの例が載った資料はあるか。」豊中市立図書館(2011年8月10日)
 http://crd.ndl.go.jp/reference/detail?page=ref_view&id=1000099920

 「事前調査事項」「寄与者」など空欄なんですよねぇ。(棒読み)

 > 『多変量解析がわかる』涌井 良幸/著(技術評論社)

 後述のように、古典的「量的か質的か」という『2択!』をさせられて「おぬしは数量化III類なされよ」といわれて「ハハー!」しちゃったみたいなひとが図書館に駆けこんでくる…駆けこみ××はおやめくださいっ!(棒読み)…じゃなくて、そこはもう高い壁の向こうにボールは届かずとも声は届くみたいな(?)「主成分分析」でいいんですよ(※ちゃんと「解析」したいなら「主成分回帰(PCR)」で「回帰分析」しないといけないんですよ)と誰かおっしゃってくださらないかしら。(※表現はきわめて演出です。)

※あくまで図書館としては、参考図書(『館内』で『禁帯出』)として「多変量解析実例ハンドブック」と「現代数理科学事典」を備えておき、それらしき質問(=レファレンスカウンターでの質問です)には「多変量解析ですね?」と聞き返し、お客さまお客さま…患者さまじゃなくて利用者さま!! 首を斜めに振ったとしても、もはや質問は多変量解析であったと決めつけてこの2冊を自動的に持ってくればいいんですよ!!(…ぼうろんです!!!)

・内田洋行さん通しキハラ「禁帯出」(345円)のイメージです
 http://www.uchidas.net/shop/g/g86176267/
 http://www.uchidas.net/img/goods/L/vol11d-86176267_L.jpg

・青木センセイ「このページは, 質問に答えてゆくことにより,条件に合った最適の統計手法を提示するためのものです。」から「ケースと変数の両者について,似通ったものが近くに配置されるような解を求めます。」に至るルート(…長っ)
 http://aoki2.si.gunma-u.ac.jp/FlowChart/Tutorial.html
 http://aoki2.si.gunma-u.ac.jp/FlowChart/sonota.html
 http://aoki2.si.gunma-u.ac.jp/FlowChart/tahenryou_yes.html
 http://aoki2.si.gunma-u.ac.jp/FlowChart/not_yosoku.html
 http://aoki2.si.gunma-u.ac.jp/FlowChart/grouping.html
 http://aoki2.si.gunma-u.ac.jp/FlowChart/object.html
 http://aoki2.si.gunma-u.ac.jp/FlowChart/kanyakuka.html
 http://aoki2.si.gunma-u.ac.jp/FlowChart/catdata.html

 > 数量化III類 QT3
 > 双対尺度法 DUAL

 青木センセイがごしょーだいじそうににぎりしめてるあみだくじみたいなかみきれの『ぜん貌!』を直接、見たいですよね。…見たいですよねっ!!(棒読み)

・…あるにはあるよ。
 http://aoki2.si.gunma-u.ac.jp/FlowChart/relation/relation.html

 朝倉書店「多変量解析実例ハンドブック」でいう「多変量データ解析法の分類(柳井(1994 b)の図1を一部変更したもの)」みたいな図については[3571]を参照。

・レファレンス協同データベース「寄与者」の記入がある事例です(「キーワード:統計」)
 http://crd.ndl.go.jp/reference/detail?page=ref_view&id=1000109681
 http://crd.ndl.go.jp/reference/detail?page=ref_view&id=1000130794
 http://crd.ndl.go.jp/reference/detail?page=ref_view&id=1000059837
 http://crd.ndl.go.jp/reference/detail?page=ref_view&id=1000032597
 http://crd.ndl.go.jp/reference/detail?page=ref_view&id=1000049565

 > 昭和女子大学図書館
 > 調べた範囲ではわかりませんでした。
 > 寄与者
 > コメント提供館:近畿大学中央図書館

 > 香川県立図書館
 > 寄与者
 > 同志社大学図書館
 > 国立国会図書館「リサーチナビ」

 > 香川県立図書館
 > 寄与者
 > 岡山県立図書館
 > 国立教育政策研究所教育研究情報センター教育図書館
 > 近畿大学中央図書館

 > 埼玉県立久喜図書館
 > 労働省産業安全研究所に問い合わせ、郵送で関連資料を送ってもらう。

 > 大阪市立中央図書館
 > 寄与者
 > 独立行政法人 農業・食品産業技術総合研究機構 果樹研究所

 なお、「キーワード:数学」は105件あるということですが、「寄与者」に大学図書館や研究機関の図書館が挙げられているレファレンス事例はなかったことを申し添えます。

・(もしかすると再掲)レファレンス協同データベース「Rプログラムについての本はないか?」大阪教育大学附属図書館(2014年11月26日)
 http://crd.ndl.go.jp/reference/detail?page=ref_view&id=1000218316

 > 「R」の意味をGoogleで検索。
 > 「R」の意味をGoogleで検索。

 …ぐふっ。聞きまして? 大阪教育大学附属図書館ですよ。…えーっ。大阪教育大学教科教育学論集より「模擬授業でのレーダーチャートによる授業観察」(2013年)については[3398]を参照。

 > 007のプログラミングの分野ではなく、SPSSと同様に主に417数学統計の分野に集まっている。

 やーいカステラは和菓子だと言い張って和菓子屋にカステラを置かせるみたいな(※長くなるので略)ーっ!! SASはディズニー、SPSSはテリヤキ、Rは大学生協とか(道路の)SAPAみたいなのだと思っておけばいいんですよ。…その発想はなかった!(棒読み)

・レファレンス協同データベース「統計数理研究所」が出てくる事例(2013年6月19日)
 http://crd.ndl.go.jp/reference/detail?page=ref_view&id=1000135535

 > 個人のホームページであるが、言葉を入れて検索すると件数も表示される。

 …うーん。

 > (1)インターネット検索をしてみる。
 > ・統計数理研究所にて、「源氏物語」の言葉を数量的に分析するデータベースの作成についての中間報告らしきレポートが出されている。

 …うーん。

・レファレンス協同データベース「2次以上の方程式をExcelを使って解く方法を知りたい。」さいたま市立中央図書館(2009年3月24日)
 http://crd.ndl.go.jp/reference/detail?page=ref_view&id=1000057881

 > 【資料4】『技術者のための数値計算入門』 相良紘/著 日刊工業新聞社 2007
 > 【資料4】p.85〜101には、エクセルのVBAプログラムとゴールシーク、ソルバーを使って方程式を解く方法、はさみうち法、2分割法、単純代入法、ニュートン法それぞれの説明、p.103〜114はVBAプログラムとゴールシーク、ソルバーを使った連立非線形方程式の解き方が記載されている。

 あくまでExcelで解こうとなさいますか。…うーん。「いわゆる多変量解析」ではない技術計算のニーズに公立図書館でお答えするというのはちょっと荷が重くないですかねぇ。(※あくまで感想です。)翻って、近年(中略)Rを使いさえすればという「いわゆる多変量解析」としては、「多変量解析とは何か(なぜ必要なのか)」という問いに対する最初の明快な答えとなる「主成分分析」が一種『入口』になる気配があるので(※重回帰分析より先に主成分分析です!)、じぶんは使わないけれども質問があれば答える必要があるひと(※図書館に限りません)に役立てていただければと思います的に、網羅的に見ておこうと思いました。

・教えて!goo「分光分析装置等により得られたスペクトルの主成分分析、およびその主成分スコアの導出方法」(2017年11月2日)
 https://oshiete.goo.ne.jp/qa/10033881.html

 > 分光分析装置などによって得られたスペクトルデータを用いて主成分分析を行う際に、主成分スコアをどのようにして算出しているのか(スコア軸の取り方)が分からない
 > LIBS分析装置(LIBS:Laser Induced Breakdown Spectroscopyの略)

 > (回答1)
 > スペクトルデータの場合は周波数成分ごとのスペクトル強度を並べた多次元ベクトルです。

 えーっ。

・「LIBS」のイメージです
 http://www.g5-hakuto.jp/mass/lalibs/laser_breakdown.html

 > LIBSにより得られるシグナルの例

 > スペクトル分布マッピング

 > レーザー波長は213nm、266nm、532nm、1064nmから選択可能。532nm、1064nmはLIBS用の仕様となります。

 > 3種類のLIBS検出器(2つまで選択可能)
 >  Scanning Czerny Turner 分光器/ICCD検 出器(測定波長190nm〜900nm)
 >  Echelle 分光器/ICCD検出器(測定波長190nm〜900nm)
 >  マルチチャンネルCCD検出器(3channel 〜 6channel、測定波長190nm〜1040nm)

 http://www.g5-hakuto.jp/mass/lalibs/images/image_signal.gif

 > (プロットの画像より)
 > PC Score 1
 > PC Score 2

 なるほどこういうプロットが、しかも『考察には使うでないぞ(見るだけにしといてや)』的な表示(「This is for visualization only.」)とともにポヤンと出てくると、こういうわけらしいです。…なるほどねぇ。質問者は、じぶんでプロットするわけではないので主成分分析の説明を必要としているわけではなく、この装置付属のアプリケーションみたいなのがいきなり出してくる「PC Score 1」「PC Score 2」の意味が知りたいのだと、たぶんこういうわけです。…それはメーカーにお聞きなさいよ。んだんだ。(※見解です。)

 > LIBS結果の解析、データベースマッチング、測定結果のデータベース化

 このアプリケーションとしては、あくまで検索のための(文書検索でいう)文書ベクトルと検索語ベクトルみたいな感じに使うという実用的な目的で主成分分析しているとか、そういうことって、ありません? えー、どれどれ(略)。データベースを使う責任はすべてユーザー側にあるぅ。…えーっ。

※この装置のマニュアル等を確かめたわけではなく、あくまで一般的な早合点です。

・教えて!goo「統計学の観点からもっと詳しく書いてくるように」付近(2007年6月20日)
 https://oshiete.goo.ne.jp/qa/3100706.html

 > 主成分分析の本質をまとめ
 > 対象となるものは
 > 「相関関係のある多変量のデータに対して主成分分析を行う」
 > と書いたところ教授から
 > 対象となるものを統計学の観点からもっと詳しく書いてくるように
 > 指摘されました.

 10年前だからいいですよね。

 このレヴェル(※手元のデータが分析できさえすればいいのではなく、主成分分析について深く理解しなければいけない)で主成分分析について報告するのであれば、「相関関係のある多変量のデータ」という表現(※言葉! 用語!)がいけないのだと、多重共線性という用語を導入しながら、「相関関係のある多変量のデータ」とはどういうものかを(「統計学の観点」で)詳述せよ、ということですよね。んだんだ。(棒読み)

 > (回答3)
 > というのは具体的にどのようなデータなのか分からないということでしょう。私自身、相関関係のある多変量データとはどういうもののことをいうのか理解できません。

※きわめて雑に省略されている主語などを補います。(恐縮です。)

 > というのは具体的にどのようなデータなのか(この説明では)分からない(よ、と教授が言っている)ということでしょう。(こんな説明しかされなかったら)私自身(も)、相関関係のある多変量データとはどういうもののことをいうのか(教授と同じように、この説明では)理解できません。

※3番目の回答者は言葉足らずなうえに婉曲すぎます。しかし、リアルタイムで即答しちゃうと学びの機会が失われます。(リアルタイムでの回答としては)指導教員とよくコミュニケーションを図るように、としかいえないのではないですかねぇ。4番目と5番目のひとはどんどんハマっていきますぞ。…なんだかなぁ。

 あわせて、その多重共線性に対して、主成分分析がどのように有効なのかということも(「統計学の観点」で)説明しつくさないと合格できそうにありません。…さすがですのう。(※素朴な感想です。「行列が特異でないとはどういうことか」あまつさえ「数学の観点で」「証明を」とまではいわれていないだけ、少し助かるじゃないですか。…その発想はなかった! =主成分分析ができるかできないかというのが数学で、主成分分析をすると何がうれしいのかというのが統計学だということです。)

・教えて!goo「第二主成分を求める手順、式変形、式変形が成り立つ理由がいまいち理解できません」(2007年6月11日)
 https://oshiete.goo.ne.jp/qa/3073104.html

 > ありがとうございます!
 > 理解が深まりました。

 …えーっ!(棒読み)

 > 主成分分析、あるいは多変量解析の教科書は複数冊に目を通しているのですが、理解力が足りないようで…。

 だってSVD…SVD! SVD! SVDじゃない主成分分析は、もう忘れたよ。…ええーっ!!(※あくまで想像に基づく勝手な演出です。)

・教えて!goo「主成分分析及びクラスタ分析について」(2004年12月11日)
 https://oshiete.goo.ne.jp/qa/1122514.html

 > 主成分分析を行って、得られた因子得点(回帰法)がデータに保存されます。
 > 今回自分の場合は4つの主成分になりましたのでfac1_1〜fac1_4が得られています。

 もとの変数が4つで、主成分をすべて使うということですね。(そうでない場合はクラスタリングの入力として使うのは適切ではない感じがしてきそうです。本当でしょうか。)

 > この得られた1〜4をクラスタ分析にかけるというのはどのような結果を意味するのでしょうか?
 > 実際にクラスタ分析を行うと鎖効果もなく非常によい結果が得られたのですが
 > これが本当にクラスタ分析となっているのかが分からなくて。

 「鎖効果」とおっしゃっているので階層的クラスタリングでデンドログラムを描いたと見受けます。

 > (回答)
 > あなたがされているのは、データマイニングの分野等では割と標準的に使用されている手法ですよね。
 > 通常のオリジナル空間では上手くクラスタに分離できない物を、主成分に変換してやることによって、クラスタに分離が出来ている、超平面を構成することが出来ていると考えるといいのではないでしょうか?

 階層的クラスタリングで「超平面」というのはしっくりこないとかって、ありません? あらあら、まあまあ!(※表現は演出です。)

 > その手法がクラスタ分析か否かと言われると、意味の取り方によると思います。

 うーん(略)。主成分得点の行列から距離行列をつくって、さらにウォード法などで…というのは、比ゆ的には『距離行列の自乗!』みたいな、似た意味の操作を二重に加えた(二乗したみたいに強調される)みたいな気がしないでもないんですけど、どう考えればいいんでしょうか。(※恐縮です。)

・教えて!goo「そんな組合せは知らない!」(2009年6月15日)
 https://oshiete.goo.ne.jp/qa/5044919.html

 > 主因子法とプロマックス回転
 > 主因子法バリマックス回転
 > 重みづけの無い最小2乗法とプロマックス回転

 > (回答2)
 > > 因子抽出方法や回転方法をコロコロと都合よく変えてしまって自分の導きたい結論(仮説通り)に持って行って良いのでしょうか?
 > ダメです。

 > (回答1)
 > なぜ心理学の論文で「因子分析(主成分分析、バリマックス回転)を行った」などというチンプンカンプンな表現が多いのか分かりました(^_^;) SPSSの因子の抽出法のところで、主成分分析を選択するようになっているからなんですね(謎が解けました)。

 SPSSを見ていないわたしにはいまもって『謎』ですが、Rしか使うつもりがないのでSPSSは見ないようにしようと思ったりしました。(…なぜに『過去系』だし!)※SASとMathWorksのヘルプはきちんとしています。

 > > そもそも、因子グループの命名が都合よく

 > 因子分析はもともと高度な問題を扱っているわけですから、そもそも因子名などというのは単なるラベルに過ぎません。
 > 読み手もそれを理解しているはずなので、都合よくラベル付けをしても問題ないはずです。

 「高度な」を「抽象化した」、「都合よく」を「便宜的に」と言い換えたくなりませんこと? あらあら、まあまあ!(※表現は演出ですが見解です。)講義や演習で気を利かせすぎて「高度な(≒気にしなくていいよ)」とか「都合よく(≒なるようにしかならんのだよ)」などとうっかり補ってしまうと、「抽象化した」「便宜的に」という正確な表現は忘れられて、最後に聞いた平易な言葉や講師の口癖、それに余談みたいなのばかりが記憶されていくとかって、ありません? にょほほほっ!(違)

・「統計初心者なのですが」(2017年8月20日)
 https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q12177951827

 > (質問)
 > 統計初心者なのですが、主因子分析と主成分分析というのが出てきて何がどう違うのかさっぱりわかりません…

 > (回答)
 > 統計初心者で主成分分析、因子分析などの多変量解析に触れることはありません。
 > ひとまず大学教育課程の統計学中級レベルを想定して回答します。

 えーっ。確かに統計学の授業はあったけれどもギリギリで単位を取っただけであるとか、あるいは取れなかったけれども単位数は足りていたとかいうことでも卒論を書く段階に進めてしまうほか、卒業後に資格の維持のために論文を書き続けなければいけないけれども統計学は初心者だと…いうようなことがあるのですよ。…たぶん。

・「エクセルのフリーソフト」(2015年9月28日)
 https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q11150568371

 2015年9月です。…2015年9月ですよ。

 > (質問)
 > 主成分分析とクラスタリングを同時に行うことが求められるようなデータとはどういったデータですか。
 > 変数と個体(データ)

 > (回答)
 > 参考になる入門解説資料、エクセルのフリーソフト、分析事例の紹介があります。

 えーっ。2015年9月、十中八九「R」で入門するだろうという時期になってなお「エクセルのフリーソフト」をありがたそうに紹介しちゃいますかっ。(※見解です。)質問者がきちんとした用語だけを使っているので(=使う教科書がきちんとしている)ぜんぜん心配ないと思うんですけど、いやーあなた、質問なんてしてないでデータセットを(毛色の違うのを)何種類か実際に触ってみればすぐに解決するでしょ。んだんだ。(※あくまで感想です。)


●「主成分回帰(PCR)」を回答とすべき質問の例


・「主成分回帰(PCR)」に関する質問です(2010年12月13日)
 https://okwave.jp/qa/q6381288.html

 > (質問)
 > 第1〜4主成分の式を使うことでもともとのデータの予測というものはできるのでしょうか?

 > (回答)
 > もともとのデータは主成分分析する時点で既知ですから、予測(=前もって推し測る)なんてできるはずがありません。
 > まぁ”推測”ってことだと思いますが、もともとのデータの何を推測するのかが質問からははっきりしません。

 なんですかこの回答者っ…いえ、(たぶん工学っぽい)質問者にとって自明である「回帰分析で予測モデルをつくる」という目的が(分野が違うと、明示的に言わない限り)理解されないということであると見受けられつつ、他方で、質問者としては「主成分分析を使った回帰って、あるのかしら」という質問を自力では言語化するに至らなかった(だから質問した)とうかがえます。

・教えて!goo「ラーメン屋の総合力を判断する指標を作成」(2016年7月25日)
 https://oshiete.goo.ne.jp/qa/9355432.html

 > 各変数の主成分負荷量を使ってラーメン屋の総合力を判断する指標を作成したいと考えています。

 いかにも文字面での早合点に即して使おうとしたときに「“総合指標化”できる手法なんでしょ?」みたいに(以下略)こういう質問が来るのだと覚悟しておかなければと思わされましょう。特に、2016年です。もはやRでいきなり実行できるよといって、かえってこういう質問が増えそうですよ。(※見解です。)…だいたい「作成」などと(大巾に中略)「作成」(という言葉を何にでも使ってしまうひと)については[3569]を参照。

 > (回答)
 > 「総合力」なる概念がどういう意味なのかを定義しなくては話にならない。
 > 「総合力」を、たとえば「1年間の利益額」と定義する。(あるいは「顧客の満足度」とかでも良いけれども。)そうして、様々な項目の得点から「総合力」を推定する問題を考えることは意味がある。すなわち、簡単には調べられない「総合力」を、値段だの立地だの外見的に容易に分かる項目の調査結果から推測しようということです。これには、「総合力」が分かっている相当数の店舗について、各項目の得