フォーラム - neorail.jp R16
2021年5月の話題
更新:2021/11/3

[4543]

【縦書きディープなラーニング(※表示は横書きです。)】

【東口直結】特異値分解とは何か(再)【多様な個性が響き合う】


(約17000字)

 「理数探究」です。

[4221]
 > 「理数探究=イコール=理科でしょ」などと思わせないように配慮を尽くしてほしい。

 https://shop.r10s.jp/book/cabinet/0407/9784046320407_3.jpg

 何も考えず特異値分解しちゃっていいんですかね。さっきまでの話を聞いていなかったひとみたいな顔で、そんなことを言ってのけてみせませう。えー…(てんてんてん)。

[3896]
 > 工学的に、固有値分解の代わりに特異値分解を使うというのがあるが、同じ考えかただと思ってよい。行列を見たら特異値分解しなはれということである。何も考えずに使えるのが工学的に優れているということである。

 http://nambusen.s225.xrea.com/news/190506-485-4l.jpg

 この防音壁の形状は何か、こう、その、端的に言えば「すごいスーパーコンピューター」(※意訳)が何日もかけてはじき出した絶妙な角度とかなんでしょうか。えー…(てんてんてん)。

[4227]
 > ものすごく直感的(※「直観」ではない)にいえば、行列をふるいにかけるのだ。落ちるものと残るものに分かれる。

・(再掲)
 https://youtu.be/sM5UavI6S_c




[4528]
 > これだね。うじうじ説明しないで、上位の概念や既成のアルゴリズムの名前を名指しで挙げて、とにかくこうするんです&こうなるんです(先人の偉大な発明です)、というのを見せてもらうのがいちばん。あとはもう、それを発明した数学者は酒豪だったのかとかいうエピソードでも紹介して時間をつぶせばいい。

 うーん。正方行列じゃないから自動的に特異値分解だということと、行列あらば固有ベクトルだということを、どちらも何も考えずに採択する。えー…(てんてんてん)。

[4393]
 > それならもう、わざわざ「自己組織化マップ(SOM)」じゃなくていいや。「MDS」([3676])でいう「布置」が抱える問題点と同じで、多変量解析なのにどうして無理やり「平面」で可視化しなきゃいけないのか。(※個人の感想です。)

 > > ここでは簡単な例で「主成分分析が非線形データに弱い」というのは一種の「迷信」であることを主張したい。

 > きゃーすてき。つまり、Rのウィキのひとは「主成分分析が非線形データに弱い」と思っているので、そういうときはSOMを使おうと言っていることになる。えー…(てんてんてん)。

 すんなり理解できて何も困っていない、あるいは職場の指示通りに触ればよい(考えなくてよい)というひとはウィキになど出入りしないので、ウィキというのは学習中の人、とりわけ、何かつまづいた人が集まりやすい。

 > 当然ながら、主成分分析とは違うけれど隣接行列をごにょごにょしてPageRankもできるし固有ベクトル中心性というわけはわからないけれど意味はちゃんとある(?)指標を出せるんですからねぇ。なんでもできると思ってよい。○か×か。…わあぃ固有ベクトル中心性はわけわからんといいました。(※個人の感想です。)

 個人の感想をお伝えいたしました。ただいまの感想は個人の感想、でしたー。(棒読み)

 > > Kクラスに分割する場合はK-1個の最大固有ベクトルを順番に使えばいい

 > なんかすごく使いやすそう。(※音声を変えています。)

 すんなり学習したいひとはRのウィキなど見ないほうが身のためだ。しかし、もし教える側になるなら、どういうふうにつまづくのかというサンプルの宝庫だから、Rのウィキのようなものはすごくありがたいのだ。いうまでもなかったとは思うが、こういうことだから、Rのウィキを見ながら何か「ちょっとデキる」という程度では、教える側などぜんぜん務まらないのだ。高校で「理数探究」といって、教員はRに不慣れなのに生徒がRを使いたいと言ってきたときにどうすればよいか。みなさんで考えてみてください!(※音声を変えています。)

 > > PCA や ICA や SVD は教師なしの距離(類似度)学習と考えることもできるが、やはり分類・クラスタリングに有効な素性(特徴量)はラベルつき事例があれば教師あり学習したほうがいいんじゃないかと思う。素性(パターン)の重み付けに自己相互情報量とか tf.idf を使ったりするのは、いわば正例だけから重みを学習しているようなものなので、それが最適化というと、迷惑メールだけからスパム判定するようなものなので……。

 > データそのものが結構きれいなときは、その中に『教師』が混ざっているんだと思えばよい。「いわゆる教師なし」だからといって、やりかたに不備があると決めつけるものではない。○か×か。

 > > 重み付けに自己相互情報量とか tf.idf を使ったりするのは、いわば正例だけから重みを学習しているようなもの
 > > 重み付けに自己相互情報量とか tf.idf を使ったりするのは、いわば正例だけから重みを学習しているようなもの

 ▼「「TP」「FP」「FN」「TN」のすべてを見渡しての考察」については[3283]を参照。それと同じことをぐちゃぐちゃおっしゃる。他人のことはいえないけれど、どうしてそうなるのか。

 > 分類・クラスタリング

 > PCA や ICA や SVD

 「分類・クラスタリング」とまとめて書くひと(そういう仕事やテーマで使うひと)、あまつさえ「PCA や ICA や SVD」(※主成分分析、独立成分分析、特異値分解)というように、これらを、この呼びかたで、この順番で書くような習いかたをした人だからだ。手で描ける数学の延長でSVMを習って、C言語も習うからSVM(サポートベクターマシン)のコードを自力で実装し(げふ)なんだかそういうふうに空間に線を引いて分割するんだという発想が強い。凝集的にクラスタリング、という発想ではない言い方だ。○か×か。(※恐縮です。)特異値分解というテクニックはともかく、固有値分解と固有ベクトルというものをどのようなイメージで理解すべきか。数学としての操作そのものでなく、データ(行列)のほうの気持ちになってみよう。…ちょっと難問ですぞ?(棒読み)

・…カシオです?(※なぜに疑問形だし)
 https://keisan.casio.jp/menu/system/000000001370

 そういう順番で「単元」が並ぶと「特異値分解」は年度末で時間切れというか、オプショナルツアーの類だとか、授業はするけどできなくてもいいよとか甘いことをいうのだろうか。ぜんぜんわからない。(キリッ

 https://keisan.casio.jp/exec/system/1507187349

 > 一般行列を特異値分解します。

 身もフタもない。

 http://www.math.keio.ac.jp/~kei/GDS/2nd/eigen.html

 > 周期性の可視化や,降雨量の一般化分散では,解析の過程で主成分分析を用いている

 ICAちっく。回帰分析との見境がない(*)ともいう。これでいいのか&どうしたことだ。(棒読み)理工学部の教員だからしかたがない。じぶんはICAひとつでぶいぶいいわせてきたのに、統計学の授業を任されちゃって悲鳴を上げている感じといえばよいだろうか。ぜんぜんわからない。(※表現は演出です。)

*研究上の段階としての「ここでは回帰分析して考察につなげるんだ!(仮説との答え合わせだ!)」といった弁別が不明瞭で、アプリケーションの中に回帰が埋まってる感じ。(※意訳)院生に取り組ませたという意味では学習上の例題のようなものだからそれでいいのだけれど、降雨量だけを見て分散だけで何か言おうということなら、それは「迷惑メールだけからスパム判定するようなもの」ということそのもの。そもそも降雨量というデータを(学習上の例題としてではなく自身の研究課題として)触るには所属が地球科学なんちゃらじゃないと。(キリッ

※工学はサイエンスじゃないから(!?)、なかなか回帰分析という方向へは深まっていかない。アプリケーションありき。「「TP」「FP」「FN」「TN」のすべてを見渡しての考察」という薬学部みたいな態度は備わらない。じぶんがつくったアプリケーションの「副作用」をまったく省みないといえばわかりやすいだろうか。

 とは思ったが、もっとデキるひとじゃないですか。

 http://www.math.keio.ac.jp/~kei/Keis_HP.html

 > 2015/05/14 統計数理研究所 公開講座 『統計学概論』の三日目回帰分析を担当.
 > 2019/01/01 統計検定の準一級委員長になりました.

 着任した理工学部に先にいる人(※えらい教員)の態度が横柄で、それに影響されすぎという線を疑っておくことにする。二言はなかった。手で描ける数学。これを理系の入試という。理工学部の入試問題の作成者として重宝されるというのが最大の仕事である。これによって研究者としてはボロボロになる。もはや理工学部の教員でしかなくなり、それ以上でもそれ以下でもないといって開き直るしかなくなってくる。○か×か。(※表現は演出です。)

※「態度が横柄」:理工学部はともかく(ぐぇ)高校の教員の実際上の専門性やキャラクター(≒授業の芸風や“人当たり”“取っつき”)としても、数学と理科はかけ離れている。なかなかねぇ。「理数探究基礎」の進めかたの打ち合わせすらまともにできないんじゃないの。(ぶつぶつ)

 https://images-na.ssl-images-amazon.com/images/I/51DT6xkkGsL.jpg

 …コレジャナイ。

・「人当たり」と「取っつき」の違い
 https://dictionary.goo.ne.jp/thsrs/2736/meaning/m0u/

・(1999年12月1日)
 https://www.amazon.co.jp/dp/4768702597
 https://images-na.ssl-images-amazon.com/images/I/81WGWhODugL.jpg

 > 本書は、平成7、8、9年度に実施した文部省研究費補助金による基盤研究(A)「多変量分析の利用により大学入試データ解析システムの開発」の研究成果をまとめたものである。
 > 入試データを多変量データとみなし、多変量解析の各種手法を用いて学部学科の特性に応じた入試選抜資料をどのように総合化するべきであるかといった問題を中心に検討する。

 入試というものを「得点」や「順位」だけで考えると「迷惑メールだけからスパム判定するようなもの」に思えてしまうだろう。○か×か。実際には「得点」ではなく、1問1問(の正誤)が素性(特徴量)なんですな。入試は多変量解析なんですな。えー…(てんてんてん)。

[3566]
 > > スイス1000フラン紙幣の真札と偽札各100枚の6個の計測値データである.散布図でみると容易に2変数で判別できることが分かるが,なぜ誰もMNM=0にきずかなかったか不思議である.
 > > 従来の線形判別関数は「線形分離可能なデータを認識できないばかりか,判別分析の研究者もその困難さを理解していない」ことが分かる.

 「スイス1000フラン紙幣の真札と偽札各100枚の6個の計測値データ」で何をしてもサイエンスじゃない(*)というのは17歳くらいの高校生しょくんにも一瞬でわかってもらえると思う。おおげさにいえば「ネイチャー!(※謎のかけ声)」とか「宇宙の真理を解き明かす研究(※微笑)」ではないということだ。真札と偽札のいずれも人工物だ。(※ソコジャナイ。)

 > 変量(変数)が6つあるといえばわたしたち、なかば自動的に6変量(6次元)の多変量解析が必要と思いこむわけですが、その実、6個のうち2個の変量(2次元つまり平面あまつさえ散布図1枚)だけ見れば偽札の判別ができるのだと、残りの4変量は紙幣を紙幣らしくみせる特徴量ではある(=だから計測された=)けれども、偽札の見分けにはまったく寄与しないのだと、このような理解でよろしかったでしょうかみたいなのから始めましょうか&そこからですかっ。

 「残りの4変量」のほうは、「これは巧妙な偽札ですね(悪質さの度合いが高いですね@呼んではいけない某国が関与していませんかね)」という指標である。(棒読み)

*「いかにして人間が偽札にだまされるか」を被験者実験して何か新しいことを発見したなら、それは文句なしにサイエンスである。

 > 「多分10%や50%で合否判定に不要」とは「ほとんどの者は正答しないので小林秀雄が出たからといって不利にはなっていない」ということで、「90%では変数増加法で最初に選ばれる可能性が高い」とは、まったくそうだと思われましょう。しかし、IRT的な発想になっていけば、「得点が低いのに小林秀雄は正答した者」みたいなの(…ギクッ)はこれまた低く評価されてくるのだろうと、たぶんこういうわけです。ふつーのひとであるかないかという2値の判別としては、「得点が低いのに小林秀雄は正答した者」は「ふつーじゃない」ほうに分類できないといけないわけです。…ギクッ!!

 などと。

 https://ja.wikipedia.org/wiki/%E7%89%B9%E7%95%B0%E5%80%A4%E5%88%86%E8%A7%A3

 > 悪条件方程式の数値解法で重宝するほか、信号処理や統計学の分野で用いられる。特異値分解は、行列に対するスペクトル定理の一般化とも考えられ、正方行列に限らず任意の形の行列を分解できる。

 まさに工学的としかいいようのない悪手である。(違)17歳くらいの高校生しょくんの中には、この悪手ぶりが、なぜかすごく許せないといって怒るひともいると思う。きれいじゃない。数学は美しいとか吹聴されてきたしょくん。どこへゆくしょくん。こんなしょくんにだれがした。(もっと違)

 > 固有値分解が正方行列に対してのみ適用できるのに対し、特異値分解は任意の矩形行列に対して適用が可能である。

 その代わりに、アレである。

 > 1つの特異値に対し、2つ以上の線形独立な右(あるいは左)特異ベクトルが存在する場合、その特異値は縮退 (degenerate) しているという。縮退のない特異値に対しては常に、左右の特異ベクトルがそれぞれ(位相 eiθ の違いを除いて)唯一つ存在する。

 「左特異ベクトル」と「右特異ベクトル」が得られる。行列が正方でなく縦と横の違いがあるんだから当然である、と思えばいいのか。ぜんぜんわからない。(キリッ

 歴史的に「左」「右」と呼ぶけれど、意味を説明する説明の中では便宜的に「長」「短」と言い換え、つまり「よこなが行列」の「ちょう特異ベクトル」と「たてなが行列」の「ちょう特異ベクトル」を呼び分ける必要はないでしょ、とか言ってはいけないんですかね。手で描ける数学。黒板にベクトルを書く。これは手の感覚だから、偉大なる先人(※仮名)が左とか右とか呼んでしまった。そこからおかしいんじゃないか。(ねちねち)

 > フロベニウスノルム

 ぎゃー。(※擬音)ぼくらはエルム荘でファンシーしようよ。(※何かが壊れた。)▼人気の和柄(※意味深)でフロマル! ベニマル! ウスマル! さんにんそろって(違)「フロベニウス」については[3643]を参照。

※数学から逃げ出したい気持ちを表現しています。しばらくお待ちください。

 https://img.mandarake.co.jp/webshopimg/02/01/002/0201517002/02015170024.jpg

 …ざんねん! エルム工業の「ファンシーバンクS」でしたー。(もっと違)

 https://www.yourelm.co.jp/yachiyodai/elmsalon/index.html
 https://www.yourelm.co.jp/yachiyodai/elmsalon/images/map.jpg
 https://www.yourelm.co.jp/yachiyodai/elmsalon/images/main_photo01.jpg
 https://www.yourelm.co.jp/yachiyodai/elmsalon/images/main_photo02.jpg

 ユアエルム八千代台「ユアエルムレストラン街」より「ELM SALON」のご案内でした。ただいまのご案内は「ELM SALON」、「ELM SALON」は多様な個性が響き合う130の専門店「ユアエルム八千代台」京成八千代台駅 東口直結、京成八千代台駅 東口直結、で、ございます。隣は「岡三証券」だし、ちょっとした会社の株主総会とかできちゃうのかしら。ぜんぜんわからない。(キリッ

 https://ja.wikipedia.org/wiki/%E5%B2%A1%E4%B8%89%E8%A8%BC%E5%88%B8

 > けろけろけろっぴ - 当社のイメージキャラクターに起用。

 やーいファンシー。

 https://livedoor.blogimg.jp/m_marukun/imgs/2/5/252255c4.JPG
 http://www.uraken.net/railstation/ressha/ltd/elm01.jpg

 > 「エルム」はどういうわけか、いわゆるネタになる機関車が牽引することが多い(もともと設定日数が非常に少ないのもあるけど)。

 Google画像検索に「エルム」といっても、ぜんぜんちっとも出てこない。「エルム」はるかになりにけり。「どういうわけか」といいながら、ぜんぶじぶんで説明してる。えー…(てんてんてん)。

 https://static.mercdn.net/item/detail/orig/photos/m81066845902_4.jpg

 これぞファンシーといったおもむき。(※ひらがな)ちなみに、これを見つけるのにどういうわけか「ファンシー」ではだめで「昭和 ビニール」なんだな。えー…(てんてんてん)。

 https://i.pinimg.com/originals/66/bb/66/66bb66ade8586864a10549efa905a829.jpg

 「ファンシー」と書いてある場合もあるが、書いてないほうが多いので、「ファンシー」で見つけられるとは限らないのだった。

 https://static.mercdn.net/item/detail/orig/photos/m73487993569_1.jpg
 https://base-ec2if.akamaized.net/w=640,a=0,q=90,u=1/images/item/origin/d9b0348f56212561dfc40db0226e9379.jpg
 https://www.izumiya.co.jp/wp-content/uploads/2018/11/036.jpg
 https://prtimes.jp/i/34993/56/resize/d34993-56-393403-0.jpg

 イズミヤー!! またの名をライフといいまして。…いいません!!(※真っ赤)そもそも「ビニール」という呼びかたがね(しばらくお待ちください)すでに材質が他のものになっても「ビニール」と呼び続ける。なんてこったい。(※表現は演出です。)

 https://inouedrops.com/gallery/original-illustration/
 https://inouedrops.com/wp-content/uploads/2020/06/emblem.jpg

 「ファンシー」をいまに伝える。いのうえたかこ先生がとまらない。(キリッ

[4537]
 > > 座標データとしては価値があるかもしれません。

 > 謎の古代技術をいまに伝える。(棒読み)「座標データとしては価値があるかもしれません。」というのが、手描きして方眼紙とにらめっこして「座標データ」に起こしたじぶんをほめてほめて、とのアピールであります。

・日本将棋連盟です!
 https://www.shogi.or.jp/column/2018/10/post_439.html

 > 「寄せは俗手で」とは、寄せの段階に入ったら、難しい手は要らず平凡な手で十分という意味です。勝勢〜勝ちの局面なら、自然な手を重ねれば勝ちが近付いてきます。逆に苦しい局面だったら自然な手を指すと分かりやすく負けてしまうので、ひねった勝負手などが必要になってきます。

・日本将棋連盟です!
 https://www.shogi.or.jp/column/2017/02/141.html

 > 疑問手
 > いくつか候補の手が見えていた中で、それとは違う、思わしくない手を指したときに疑問手と評価されます。局面が進んで少し形勢を損ねたときなどに、「あの手はどうだったのか疑問」のようにも言われます。検討された後には、「あの手は悪手だった」と評価されることもあります。

 > どちらとも判断がつかないもの
 > 勝負手
 > 手に秘めた狙いの成否に関わらず、局面を大きく変える手のことです。主には形勢を損ねている側の手段で、そのまま進んでしまうとどんどん悪くなってしまうため、勝負手を放つことで局面を動かしにいくのです。勝負手を放った瞬間には良いか悪いかの判断はつかず、後の展開によって判断されることが多いです。

 17歳くらいの高校生しょくんが特異値分解みたいな工学的な考えを悪手と感じて怒るとき、そこに「俗手」あるいは「疑問手」というニュアンスを感じるから怒るのだろうとは思った。「後の展開によって判断されることが多い」つまり「わからない」ということをわかろうじゃないか。なあに後からじっくり振り返ればいい。長閑な時代であった。

[4248]
 > > 'hubs' および 'authorities' の各中心性スコアは、2 つの中心性測定が再帰的にリンクされたものです。
 > > 隣接行列の最大特異値に対応する左 (ハブ) および右 (オーソリティ) の特異ベクトルとして解釈できます。

 > これだこれだ。行列の縦と横くらいの意味しかない。日本語で「ハブ」「オーソリティ」というカタカナ語にとらわれないこと。ベクトルはあなたに微笑む。(違)

 > 「ベクトルはあなたに微笑む。(違)」:名状しがたいリサイタル・ノヴァのノリで!

 https://pbs.twimg.com/media/Ez8lGEpVIAE-SQ7.png

 名状しがたいマツモト!(違)それ以上はどうにもこうにもとしか…(てんてんてん)。なお、HITSでは有向グラフを入力とするので、(HITSという)アプリケーションとしては(特異ベクトルの)左と右に、そういう意味付けができる(そういうつもりで使うことができる)、ということ。これはあくまでアプリケーションであった。サイエンスではないとはこのことだ。(ばーん

 https://natalie.mu/comic/news/421738
 https://ogre.natalie.mu/media/news/comic/2021/0329/vivy_AJ2021.jpg

 > マツモトについて種崎が「セリフがとっても多いですよね」と言うと、福山は「声優をしていて一番うれしいのが、セリフが多いときなんです。台本にずっと僕の役のセリフが書かれているとテンションが上がるのですが、その夢を叶えていただきましたね」と笑顔を見せた。

※ぬおー! 数学の教員みたいな役そしてセリフだけれど、本当に数学の教員みたいになっておられた。コレハスゴイ。(棒読み)

 17歳くらいの高校生しょくんも日常的にインターネットを使ってハイパーリンクを駆使しているだろうから、むしろHITSの説明をすることによって、先に特異値分解がわかって、そこから遡って固有値分解ひいてはベクトルと行列がわかってくるという、逆向きの学習ができるのが「理数探究基礎」ではなかろうかと思う。これは17歳くらいの高校生しょくんにとって、面倒ごとが増えるというよりは、勉強が楽になるということだと受け止めてもらいたいところだ。(キリッ

 > 種崎は「とにかく100年のことを描いているので、一部だけじゃなく全部を観ていただきたいです」と、全話観ることが重要だと強調した。

 将棋でいう「勝負手」それに「感想戦の大切さ」みたいなことをおっしゃる。横にいるプロデューサー氏はらはらである。プロデューサー氏がじきじきにのうのうと語れば将棋の例えくらい飛び出すだろうが、あくまでキャストに語らせるという台本上、この程度に小さくまとまってしまうのはしかたのないことだ。○か×か。(※ジト目)

[4221]
 > > > 身近なところにあるアルミニウムや大学について理解が深まった。この実験を文化祭でもやりたいと思った。

 > 「アルミニウム」と「大学」を並べて「文化祭」という「感想」の支離滅裂よ。

 すでに理数探究を実施している高校の実際の高校生が書いてしまう「感想」よりは、さすがにいくらかマシ。だって大人ですもの。(※恐縮です。)

 https://www.asahi.com/articles/DA3S14553246.html

 > かつて好きな言葉を聞かれて「感想戦は敗者のためにある」だと答えた。「感想戦という行為自体が他(の世界)では珍しいと思う。感想戦の意義をよく表した言葉かな」

 > それぞれの場面で自分が何を考えたのかを語り合い、より良い一手があったのかを共同作業で探究する。

 > 負けたり失敗したりした時、人はしばしば、ただ落ち込む。あるいは、ごまかす、言い訳を考える、忘れようとする。逆にうまくいった時には、都合のいいことだけを記憶に残して、途中の過ちにはふたをする。

 > 日本将棋連盟会長でもある佐藤康光九段は、感想戦での検討について「思いもよらない妙手が出てくると、震えるほど感動することもあった」と著書に記している。敗れて腹が立ち、自身の感想戦を拒否して帰ってしまったことがあるとも明かし、「まったく自己をコントロールできていなかった」と省みる。

・ARXの「要望12」
 https://arx.neorail.jp/issue/?%E8%A6%81%E6%9C%9B12

 > 要望12は、「どうしてこんな簡単なことに気づかなかったんだ!」と思って悔しくなるような項目ばかりであるが、そこはぐっとこらえていただいて、あたかも最初から知っていたり考えていたりしたふうを装って平然と構えてほしい。

 この注意書きは、プロ棋士ですら「腹が立ち〜拒否して帰ってしまった」ということがあるので、もっとなんでもない者はもっと短気だという前提で書き添えたものである。「どうしてこんな簡単なことに気づかなかったんだ!」というのは、いまモーレツに悔しいものである。そのことは知っている。

・日本将棋連盟です!
 https://www.shogi.or.jp/column/2017/10/post_246.html

 > 電車の駅をあえて一駅前で降り、ただひたすら歩くこともしているそうです。

 さあさあ電車の駅をあえて一駅前で降り、ただひたすら歩くこともしていると将棋やAIそれに「理数探究」がはかどるということですよ!(※ソコジャナイ。)

・(♪〜)
 https://2nd-train.net/files/topics/2020/11/02/49be5df64ed5d22da0371f281209d69fc58f650d_b.jpg
 https://pbs.twimg.com/media/El08kTnVcAA_1mQ.png
 http://ksweb.org/pict/210429-D36906.jpg

 電車の駅をあえて一駅前で降り、ただひたすら歩くといっても…(てんてんてん)。(※画像はイメージです。)

[4523]
 > 検索の手がかりはテキストだけではありません。インターネットにはハイパーリンクというものがあります。…出ました「インターネットにはハイパーリンクというものがあります。」2000年くらいの講義みたいな言いかた!!(ぐぇ)画像の類似度という機械的な基準だけでなく、あの動画とこの画像、この画像とあの画像は関連がありますよ、ということを、1つのページやサイトからリンクするというかたちでGoogleに活かしてもらえるわけです。どんどんリンクしない手はありません。

※「日常的にインターネットを使って」:あのね(ぐぇ)この子がね(ゲフンゲフン)大学に出てきてPC教室に空きが出るのを待って、やっと空いたらインターネットが使えるが、すぐにほかの授業で使うからと言って追い出される、そういうようなですね(ですですー!!)なんでもございません。

・(参考)「あのね(ぐぇ)この子がね」のイメージです
 https://i.makeagif.com/media/12-14-2017/zokmIo.gif

 子どもがよじ登ってきて顔がぐしゃぐしゃ&くびが絞まるぅ(ぐぇ)。

 https://i.pinimg.com/originals/3b/56/41/3b5641a82a206569a69bd114d294ca2e.gif

 ぐぇ!!

・Minitab® 18サポート「主成分分析のすべての統計量およびグラフを解釈する」
 https://support.minitab.com/ja-jp/minitab/18/help-and-how-to/modeling-statistics/multivariate/how-to/principal-components/interpret-the-results/all-statistics-and-graphs/

 > 各主成分を解釈するには、元の変数の係数の大きさと向きを調べます。係数の絶対値が大きくなるほど、成分を計算するうえで対応する変数が重要になります。係数が重要だとみなされるために係数の絶対値がどの程度大きくならなければいけないかという点は主観的です。専門知識を使用して、相関値が重要になる水準を決定します。

 ここが納得いかなくて17歳くらいの高校生しょくんが怒るのだ。ここでいう「専門知識」は「ドメイン知識」とも呼ばれる。

 https://jpn.nec.com/nec-academy/article/20200220.html
 https://jpn.nec.com/nec-academy/article/img/20200220/img_03.jpg

 > ドメイン知識とは、ある業界・業種に特化した事業の知見や情報のことです。AI活用を企画するに当たっては、その適用先であるお客様の事業や業務、課題について知り、説明できる必要があります。つまり、ドメイン知識が不可欠ということです。

 「初級シスアド」で「…EUC! EUC!」と言っていた時からのソレだ。

[3327]
 > > 「(略)理科や地理の教科書から例文を集めて正しく理解しているか調べる内容だ。(略)教科書がきちんと読めない子供が半分くらいいるとわかってきた。主語がわからない、指示代名詞が何を指しているのかがわからない。現場の先生は気がついており(略)」

 つまり国語なんですよ。「大村はま」なんですよ。終戦直後からちゃんとあるんですよ。

[3469]
 > 「日本人の読み書き能力調査」(数量化I類)

[3494]
 > 「数量化I類」と後に呼ばれるソレは、この調査のためにつくられたのですよ。

・(再掲)ウィキペディア「大村はま」
 https://ja.wikipedia.org/wiki/%E5%A4%A7%E6%9D%91%E3%81%AF%E3%81%BE

 > 戦後、占領軍の教育指導者講習があり、はまは、出席した。CIEが強調したのは単元(ユニット)であった。実践的な、目的意識をもった、まとまりのある授業である。はまは、「やさしい言葉で」という題で行った学習の例を、通訳を通じて話したら、責任者のオズボーンは「そうだ、それがユニットというものだ」と認めた。

 > はまの支援者であり、助言者でもある東京都指導主事・東京教育大学教授の倉澤栄吉もその一人で、定期的に参観にきた。

[3494]
 > エピソードがつらつらと述べられてはいますけど、重要なのは上記の2点ですよね。「数量化I類」と呼ばれるソレがつくられながらの「日本人の読み書き能力調査」には倉澤栄吉もアレしてますよね。(敬称略)

 個々の教師の暗中模索の手探りではなく研究所による確かな指導の下で体系がつくられている。あとはもう、じぶんはちゃんとやったかと自省するだけの話。他人のせいにはできない。(※事実です。)

・「数学的事象に焦点化して」(2019年11月17日)
 https://www1.gifu-u.ac.jp/~hanaki/research/pdf/1911tankyu_s.pdf

 > 焦点化して
 > 焦点化して

 「焦点化して」が気持ちわるい。ま、それはともかく。(※恐縮です。)

 > 「算数・数学の自由研究」
 > マスフェスタ

 指導する側としては「多変量解析」と言い換えたまへ。そうすればいくらでも参考文献を見つけ出せるようになる。「理数探究」の『出口』として、理学部で数学の卒論を書くようなキャリアではなく、いたってふつうの工学部や、文学部だけど自然言語処理もやりますとか、そのへんのボリュームゾーンを狙へ。二言はない。(※「へ」は「he」と発音。)

 > 多くの生徒が楽しく数学と接することができる高校数学になる契機となることを期待する

 全面的に賛同する。

 > 数学の発表の場が増えることが望まれる
 > 日本物理学会や日本分子生物学会などでは,高校生の発表の場が与えられており,理科分野は数学に比べて発表の場が多い

 数学という高校の教科だけで閉じて考えず、あえて教科でいえば国語科や社会科とよく連動すること。情報系でも地理系でも発表の場は無数にあるだろう。(※恐縮です。)

 https://kaken.nii.ac.jp/ja/grant/KAKENHI-PROJECT-26800039/

 > 準ダイアグラムを用いた結び目・空間グラフの研究
 > アウトリーチ活動として,小学生向けの連続講座や一般の人のために理論を活用した知恵の輪の演示を実施した.

 結び目で知恵の輪のセンセイだった。(※最初と最後しか読まない人になってみた。)

[3572]
 > > 交差検定による平均二乗予測誤差 (MSEP) を推定するオプション
 > > この場合は、10分割交差検定を使用します。

 > > PLSRのMSEP曲線は、2個または3個の成分を使用すると、最大限の効果があることを示しています。一方、PCRで同じ予測精度を実現するには4つの成分が必要になります。

 > 目的変数1つを除外して主成分分析したみたいな「PCR」で「固有値が1前後まで」みたいな主成分を選ぶと、目的変数1つも含む「PLSR」より1つ多く主成分が必要になるという…あたりまえだという感じがしてきます。その上で、「PLSR」は主成分分析そのものが「(半端なことをする)PCR」より「まとも」だということから、さらに1つ減らしても同じ情報を表現できている(要約できている=「同じ予測精度」が実現される)らしいとうかがえます。「2個または3個」「4つ」という順番で、しかも平たく説明されてもよくわからないのですが、ここでは「3つ」というのが本質的な次元の数(特に工夫せず、また特におかしなこともしでかしたりしない場合に「順当に」必要となる主成分の数)と思われ、▼「PCR」は半端なことをしたおかげで必要な数が増えちゃうよ、▼「PLSR」はまともなので、状況によってはあと1つ減らせる場合も出てくるんだよ、と、立体的な理解を促されたいとは思われないでしょうか。

・「知識システム 言語学専修」
 http://www.lit.kobe-u.ac.jp/undergrad/linguistics.html

 > 知識システム講座に所属する言語学専修は、日本語研究から英語学など個別の言語研究とともに、音韻論、文法論、意味論、を含む幅広い研究分野をカバーする教育・研究体制をとっていて、カリキュラムの充実を誇っています。

 > 2年次での専修配置後には、音声学、音韻論、形態論、統語論、意味論の各論に関する講義・演習を受講していきます。歴史言語学、心理言語学、社会言語学、自然言語処理演習、言語類型論、語用論などの諸分野に関する授業も集中講義などの形で受講できます。

 「神戸大学」の説明でした。

・(♪〜)
 http://www.tawatawa.com/densha5w/img241.jpg

 「上信電鉄」への入口。薄暗さが期待を高める。…高めません!!(※真っ赤)

・(再掲)日経リサーチ「主成分分析」
 https://www.nikkei-r.co.jp/glossary/id=1632

 > 多数の調査項目があり、それらが互いに相関を持っている場合、その重なり合っている情報を数理的に合成し、より少ない新しい変数によって、できるだけ多くの情報を保存しながら全体を簡潔に説明することができる。その代表的なデータ分析法として主成分分析がある。合成された変数を主成分(principal component)という。元の変数群が持っている情報から主要な成分を合成する、という意味である。

 電車の駅をあえて一駅前で降り、ただひたすら歩く。いまのところ「日経リサーチ」のこの説明よりやさしい説明はないと思っている。

 > 固有ベクトル=重みベクトル
 > 主成分の分散は、線形代数の用語では固有値という。主成分は元の変数の線形合成であったが、その重み係数のベクトルを固有ベクトルという。

 固有ベクトルについての説明もやさしいかというと、やや「?」ではあった。サイエンスではなくアプリケーションなのだという(主成分分析を使う側の)立場が不鮮明なまま説明しているきらいがあった。「こうすると決めたんです」「こう使うんです」という、主成分分析を使う側の責任をはっきりさせたい。結び目で知恵の輪のように宇宙の真理とはいわないけれど、そこに何がしかの数学上の完全性とか美しさがあるかのように受け取られては困る。主成分分析の結果をサイエンスの成果のように振りかざす報告者が生じないように注意しなければいけないと思った。

※結び目で知恵の輪は文句なしに宇宙の真理だといいました。

 > 解釈可能という観点からは「固有値の大きさが1より大きい個数」という基準(固有値基準、あるいはカイザー基準という)が目安になる。相関行列を主成分分析する場合、固有値が1より大きいということは、元の変数1個分以上の情報を持つ成分ということになるからである。しかし、固有値が1程度の場合は、特定の変数にのみ関係する成分となる場合もあって、複数の変数を「合成」した成分とならず、その結果として解釈が難しいときもある。その意味では、因子分析のほうが解釈しやすいので、マーケティング調査では主成分分析よりも因子分析が利用されることが多い。

 因子分析をよく理解して使いこなすために主成分分析に戻ってきて説明する(が、主成分分析を「実戦!」では使わない)という「日経リサーチ」(の態度)の限界を見た気がした。電車の駅をあえて一駅前で降り、ただひたすら歩く。長閑な時代であった。

 > 固有値とは何か
 > 線形代数における固有値問題は高校数学では学ばない。大学においても理科系では1年生で学ぶが、文科系では数学を使う分野(計量経済学など)を除いて学ぶ機会がない。そのため主成分分析を固有値問題として説明されると、理解が困難な人が多い。しかし、主成分分析を理解し、データ分析で利用するためには、必ずしも固有値問題を数学的に理解していなくてもよい。また、固有値問題を知っているからといって主成分分析を使って、実際のデータ解析を上手に実施できるとは限らない。むしろ主成分の性質を理解していることがデータ解析の成功にとって重要なことである。

 むしろ不安になってくる「日経リサーチ」ではあったが、もちろん主成分分析を使うに際しては「日経リサーチ」の説明で不安はない。電車の駅をあえて一駅前で降り、ただひたすら歩く。(※白目)


この記事のURL https://neorail.jp/forum/4543/


この記事を参照している記事


[4545]

研究ホワイトボックス(47) 複雑なデータと「対話」するには〜郵便番号データを例に(バイプロット編)

2021/5/13

[4547]

研究ホワイトボックス(48) 複雑なデータと「対話」するには〜郵便番号データを例に(回帰木編)

2021/5/13

[4626]

ふれねる「自由研究 数学」の写(SHA)

2021/8/25

[4628]

ふれねる「自由研究 数学」の忙(BOU)

2021/8/25

[4633]

ふれねる「自由研究 数学」の風(HUU)

2021/8/25

[4653]

ツールとは何か

2021/11/16

[4727]

【OuDia】ジェイアール総研情報システムとNTTデータと統計数理研究所で「数理最適化」のイメージを探す(談)【朝倉書店とオーム社の違いあり】

2022/5/1

[4779]

いま再び問う「A列車で行こう9 ダイヤ作成 コツ」のココロ(後編)

2022/6/1

[4781]

鉄のソルフェージュをさがして(探)

2022/6/1

[4803]

【A9V2】「食べ放題でビール半額だ!」を読み解かずに読み解く(仮)

2022/7/1


関連する記事


[4014]

きょうは川端康成で粗灰分。 tht - 2020/4/1


[3571]

実例に見る日英対訳(17) 「ランダムフォーレスト」に野生はあふれ tht - 2017/12/3


[3584]

研究ホワイトボックス(30) ハイパー・ゼロ:「主成分分析」FAQ tht - 2017/12/19


[3669]

【自由研究】ゆるシミュ(9) tht - 2018/8/16


[3745]

【自由研究】ここからここまで【AIどうでしょうつき】 tht - 2019/8/13


[3639]

【自由研究】ふわコレ(6) tht - 2018/4/30


[3587]

研究ホワイトボックス(31) ハイパー・ゼロ:「主成分分析」FAQ(補遺編)〜ふれねる「スクリープロット」の崖<がい> tht - 2017/12/19


[4629]

ふれねる「自由研究 数学」の好(HAO) tht - 2021/8/25






neorail.jp/は、個人が運営する非営利のウェブサイトです。広告ではありません。 All Rights Reserved. ©1999-2022, tht.