フォーラム - neorail.jp R16

Googleの「AIによる概要」で誤った内容が表示される事象について


いま問うA9のココロ
信号機のG現示の色がこんなにメロンソーダなわけがない
ATC・ATSの「Aの字」も出さずに効果音と動作を実装するには
「場内信号機 作り方」「信号機に名前をつける機能」とは


2022年6月の話題
更新:2022/7/14

[4766]

超大陸五反田(カッコカリ)の弐

主成分分析 多変量解析 相関係数 FALSE mycmpakari3d 近似曲線 ウィルス 種子 NULL


「R with Excel」(※だめなやつ)

(約4000字)

 [4765]の続きです。


[3676]
 > > 確率、統計等の応用的分野は必要なときに勉強すれば、大人になってからでも覚えられるものであって、そのときには生半可な入門的知識よりも基本的分野の学習で養った強靭な思考力、鋭い感性の方がはるかに役に立つのである。

 > > 鋭い感性
 > > 鋭い感性

・(♪〜)
 https://livedoor.blogimg.jp/yosi44125/imgs/e/e/ee0878a2.jpg

[4634]
 > > この因子負荷行列から因子を解釈するのだが、この解釈に関しては数学的な基準はない。むしろ文学的でもあり、マーケティング的であり、主観的でもある。
 > > 色のついた変数が同じグループだが、その意味を考えて、グループに共通するような抽象的な概念を考案するのである。

・(♪〜)
 https://images.keizai.biz/shinagawa_keizai/photonews/1556256771_b.jpg

 > むしろ作文である。(キリッ

・(♪〜)
 https://pbs.twimg.com/media/EWNBJ0JVAAAyS-w.png

 > > この言葉選びは難しい場合もあるし、センスを問われることもある。
 > > 因子の解釈は必ずしも短い単語にする必要はない。もっと説明的であってもかまわない。

 > まさに「大村はま」([3494])である。「主成分分析」がどうたらと変な脇道に迷い込まず「因子分析」をちゃんとやれ、統計ソフトが使えても「言葉選び」ができなければだめだ、ということに尽きる。

[4615]
 > > > 第2主成分軸がこうなることは、工学部出身の技術者では常識です。

[4626]
 > 花や種子の形状を測定して多変量解析にかける、「ド」がつくほど定番の授業だと聞きます。(※伝聞)

[4642]
 > 「もっ…、もちろん、主成分分析は習いましたよっ!(※白目)」と言ったとき、なお分野によって学びかたが大きく異なる。「言葉選び」をじぶんの責任でするところまで教わるとは限らない。それでも「主成分分析…できます!(※白目)」と言ってしまうと「言葉選び」までやらないといけないんです。このギャップよ。(※詠嘆)

・ぼくらの「日経リサーチ」さん☆ハイ!(ぐぇ)
 https://www.nikkei-r.co.jp/glossary/id=1605

 > 入力データが違うだけで、データの解析法は同じである。
 > ほかにもアイデアはあるだろうが、最終的には距離行列(非類似度行列)を作成する。

 このデータの「右の外側」とか「下の外側」の「z」(標高)を推定してほしいんスよ。原点を挟んでマイナスだとかいうと、何かおかしくなっちゃわないかしら。えー…(てんてんてん)。

 「R」なのだから、意地でもfor文を使わない。for文でxとyを回して128x256の配列をつくって標高は平均値みたいな「80」を入れておくというようなことをしたい。「rep()」を再帰的に使えるのだろうか。わたしは「R」をまったくわかっていない。えー…(てんてんてん)。

■「R with Excel」(※だめなやつ)

mypreright128 = as.table(cbind(c(256:383), c(0:-255), rep(80, 256)))
rownames(mypreright128) <- NULL
colnames(mypreright128) <- c("V1", "V2", "V3")
mypreakari3dr <- predict(mycmpakari3d, mypreright128)
original <- mypreakari3dr %*% t(mycmpakari3d$rotation)
original <- scale(original, center = FALSE, scale = 1 / mycmpakari3d$scale)
original <- scale(original, center = -mycmpakari3d$center, scale = FALSE)
myakarioriginalrights <- as.table(original)
write.table(myakarioriginalrights , file="clipboard", sep="\t")


clPairs(mypreright128)
clPairs(mypreakari3dr)


 https://neorail.jp/forum/uploads/a9v1_edit_hiobake01_xx1.png

https://neorail.jp/forum/uploads/a9v1_edit_hiobake01_xx1.png

 https://neorail.jp/forum/uploads/a9v1_edit_hiobake01_xx2.png

https://neorail.jp/forum/uploads/a9v1_edit_hiobake01_xx2.png


 違う。そうじゃない。わかってないなぁ。わかってないのはどっちだよっ!?(※表現は演出です。)

xyz
-2552550
5112550
-255-2550
511-2550


 元のデータに「4隅!」を手で追加してあげてからやったらどうか。(※「してあげて」に傍点。)…あなた「分散」って、ご存知?(※真顔)

 https://takokura.com/wp/wp-content/uploads/2019/09/e052c3825460fbb7c1cb3c56466db524.jpg

 「4隅!」(から引っ張る力)なんてものを追加しちゃうと、どんどん特徴がなくなっちゃうわ。すべての地形は「平地」に“帰す”のよ。えー…(てんてんてん)。

[4317]
 > 情報と接する態度が未熟なまま社会に放り出された世代
 > その世代にとって「回帰」という言葉はベースボールな用語で「原点回帰」以外の意味はないんですな

 > 回帰分析のことを回帰という以外には回帰という言葉は使わなくなってゆく、国語辞典の説明の1番と2番の順番(どちらのほうがよく使われるのか)が入れ替わるような変化を迎えるんですな

[3584]
 > ▼目的変数を決めて「回帰」まで行えるのは特別な場合である(研究としての回帰分析を成立させるのは存外に難しい)

 「検定」と「回帰」は別物だよみたいな話でした。…はひ!?(※左目と右目がばらばらに白と黒みたいな藤子ちっくな顔で!)

[4014]
 > > 相関係数が大きくなくても、隠れた相関が存在する場合もある。左図のように(例えば放物線のような)或る曲線、または曲がった直線等に沿ってデータが分布する場合だ。
 > > 相関係数はデータが比例か反比例の傾向にあるかだけを見ているのだ。

 > 「比例か反比例の」じゃない。「直線へのあてはまりの度合い」と呼んでくれたまへ。▼「曲線へのあてはまり」は考えないのが「相関係数」だ。「曲線の相関がある場合」などと書くものじゃない。▼「相関係数」は4文字で1つの固有名詞である。自分勝手に「相関」と2文字で呼んで、2文字で「相関」と言える言えないー(↑)みたいなことを(日本語で)自分勝手に考えてはいけない。「曲線の相関がある場合」などと書くものじゃない。▼「曲がった直線等」は「直線じゃない」し「曲線でもない」。何らかの関数にあてはまるなら、その場合だけ特別に呼ぶべきだ。その限りにおいては階段状であってもよい。○か×か。(げふ)

 > > 擬似相関
 > > 背景知識に照らした解釈により、本物の相関とは区別しなければならない。

 > しこうして「本物の相関とは」を知ったしょくんは「疑似相関」という画数が多くてありがたそうな言葉(漢字)だけを振りかざして何かをとったような顔をするしょうもない大人になってしまうのである。

 白目で「目が醒めた」とか言いながら「本物の相関とは」をじぶんは知っていると誇り「疑似相関」を指弾して回ってひんしゅくを買う大人という図。(棒読み)

[4125]
 > なんとか亭ぐれ助が「でっかいお世話です」と毛筆された大きなしゃもじを持って走り回るの巻(違)

[3932]
 > ウィルスは張り紙…もとい「おふだ」を読めるんですよ!! しめ縄…じゃなくて、ロープで区切ればウィルスは入ってこないんですよ!!(違)

[3467]
 > > 昭和50年3月ダイヤによる東北本線宇都宮駅の上り列車の到着時隔(略)あてはめの検定を行ったところ,有意差はなかった.

[3571]
 > なんとなく主成分分析が先でクラスター分析があとのほうが「わかりいい」ような気もしてくるんですけど、どっちがいいんでしょうかねぇ。(あてはめの)回帰分析とのコントラストとして(教師あり)判別分析を持ってこよう、そして(教師なし)クラスター分析から多変量らしくなっていって(データの次元を減らす)主成分分析のおでましだいという3Dコンタンですかっ。(※諸説ありそうです!)

・(再掲)ウィキペディア「フィッティング」
 https://ja.wikipedia.org/wiki/%E6%9B%B2%E7%B7%9A%E3%81%82%E3%81%A6%E3%81%AF%E3%82%81

 > 回帰分析で曲線を求める場合、その曲線はデータ点を必ず通るわけではなく、曲線とデータ点群の距離が最小になるようにする。曲線あてはめによって得られた曲線を、近似曲線という。特に回帰分析を用いた場合には回帰曲線という。

[3651]
 > いちばんポヤンとした呼びかたをするなら、単に「フィッティング」と呼べばよろしい。本当でしょうか。よ〜く考えよう!(※考えてわかるとか決まるとかいうことではない気がするよ。)

・(再掲)「見せかけの回帰」
 https://ja.wikipedia.org/wiki/%E8%A6%8B%E3%81%9B%E3%81%8B%E3%81%91%E3%81%AE%E5%9B%9E%E5%B8%B0

 > 統計学や計量経済学において、統計的に独立である無関係の二つの時系列変数が最小二乗法による回帰分析において統計的に有意な係数の推定値を取ってしまうという問題

 工学の見地からは、なにいってんの的な問いの立てかたに見えはしないだろうか。(※詠嘆)


 [4767]に続きます。


この記事のURL https://neorail.jp/forum/4766/


この記事を参照している記事


[4765]

超大陸五反田(カッコカリ)の壱

2022/6/1

[4767]

超大陸五反田(カッコカリ)の参

2022/6/1

[4786]

「命令形で攻略本」終焉のとき?

2022/6/1

[4788]

【A9・Exp.】使わずに使う「ハイトバー」【キーボードとマウス】

2022/6/1

[4982]

ベクトル新浦安とベクトル舞浜のまいおどり(踊)

2023/2/1


関連する記事


[4221]

【スーパードライ】啓林館「理数探究」(2020年4月)しゃきしゃき【お酒ではありません】 tht - 2020/10/1


[4969]

研究ホワイトボックス(49) とにかく「主成分分析つき回帰木」するには tht - 2023/1/1


[5244]

【あのシステム】「ぼくのかんがえたさいきょうの京葉線ダイヤ」とは何か(談)【大みか】 tht - 2024/7/7


[4347]

「テレビ視聴時間の規定要因を探る」(2016年7月)を読み解く(前編) tht - 2020/12/1


[4653]

ツールとは何か tht - 2021/11/16


[5239]

コロナ社「土木・交通計画のための多変量解析(改訂版)」(2024年3月)こもごも(談) tht - 2024/5/1


[4072]

「照焼大橋」不滅なれ(ゆんゆん編) tht - 2020/5/21


[4173]

きょうは新札幌でバウムクーヘン。 tht - 2020/8/25






neorail.jp/は、個人が運営する非営利のウェブサイトです。広告ではありません。 All Rights Reserved. ©1999-2026, tht.