フォーラム - neorail.jp R16
2021年8月の話題
更新:2022/5/23

[4634]

【ふれねる「自由研究 数学」の回(KAI)】 【縦書きディープなラーニング(※表示は横書きです。)】

ふれねる「自由研究 数学」の計(KEI)


(約17000字)

 [4626]などの続きです。「縦書きディープなラーニング」としては[3281],[3282],[3496],[4064]などからのゆるやかな続きです。


 番組名「歴史探偵」が一般語すぎて(しばらくお待ちください)Googleサジェストには「次回」「評判」「ヒストリア」とかいわれ。それはともかくNHKの番組「歴史探偵」が標ぼうする「最新の科学」とは…(てんてんてん)。

[4626]
 > 本当でしょうか。…実はこれ、本当なんです!(※北陸の市場でカニを指さしながらみたいな顔で)

 https://www.news-postseven.com/uploads/2020/12/11/kani_03.jpg

[4608]
 > この話が、どう「自由研究 数学」になってゆくのでしょうか。

[4613]
 > 2022年度からの「歴史総合」のガイダンスである。
 > ぬるい番組だと思ってぼーっと見ようと思ったのに2022年度からの「歴史総合」云々で目が覚める。

 もっぱら配信で見るひとは放送波(チャンネル)を意識しなくなっていると思われるけれど…(てんてんてん)。「Eテレ」ではなく「総合」だというのがミソ。(※後述)

[4627]
 > やってくれるぜ「歴史探偵」。(※七五調)これはもう「歴史総合」のガイダンスだと思って目をテンにして見ていくしかない。

 意欲的に先取りしていくこと自体は頼もしいですが、適切な指導がないまま好き勝手に突き進んでしまうとどんな弊害があるだろうか、といったことも見ておきませう。

[4626]
 > (高校生から見て)じぶんがこの先も10年くらい学び続ければ(≒27歳まで勉強すれば)こんな感じになれる…かな…という感じの先生が、いまのじぶん(※高校生)が見てもわかる方法で「写楽」を分析している(とわかる=他人が使っている研究方法の妥当性をじぶんでも確かめる)。(高校生が)主成分分析ができるできないとかおもしろいと思う思わないということとは別のこと。これを「理数探究」といいませんか。

 その途中でつきあたる変な国語の壁。…『変な国語』キター!!(※真顔)

[4014]
 > > キャットフード(ウェットタイプ)
 > > キャットフード(ドライタイプ)
 > > ドッグフード(大きさ・成長段階別)
 > > ドッグフード代謝エネルギー
 > > バイプロット描画(犬)
 > > バイプロット描画(猫) 
 > > 犬用総合栄養食
 > > 主成分負荷量の計算(犬)
 > > 主成分負荷量の計算(猫)

 > 「主成分分析」(という字面を見て)はケミカルで遠心分離機で白衣でスポイトだと思ってる人はいませんか。…えっ!? 違うんですかっ。

[3041]
 > 日本語では「事業」と「事業体」を区別できる一方、簡潔に総称することはできない(総称しているのか区別しているのか、どちらなのかがわからなくなる)

 > 「Enterprise」と広く総称でき、下位の細かい概念はまったく別の語で表現していける(混同する/される恐れが少ない)英語

 > 日本語で英語並みに正確な表現をしようと思えば、上記の「「事業のモデリング」の結果」のように、助詞「の」をいっさい省略せずに入れた上、括弧を用いて包含関係を明示するしかない

 『変な国語!』というよりは、国語の変なところ、といったこと。(※体言止め)

・(再掲)
 https://arx.neorail.jp/appendix/
 https://arx.neorail.jp/introduction/

 > 「初心者」という言葉に「良いイメージ」はまったくないと知ろう。謙虚さや実直さを表現する「初心に返る」「初心を貫く」などの「初心」という言葉と混同してはいけない。

 > 行政で使われる用語には、やさしい表現への言い換えができないものもあります。辞書で調べる習慣をつけましょう。用語は音や見た目だけで読むのでなく、漢字1文字ずつ正確に読み書きしましょう。

[3716]
 > TTDとも呼ばれる某ゲームの乗客が「目的地(着駅)」をもってトリップすることを念頭にしているかたも多いとは思いますが、しかし、日本語で「目的地」と「目的」が1字違いだからといってこの2つ(デスティネーションとパーパス! うわぁカタカナでしつれいしましたっ)を混同するのはとんでもないことですぞ。

[3764]
 > ▼「1字違いだからといってこの2つを混同」と▼「先頭から4文字までしか読めない」それに▼「書いてある通りに読めてすらいない」は、同じような発達段階の者が陥る国語の運用上のエラーだよね。(ま、ただのエラーだから訂正すればそれでいいよ@訂正されながら発達してゆく&訂正される機会がないと手遅れになるよ、の意。)

[3638]
 > NHK「やさしい日本語の試み」(2006年)については[3021],[3440]を参照。

 > 難しい単語が難しいというわけじゃないんですよ。
 > 難しい単語が難しいというわけじゃないんですよ。

[4557]
 > > 例文の意味から考えて、そもそも副詞は入れにくい

 > > 例文が情報不足で文脈や場面・状況などが想像しにくい

 > 「長い」文や発話にならないと副詞の出番はないし、副詞のはたらきも定まってこないので、副詞を選び取ることもできない。逆に、「長く」なりさえすれば間投詞的に副詞を使う余地が出てくる。○か×か。同時に2つのことを尋ねておいて「○か×か」も何も…(てんてんてん)。

[4403]
 > 原稿の書き方と読み上げ方の研究開発をしたのがNHKで、それが普及して民放があり、さらに職場や冠婚葬祭での話し方の手本にすらなっている、の意。国語とは何か。…いやさ、それを国語というんだよ。たぶん。(棒読み)▼「大村はま」と「単元」からの「数量化I類」については[3494]を参照。

 『国語』では冠婚葬祭しかできないといいました。…いー・いー・まー・せー・んー!(※真っ赤)

[3931]
 > 「カント」って、知っていますか。なるほど「カント」という言葉だけ知って、言葉だけをありがたがる人がいるのである。そういう年齢だとか発達段階だとかいうことで、それ自体はかけがえのないことではあるけれど、大人になってもそのままではいけないのである。

 > 「信号制御」という言葉だけ知っていて、それを別の言葉で説明せよと言われると笑うか怒るか無視する態度を想像する。

 できないとかわからないとは認めないで、怒るという特性がある。

 > それに、目の前のゲームがどんな実装になっていて、何を実装していないか(さぼったか)を見極めようとする態度に欠けると映る。おもむろにウーロン茶をすすりながら▼「実装EX」([3866])も参照のこと。…ウーロン茶! おん・ざ・ろーっく!! 今宵も始まりましたウーロン茶おんざろっくあなたにロック×ン(×きゅーん)。あ、さてさて。ウーロン茶といえばワタクシ(以下略)また来週っ!!(棒読み)

[3659]
 > > どうして海の中に花が咲いていないのだろうか?

 > 最初の1文で怒り狂うのが中学生だ。

 > > 現に花はあるわけだし、蜜を吸うミツバチがいて、ずっと昔には花もミツバチも無い時代があった以上、何らかのやり方で花とミツバチがある意味でうまいタイミングで「同時に」出現したと思うしかない。

 > 火に油を注ぐ。

 さらにウーロン茶を注ごう。(※真顔)

 > > 毎日中学生新聞毎週水曜連載でした。しかし、低レベルのためにこんなもの書くなという批判が強く、断念しました。中学生新聞側は文句無かったんですけどね。

 > うわぁリアル14歳。14歳の読者がお怒りになられる。

[3721]
 > 子どもから見て、具体的なことを何も言わずにはぐらかす、ものすごく無責任な大人というふうに見えてしまいます。

 教科書のように通り一遍にまじめくさって書いてないと、それだけで怒るのだ。そりゃあ教科書の記述はレベルが高いよ。しかし、それは教科書だけでいい。(棒読み)

[4092]
 > > 神戸花卉生産組合

 > どこの神戸ですか。というか、どう読めばいいんですか。

 > ここで「読めないよ!」とも気づかず、「じぶんが知ってる神戸」(※直訳)の読みでいきなり読んじゃうのが中学生なんです。

[4418]
 > さっすが神戸。レッツ「上沢駅周辺の飲み放題のパン・サンドイッチ(その他)のお店を探す」を使って何かを貯めよう。

[4127]
 > 中学生をばかにするわけではないけれど、高校生以上を対象にしているので、(高校生としては)乗り越えるべきものとして示している。

・「数学の基礎学力と確率・統計の理解度との関連性 −担当科目における比較分析−」(2013年)
 https://rikkyo.repo.nii.ac.jp/index.php?action=pages_view_main&active_action=repository_action_common_download&item_id=10839&item_no=1&attribute_id=18&file_no=1&page_id=13&block_id=49

 「統計」と「統計学」の見境がない。政府の白書みたいなのを眺めながら「主成分分析」はどこで使えばいいのか途方に暮れることになる。○か×か。

 > 文系の大学生は数学に対して抵抗感を持っていることが授業アンケートで顕著に現れており,「統計=数学」のイメージが固定化している傾向がみられる.社会でよく耳にするようになった「データ・サイエンティスト」に興味をもち,データの分析や処理を行うことに強い関心をもつ学生にとって,数学に対する苦手意識が学習意欲の障害になっているように思われる.

 後者のような興味があれば、あまり心配は要らないのではないか。もっと○か×か。

 > 相関分析により,数学の基礎学力と推測統計の理解度に中程度の正の相関があり,数学の基礎学力が高いと,推測統計の理解度が高い傾向があった.よって,数学の基礎学力は推測統計の理解度に影響を与えることがわかった.

 あくまで「推測統計」みたいに言い続けるんですか。えー…(てんてんてん)。

・(再掲)「記述統計量と推測統計量とは」
 https://support.minitab.com/ja-jp/minitab/18/help-and-how-to/statistics/basic-statistics/supporting-topics/basics/what-are-descriptive-and-inferential-statistics/

 「記述統計量と推測統計量とは」という言いかたはするが「推測統計」と呼ぶのはやめようじゃないか。

 > 記述統計量は、データを簡潔に要約します。データは、数値またはグラフで要約できます。

 > 推測統計量は、母集団からランダムに抽出したサンプルデータを使用して、母集団に関する推測を行います。推測統計量は、母集団全体の各メンバーを調べるのは不都合または不可能な場合に役に立ちます。

[4394]
 > これと同じですな。…まさに『記述地理!』が「地誌」で『推測地理!』が「系統地理」ですな!!(ぼふっ)しつれいしました。

 データのとりかたの違い(と、それに起因する取り扱い上の注意点)をいう分けかたであって、勉強する順番を規定するのに最適な分けかたではないと思うのだ。(キリッ

 https://tabelog.com/imgview/original?id=r6947455057287

[3927]
 > > チリM

 > …チリM! 地理だけに。(しーん)

[3755]
 > …うん!?(※ここで鉛筆の芯が折れます。…なんか不吉だ。)送電網を水道管のように考えちゃうだめなひとっぽさバクハツである。半可通だからこそ同じ単語ばかり何度も出てくる文章になってしまっている。

[3582]
 > > クロス集計表から入るのがスタンダードなんでしょうか、とてもわかりやすいです。推測統計やるんだったら、記述統計の基礎をやって、標準偏差くらいは理解してもらってからと思い込んでいましたが、どうしても数式が避けられず統計が苦手な人には壁が高いようなので、こんなやり方もあるんだなと新鮮でした。

 > …うわぁ。式がわからないのでなく、標準偏差をどこで使うのか(使わなかったらどんな不都合があるのか)がわかるところまで説明がないとか、(あなたが用意した研修での)説明が逆向きだと感じられている(※中身はいいから注意点を先に教えてよ! 「おしながき」をぜんぶ見せてよ! あなたがそこで握ってる紙きれ! それを直接、読ませてよ!)とか、そういうことなんですよ。わからないひとのことがわかっていないひとって、こうですね!

 得意でもないのに統計学を教えなきゃならなくなった先生がかろうじて先生に見えるようにする(教える内容を高尚そうに見せる)ということばかりだったとは思うよ。(※個人の感想です。)

[3498]
 > 「『推測統計!』からの『記述統計!』」については[3403]を参照。わあぃカステラは和菓子か洋菓子かっ([3485])!

・超高解像度「カステラ」のイメージはこちらですか??
 https://upload.wikimedia.org/wikipedia/commons/d/df/Castella_002.jpg

 すごーく気合いの入ったカステラの写真がウィキペディアに。(※ソコジャナイ。)

[3473]
 > やっほーと叫びながらクラスターな滝つぼスプラッシュ!

[4130]
 > MSNが勝手に勧めてくるワニの動画とか見てないで(げふ)…MSNねぇ。(※全角)

・「推測統計学」とは
 https://kotobank.jp/word/%E6%8E%A8%E6%B8%AC%E7%B5%B1%E8%A8%88%E5%AD%A6-83035

 > 応用面として標本調査,品質管理,実験計画法等があり,世論調査,製品検査,医薬の効用,教育・心理関係など,自然・社会科学にわたり多方面に利用される。

 「応用」だから(じぶんは)やらなくていいとか変な季節にちょっとだけとか(ぐぇ)えー…(てんてんてん)。

 > ピアソンの研究は記述統計学の完成に大きな貢献をしただけでなく,それから自然に母集団の概念が導入されるような新しい段階にまで到達することができた。

 「新しい段階にまで到達」したら、後戻りはできない。

 > 統計データを整理要約する方法を考察する記述統計学と,確率モデルを前提にして,データから対象における未知の要素についての判断を導く方法を与える推測統計学の二つの分野からなる。

 > 推測統計学の発展により,標本から得られた推定値の誤差の評価や統計的仮説検定が客観的に行えるようになった。

 「二つの分野からなる」という言いかたは妥当か。「推測統計学は習ってません!(※白目)」といって「記述統計学だけで取り組みました!(※白目)」ということがいまさら許されるか。それはさすがに…(てんてんてん)。

[3082]
 > > 思えば無線工学Bって単に単位を合わせたり数字の次元を合わせることと国語力で何とか選べる設問になっているではないですか。

 > > 無線工学Bは特別難しいというわけではないかもしれませんが、他科目に比べて専門性が高いと思いました。

 > うーん、それは応用力が試されていて(何しろ「B」ですし)、いわば「基礎的な応用力」(応用力を発揮したりのばしたりするための、分野に依存しない基礎的な学力のようなもの)がないと、いくら「専門知識」をたくさん仕入れても、どうにもならないのではないかと心配されます。こればかりは、どうやっても後年の勉強では得難い(できないとまでは決めつけられませんが、限りなく難しい)部分ではないかとも思います。

 「応用」という言葉を持ち出して説明すると、そのように理解される。

[3403]
 > > 統計教育の中でも特に多くの児童・生徒が参加するものに,財団法人全国統計協会連合会主催の「統計グラフ全国コンクール」がある。このコンクールには「自分で観察した結果や各種の統計資料を整理し,分かりやすいグラフ構成とほどよい配色で,効果的にまとめられた(2)」作品が多数応募される。これは明らかに記述統計の域を出ず,このようなコンクールへの出品が統計教育の一つの目標となっているのが,我が国の統計教育の現状なのである。

 > うーん。『推測統計!』からの『記述統計!』(※)などと、あまり固定的に呼びつけないほうがいいと思いまーす。実際に学んで、結局、ぜんぶ学ばないと統計を学んだことにならないと思いまーす。「新しい現実である」って、こうですねー。(棒読み)

 > ※「量子計算機」が出てきてから『古典計算機!』と呼ぶソレ([3180])、の意。「量子計算機」が出た以上は、既にセカイは変わったのですよ。のうのうと「古典計算機」と呼び分けさえすれば従来の領域は手つかずで教えたり研究できたりするかといって、とんでもない! 「量子計算機」のために導入された発想や新しい知見は、「計算機」というセカイの全体に効いてくるわけです。これを「新しい現実」と認識できなくてどうしますか、の意。

[4221]
 > > グラフなどのデータも充実して

 > それを「データ」とは言わないぜ、せんせー。

 > 日常の業務で「データ処理」を指して(端折って)『データ』と言っている説。やーい業務用の言いかたを生徒の前や外向きの場でしてはならぬ。アカデミックでなければならぬ。

 先生がだめじゃん。…だめじゃん!(※見解です。)

・「いわゆる「推測統計学」における相関分析法について」(1965年)
 https://kansai-u.repo.nii.ac.jp/index.php?action=pages_view_main&active_action=repository_action_common_download&item_id=6647&item_no=1&attribute_id=19&file_no=1&page_id=13&block_id=21

 > “ステューデント”

 出ました「“ステューデント”」(全略)ごちそうさまでした。(※恐縮です。)要するに、統計学の授業や教科書はこういうふうに重々しいから好かん。えー…(てんてんてん)。

※あくまで個人の感想です。

[4285]
 > 文頭「なので、」話者はろくでもない([4208],[4257])。

 それはじぶんでもわかっている、という場合のほうが多い。○か×か。

・「高等学校における「データの分析」その後の統計教育実践の一事例 −データを活用する力の育成の観点から−」(2018年)
 https://www.ism.ac.jp/editsec/toukei/pdf/66-1-135.pdf

 先にいうが「PDCAサイクル」が出てくるとろくでもない(書き手も本気じゃない=しかたなく書いている)という経験則には完全に同意いただけるものと信じている。(棒読み)

 https://oranjutanj.files.wordpress.com/2019/10/too-busy-to-improve.png

 > データの分析はとても難しいので専門の人に任せたほうがよいと思う
 > データの分析は手間がかかるので,コンピュータの得意な人が有利だと思う
 > データの分析は数学っぽくないのに数学の教科書にあって不思議に思う

 わかってておっしゃる。…このこのぅ!(※真顔)しかたがないとは思うが参考文献がないに等しい。だから見たけど読まなかった。これは読まなかった。問題ない。(※表現は演出です。)

 https://image.itmedia.co.jp/nl/articles/2107/07/l_kutsu_210707pdca01.jpg

・(再掲)ARXがとまらない。
 https://arx.neorail.jp/units/#A%E5%88%97%E8%BB%8A%E3%81%A7%E7%90%86%E6%95%B0%E6%8E%A2%E7%A9%B6

 > 大学ではどのように専門分野が分かれていくのかを実感的に知ってもらうという「高大接続」の色が濃い。高校生にとって、これまでの学校での科目とは異なる分かれ方となる、例えば「工学」「心理学」「農学」などの分野を『発見』してもらいたいということでもある。

[3071]
 > 「SSH」でない普通の学校
 > 「SSH」でない普通の学校

[4221]
 > 「理数探究=イコール=理科でしょ」などと思わせないように配慮を尽くしてほしい。大学の教員の指導(*)を受けられるなら「工学」「心理学」「農学」の題材を扱ってもいいし、そこで班分けして、自主的に選ばせるということと、指導する側も分散させて負担が減って指導そのものは手厚くできるというような一石二鳥を狙ってほしい。なあに大学はたくさんあって教員もたくさんいるのだ。(棒読み)

 > > 「探究」というからには、じぶんでデータを加工したり整理したりして、じぶんが設定した課題や仮説に応じて、じぶんの責任で複数の私鉄を比較してほしい。

 > データがないものは取り上げない。じぶんの意見など必要ない。

[3587]
 > 心理学を修めていない者が、Rの操作だけを覚えて「因子分析」を行なってはならない(無資格××である)
 > 経済学を修めていない者が、Rの操作だけを覚えて「時系列分析」を、実経済のデータを題材として行なってはならない(無資格××である)

 “独学で!”自動車の運転をマスターしたと称して公道で運転。それを無免許運転という。

 > 「時系列分析」は応用範囲が広いので、経済学とは関係なく分析手法だけを使うということはあるとしても、経済学が培ってきた背景を理解せずに小手先で使ってみせるのはおこがましい(経済学における「時系列分析」が既に直面し解決してきた数々の問題を最初から学んだほうがよい)
 > 「因子分析」はただちに心理学の分析手法であるので、心理学を修めずには着手してはならない(心理学を修めた者と共著しなければいけない)
 > 数理的な側面のみから「因子分析」と「主成分分析」を代替可能とみなすことは適切とはいえない
 > 「主成分分析」は単なる数理的な操作であることが明確であるので、分野を問わず活用可能であるが、「因子分析」を行なわずに心理学的な実験結果や社会学的な調査結果などについて(「主成分分析」だけで)考察してはならない

[4248]
 > 要するに、大学に入らないうちに余計なことすんな、とおっしゃる。

[3670]
 > 1人のひとに一貫した責任を負わせる、その「一貫した」というところが大事なんですよ。たぶんですけどね。外部から説明を求められたときに、説明になっていないような回答しか出せないということはあらかじめ防がねばなりません。ま、それならことさら説明を求められることもないんでしょうけど。

[3925]
 > マクロミルさんの説明を参照すると、Ward法ひいてはデンドログラムを描いて言葉で説明して顧客(※調査の発注者)をぎゃふんといわせるとき、そこで投入するのは変量と変量の距離の行列だとか、属性などで分けたサンプルとサンプルの間の距離(※)だとか、そういう、それより前のところでかなり要約されたり抽象化されたりしているものをもってきてデンドログラムするんだと読めます。そういう説明が、Ward法の例題みたいなテキストだけではよくわからないまま終わっちゃうんだよねということでした。

 一貫してマクロミルさんに責任を負わせる。「デンドログラム」から「大トロ」「中トロ」への超連想。(キリッ

 https://www.macromill.com/wp-content/uploads/images/service/data_analysis/cluster-analysis/image_001.png

 > そのようなクラスタリングになったのが妥当なのかそうじゃないのかは、わたしたちの責任で判断しなければならないのです。シルエット値が大きいから正しい? …ののんのん! そういうクラスタリングになりましたよということを計量してくれる(度合いを示してくれる)だけであって、正しいか正しくないかなど何も言っていないということを忘れてはいけません。

・(10月4日)
 https://teratail.com/questions/362776

 > 69項目のアンケートへの消費者の回答データ
 > 項目数が多すぎるため、因子分析を行い11個の新しい変数を生成した。
 > 3つのクラスターができた。

 「できた」ではなく「した」んでしょ。

 > 11個でも変数が多すぎ、考察が困難であった。
 > そのため、11個の変数を2,3個まで減らそうと考え、主成分分析を行った。
 > しかし、累積寄与率が80%を超えるためにはPC7まで必要で、2,3個まで変数を減らすことが出来なかった。
 > 7個では図示できないため、上手く考察することが出来ない。

 > まだ回答がついていません
 > まだ回答がついていません

 すごーく実践的だと思うんですけど、即座に回答がついたりはしないんですねというか、それはネットではなくじぶんの指導役に聞けといいたい。特に「因子分析」ご指名の(マーケティングや心理学などのお堅い)宿題であるならなおさら、勝手なことをしてはいけない。技術者のコミュニティで解決される問題ではない。(※見解です。)

 > 3次元以上の主成分分析の考察方法
 > 3次元以上の主成分分析の考察方法

 そのようにとらえてむずかしく考えちゃう。

[3584]
 > ▼いま目の前で起こったありのままの「主成分分析(※ワイルドなデータを使用しています=むしろじゃじゃ馬です)」と、▼授業や教科書で出てきた「きれいな主成分分析はこちらですか??(わざと泉に落としてみせるとGOOD!!)」みたいなのとが、まるで同じものとは思えないというくらいの戸惑いがなかったでしょうか。

・日経リサーチ「因子分析」
 https://www.nikkei-r.co.jp/glossary/id=1610

 > 因子分析が対象とする分析データは「数百社の企業×イメージ25項目」のデータ行列である。
 > このデータを分析した結果として、もっとも重要なoutputは「因子負荷行列」と呼ばれる表である。因子分析を自身で実行せずに、結果を利用するだけの立場の人も因子負荷行列だけは見方を知っていて、結果の解釈をしながらレポートを作成するのである。「因子パターン」ということも多い。

 > 因子負荷行列は、元の25変数と、新しく作成した因子による行列(表)になっており、因子が変数に与える影響力(負荷)の大きさを示している。

 > おおよそ相関係数のように「±1の近いと関係が強く、0に近いほど無関係」と解釈してよい。

 > 係数を100倍して見やすく
 > 係数が相対的に大きい部分に色をつけ

 https://www.nikkei-r.co.jp/files/user/images/glossary/1610_02.png

 読んでそのまま、できるんじゃありませんこと? …あらあら、まあまあ!(棒読み)

 > この因子負荷行列から因子を解釈するのだが、この解釈に関しては数学的な基準はない。むしろ文学的でもあり、マーケティング的であり、主観的でもある。
 > 色のついた変数が同じグループだが、その意味を考えて、グループに共通するような抽象的な概念を考案するのである。

 むしろ作文である。(キリッ

 > この言葉選びは難しい場合もあるし、センスを問われることもある。
 > 因子の解釈は必ずしも短い単語にする必要はない。もっと説明的であってもかまわない。

[3676]
 > > 確率、統計等の応用的分野は必要なときに勉強すれば、大人になってからでも覚えられるものであって、そのときには生半可な入門的知識よりも基本的分野の学習で養った強靭な思考力、鋭い感性の方がはるかに役に立つのである。

 > > 鋭い感性
 > > 鋭い感性

 まさに「大村はま」([3494])である。「主成分分析」がどうたらと変な脇道に迷い込まず「因子分析」をちゃんとやれ、統計ソフトが使えても「言葉選び」ができなければだめだ、ということに尽きる。(※恐縮です。)

[3689]
 > サインコサインなんになるぅ…じゃなくて。

[3399]
 > ずんばらぼー!
 > 数学のことばで説明するのは無理ですやめておきます!

・(再掲)むりっと「ずんばらぼー」のイメージです
 http://www.ed-rent.co.jp/image919.gif
 http://image.itmedia.co.jp/nl/articles/1603/17/l_kontake_1600317penguin01.jpg

[4466]
 > 紙面の製作システムからテキストが流してよこされるウェブのCMSでできる範囲でしかやっていない。

 > 縦に見て多いほうから3つまでを太字で示しました。

[4587]
 > 書こうとする内容が理系ちっくなのに、書きかた(*)が雑誌の程度なのである。端的にいえば、つりあっていない。

 > *文体がくだけているいないということでなく、用語の扱いが厳密か、文章上の飾りを優先して(かっこつけて)書いてしまうのか、冗長でリズムが悪くダサい文になってしまうが正確に書くことを優先するか、括弧書きをちゃんと使えるか、といったこと。

 > > 清代末期の中国では、スコットランド国教会の宣教師アレクサンダー・ワイリー(英語版)(1815-1887年)が、19世紀後期の初めから半ば(1847-1877年)まで『幾何原本』後編9巻(1856年)など数学書の翻訳に取り組んでいたが、その際に記号と共に「括弧」という語を用いた。

 > 翻訳しながらとか数学だとか、そういう、そこに書いてある文や式をさらーっと読んだだけでは済まないような場合に括弧を多用していく。また、そのようにさらーっとした文では書けないときに括弧の中にもいろいろごちゃごちゃと書く。度が過ぎるとクリスタルである。ああ、あの、注釈文学とかいう痛いやつ。(※遠い目)

 そして歴史探偵「写楽」で主成分分析の回([4626])の『答え合わせ!』みたいなコーナーです。

・村上征勝、浦部治一郎「浮世絵における役者の顔の描画法に関する数量分析」統計数理 Vol.55, No.2(2007年)
 https://www.ism.ac.jp/editsec/toukei/tokeisuri-55j.html
 https://www.ism.ac.jp/editsec/toukei/pdf/55-2-223.pdf

 2007年とかいう絶妙な新しさの村上センセイをぜんぜん知らなかったことをお許しください状態。(※恐縮です。)

 > 美術品としての浮世絵の研究に数量的な観点からのアプローチがされるようになったのはごく最近のことである.2002年に,山田他(2002)は浮世絵・美人画に描かれた女性の顔を対象として絵師の描画法に見る特徴について報告しているが,この研究が浮世絵の数量分析の嚆矢と考えられる.

 https://nrid.nii.ac.jp/ja/nrid/1000020248751/

 > 一般に絵画の分析は,色彩という観点からの研究と,描かれているものの形状という観点からの研究に大別できる.今回分析対象としたのは浮世絵版画である.浮世絵版画の場合,浮世絵の保存状況の違いや何回目の刷り版であるかによって浮世絵の色彩が異なるということが十分考えられる.それに対し,描かれたものの形状は比較的明瞭である.そこで浮世絵版画に描かれている顔の形状に焦点を当て,これを数量的な観点から分析する.

 > 37の計測点の中の3点で構成される角度の情報を用いる.ただし,37の計測点の中の3点の組み合わせの数は優に2万を越えているため,3点から構成される全ての角度の情報を用いるのではなく,先行研究(山田他, 2002)で,9人の浮世絵師の顔の(形状の)描き方の特徴を把握するのに有効であった,表1所掲の12種類の角度のみを分析に用いることとした.

 この時点ですでに12種類の角度に絞り込まれていたということでした。しかし「所掲の」とは古めかしい。(※ソコジャナイ。)

 > 表1に挙げた12種類の角度を用い,相関行列を用いた主成分分析で分析している.
 > 写楽は立役と女形の顔の描き方を意識的に違えており,それが第1主成分に現れているものと考えられる.

 これをアレンジして(※使うデータを変えて⇒考察も変わる)、専門職大学院の演習課題に仕立てて受講者にやらせるというなら、すごくよくできた演習課題だと思う。専門職大学院とはいえ修士課程とあらば、畑違いの分野の科目を必ず履修せよという要件(*)がある。多くの院生にとって浮世絵なんてアウェーのテーマだからぴったりである。(棒読み)だからといって浮世絵だけで終わりにしないで特集「文化を科学する」ぜんぶ読む。たぶんこれだね。(※恐縮です。)

*もちろん学部でもあるけれど、まだ専門性があまり分かれていない&高校で習ったことの記憶も鮮明なうちにやるのと、修士課程でよその専門のもいくつかは受けなきゃというのとでは、難しさが段違いである。

[4626]
 > 教科「情報」でプログラミングを習うけれど、(大学院を目指して)データサイエンスに進むという方向性を持つ限り、最終的にはじぶんでは生のコードを極力、書かないのが正しい態度ということになる。

[3901]
 > 稲毛海岸の駅前の雑居ビルの1室を借りてISDNを引いて白衣を着て天井に向かって叫べ!(違)

[3695]
 > 技術者(あなたは1時間でどれだけのコードを書けますか)にゲームの企画のような(『青天井』の!)仕事をさせてはいけないよ。

[4249]
 > 『青天井!』で取り組まれるべき企画業務を技術者という職域のやり方やコストの計算でああだこうだということは、企画業務という職域を侵すものである。職域が違うということを最初に確認してください。

[4350]
 > 北神アベレージっ!(違)

[3398]
 > 算数なのに白衣で!

[4297]
 > 白衣は何色ですか

 ちなみに「白衣のポケットに手」のポーズは、カタログの写真で「ポケットつきですよ」とアピールするモデルさんのポーズだ。質の低い印刷だとか白黒だとか、さらにコピーされてリソグラフされてから(それを見て注文させられる)でも、ちゃんとわかるようにね。(※ソコジャナイ。)

[4101]
 > > 聞いた話で高校の数学の先生が自作OSつくる活動してたとか

 > あたりまえだ。数学を専攻して卒論を書かないといけない。研究テーマはコンパイラやOSだろう。もうちょっとやわいとXMLだ。…やっ!! やわいとか言うなぁぁぁ!!(※エコーはいりまーす)

[3745]
 > 固有値分解や特異値分解のアルゴリズムをじぶんでつくってみようみたいな理学部みたいなことを言うんじゃない限り簡単だよとはこのことだよ。

[4130]
 > プログラミングを教えてよいのは、理学部でプログラミング言語などを卒論のテーマにして合格して卒業した者に限る。単にじぶんが習いましたというだけでは、人に教える資格までは備えていないのだ。▼(公財)阿蘇火山博物館「夏休み自由研究スーパー相談会」については[3476]、▼筑波大学全学技術委員会「教員の監督を受けもせず技術職員だけで」については[3520]を参照。

[4222]
 > そういう認識をしているとわかるような話題が出てこないなら卒論は書いてない(≒書いたうちに入らない)ひとなんだなと思わざるを得ないが、それがいけないというのではもちろんない。立場が違う。

・岩崎学「主成分分析が一番好き」より、本日は時間の関係で「四の五」まで(2012年1月2日)
 https://www.ibm.com/blogs/solutions/jp-ja/spss_02_manabu-iwasaki/

 > 主成分分析の醍醐味は、何だか訳の分からない多変量データからクリアカットな構造を見出した瞬間にあります。主成分軸の(自分勝手な)解釈も楽しいことこの上ない。まさに、自分のことを棚に上げれば(棚に上げるのは教師の得意とするところ)、データ解析のセンスが問われます。

 > 主成分分析から入っていけば数学の魅力を知り数学好きになること請け合いです。

 > 多変量データがあったら四の五の言わずにまず主成分分析をしなくてはなりません。MUSTです。多変量正規性なんてうるさいことをいう必要はありません(極論かな)。

 ところで「相関行列を用いた主成分分析」とは…(てんてんてん)。

・日経リサーチ「主成分分析」
 https://www.nikkei-r.co.jp/glossary/id=1632

 > 主成分分析は下のように相関行列Rの固有値問題を解いているだけである

 そもそもそれを「主成分分析」という。じぶんの分析に都合のよい距離(類似度)を用いてこさえた距離行列や何らかのデータ行列そのままをほうりこむという『荒業!』を、そうと承知していればよい。○か×か。(※恐縮です。)▼市川市経済部のかたがすなる「方向角による格子状道路における2点間の迂回率の予測」(2014年)については[3283]を参照。

※Googleサジェストでいうと「浮世絵 顔 同じ」…じゃなくて、「主成分分析 標準化 理由」「マハラノビス距離 主成分分析」みたいなのがある。さもありなん。

 > 相関行列か共分散行列か
 > 変数の単位がすべて同じ場合は、共分散行列を分析してもよいが、単位が異なる変数が混在している場合は相関行列を分析する。相関行列ということは変数が基準化されているということなので、単位の相違による影響は消えているからである。単位が同じ場合でも、分散が大きく異なる場合は、分散の大きい変数だけに影響を受ける主成分が構成される。もしも特定の変数が重要であるという前提がなく、同様の重要性で分析したい場合は、単位が同じ場合でも相関行列を分析するほうが、無難な結果を得られる。

 「無難な結果」などとおっしゃる。(※ジト目)「外れ値」「対数的」といった用語を使って説明しなおしてみませんか。えー…(てんてんてん)。

 > 行列の固有値問題を解くということは、行列を固有値と固有ベクトルに分解することであるが、主成分分析において相関行列の固有値は主成分の分散であり、固有ベクトルは主成分得点を算出するための重みであった。

 > 主成分の解釈は固有ベクトルでも可能だが、もっと分かりやすいのは、主成分と元の変数との相関係数を要素とする構造ベクトル(下図)である。

 > 構造ベクトルは一般に、合成変数と元の変数との相関係数を要素とするベクトルである。その平方和が分散(固有値)に一致する。

 > 解釈可能という観点からは「固有値の大きさが1より大きい個数」という基準(固有値基準、あるいはカイザー基準という)が目安になる。相関行列を主成分分析する場合、固有値が1より大きいということは、元の変数1個分以上の情報を持つ成分ということになるからである。しかし、固有値が1程度の場合は、特定の変数にのみ関係する成分となる場合もあって、複数の変数を「合成」した成分とならず、その結果として解釈が難しいときもある。その意味では、因子分析のほうが解釈しやすいので、マーケティング調査では主成分分析よりも因子分析が利用されることが多い。

 > 相関のないデータは主成分分析を適用できない。計算はできるが分析する意味はない。主成分分析は相関のあるデータを無相関の合成変数に変換する手法なので、すでに分析は終わっていることになる。また、ほとんど無相関の状態のデータに対しても分析の効果は少ない。

 道に迷ったら日経リサーチに戻るとよい。(※個人の感想です。)


この記事のURL https://neorail.jp/forum/4634/


この記事を参照している記事


[4623]

ふれねる「自由研究 数学」の肩(KEN)

2021/8/25

[4626]

ふれねる「自由研究 数学」の写(SHA)

2021/8/25

[4627]

ふれねる「自由研究 数学」の軽(KEI)

2021/8/25

[4637]

ふれねる「自由研究 数学」の定(TEI)

2021/8/25

[4638]

ふれねる「自由研究 数学」の道(DAU)

2021/8/25

[4639]

ふれねる「自由研究 数学」の位(CRY)

2021/8/25

[4640]

ふれねる「自由研究 数学」の首(SHU)

2021/8/25

[4642]

50ヤード700円からの『勉強量』と『集客力』【メタ目次あり】

2021/11/1

[4649]

「A列車でいこうはじまりの観光計画公式サイト」から「A列車で行こう3D 攻略 難易度やさしい 利点」まで(後編)

2021/11/16

[4670]

きょうは流しのギターで離れの島。

2021/12/1

[4697]

夜明けのコールサインは体言止めで(談)【音楽資料室あり】

2022/3/1

[4703]

シニカルでグロテスクでコミカルな「アンチ・アンチ・オペラ」をサントリー「ゲーターレード」で読み解かない(談)

2022/4/1

[4718]

ここからはじまるARXの「すももコース」とは(再)

2022/4/1

[4766]

超大陸五反田(カッコカリ)の弐

2022/6/1

[4778]

Re:[4741] A列車で行こう「みたいなゲーム」はこれだ(談)

2022/6/1

[4803]

【A9V2】「食べ放題でビール半額だ!」を読み解かずに読み解く(仮)

2022/7/1

[4831]

きょうは東葛西でダンドリーチキンとキャラメルポテトそれにアセロラポンチからの小松菜チーズケーキ。

2022/8/1

[5027]

【A9・Exp.】ここまで深刻だった「縦横比を気にしない人達」問題(再)

2023/6/1

[5068]

左上にタイトルを書く。京浜東北線を拾う。(前編)

2023/8/1

[5073]

時制はむずかしい! / 「じぇら」 / ほか

2023/9/1

[5075]

一人負け日本語圏の衝撃【ダークパターンあり】

2023/9/1

[5156]

「A列車で行こう9 評価」再び(再)

2024/2/1

[5171]

きょうは独学でタンポポの天ぷら。

2024/3/1

[5239]

コロナ社「土木・交通計画のための多変量解析(改訂版)」(2024年3月)こもごも(談)

2024/5/1

[5251]

きょうは横浜国語で玉虫色。

2024/9/1

[5253]

【A9・Exp.】なぜ『開発街』とは言わないのか(談)【鉄道ファン】

2024/9/1

[5267]

ふれねる動画の矜持無用論(補遺編)

2024/9/9


関連する記事


[4347]

「テレビ視聴時間の規定要因を探る」(2016年7月)を読み解く(前編) tht - 2020/12/1


[4628]

ふれねる「自由研究 数学」の忙(BOU) tht - 2021/8/25


[4543]

【東口直結】特異値分解とは何か(再)【多様な個性が響き合う】 tht - 2021/5/1


[4969]

研究ホワイトボックス(49) とにかく「主成分分析つき回帰木」するには tht - 2023/1/1


[5018]

【A9・Exp.】そもそも「資産」とは(補遺編) tht - 2023/6/1


[4296]

子どもがひねり出す謎の『理路』(11) tht - 2020/11/1


[4283]

「A列車で理数探究」と書いて「マジ」と読む(談)【両目】 tht - 2020/11/1


[4544]

研究ホワイトボックス(46) 複雑なデータと「対話」するには〜郵便番号データを例に(主成分分析編) tht - 2021/5/13






neorail.jp/は、個人が運営する非営利のウェブサイトです。広告ではありません。 All Rights Reserved. ©1999-2024, tht.