・いま問う「数量化X類」一般化のココロミ(名) ・高校2年生で読みたい「データを未来に活かす」(2011年7月) ・「数量化理論」(1951〜1959年)をかみつたセンセイで読み解く(仮) ・土木学会(1983年・1985年)で「数量化I類」「数量化II類」それに「数量化IV類」を読み解くココロミ(土) ・「現代数理科学事典 第4刷」(1994年4月)をひも解く(紐) ・それでも気になる「V類」「VI類」(1973〜1976年) ・「SD法」(1952〜1957年)に寄せて(寄) ・表1 「数量化N類」一般化のココロミ(※森本2005年より作成) ・表2 現代の水準で新規「エレガントな多次元質的分析へのいざない」のイメージですのん(※独自に作成)
(約31000字)
このフォーラムでは「研究ホワイトボックス」と題して、「研究を楽しく「追体験」! 真っ白のキャンバスに虹色の未来を描く方法、教えます。」としています。
実質的には[3169],[3400]あたりの続きです。
・[3169]
> 「レーベンシュタイン距離」
> 動的計画法
・[3400]
> 「平均」だけでは「分布」が見えない
> 『対話的なエラボレイション』(1996年)から「近年機械学習」まで
各々の既に確立された分野に閉じての研究では実際上の問題はないと思われますけれども、ちょっとはみ出したことに取り組んでみたいといったとき、わたしたちの前に立ちはだかるのが、「(だいたい同じようなことなのに)呼びかたが違うのでわからない!」という問題であると、こういうわけです。
[3581],[3582]に「解決編」にあたる内容がございます。あわせてご覧ください。
●いま問う「数量化X類」一般化のココロミ(名)
2017年度に新設された新しい最新式(!)の豊田センセイの講義(はっ、はーまいおにーっ[3406])が、(サンプリングを前提として導入されてきた検定ひいては)「数量化理論」の跡形もなく「ベイズ流」で新規金型(!)されて、との前評判ではございますが、じゃあ(※)「数量化」で知られる林が「ベイズ流」を学ばなかったのかというと、そうではないとわかってきます(=後述)。
ネーミングとアップデートの問題だと思うんです。「数量化X類」(※なぜかローマ数字)と呼ばれてきた方法にも、これまで行われてきた教育にも、一定の合理性はあったと思うんです。あしからず。
・ウィキペディア「数量化理論」
https://ja.wikipedia.org/wiki/%E6%95%B0%E9%87%8F%E5%8C%96%E7%90%86%E8%AB%96
> Hayashi's quantification methods
> 1940年代後半から50年代にかけて開発された日本独自の多次元データ分析法
> I類、II類、III類、IV類、V類、VI類までの6つの方法があるが、現在、I類からIV類までがよく知られている。この何類という名称は、1964年に社会心理学者の****によって命名されたもので、以後その名称が定着した。
> 数量化III類は主成分分析あるいは因子分析に対応し、各国で独立に同じ解を与える手法が発展してきており、パリ(略)****により1970年代初頭に開発されたコレスポンデンス分析(対応分析)(略)などと本質的に同じものである。また、数量化IV類は多次元尺度構成法(MDS)に包含される。
いま、数学的にニュートラルな立場から、▼コンピューターの高度な活用を前提として、もっとよい分析方法はないのか、▼分析の本質をとらえたネーミングを考え直すべきではないか、▼まったく異なる分析方法を「つまみ食い」的に並べてあたかも『数量化理論』と呼ばれる総合された理論がある(⇔これ以外にはない)かのような印象を学習者に与えるのはいかがである! …などと述べてみたいんですけど、わたし残念なたわし、数学は残念なので無理ですやめておきます!
※現代数学のセカイの全域にわたって1人で解説できるような『数学解説者!』みたいな人も、なかなかいないだろうとの…本当でしょうか。「現代数理科学事典」のすべての内容を広中センセイがおひとりで書き上げることなどありえないとの…デスヨネ〜。
・[3213]
> MOOCは、あくまで学部3・4年生のレヴェル([3097])の『ハイスピード・アップデート』(山内氏)にしか通用しないと思いまーす。(恐縮です。)誰かがMOOCを用意してくれるのを「口を開けて待っている!」ということです。ある時点で、MOOCの教材の作成が追いつかないという『壁』のようなものが訪れると予想できないでしょうか。(詳しいかた予想してくださいオネガイシマス、の意。)
・[3125]
> 国鉄の研究開発の現場では、意欲的に先進的な取り組みがなされた(ほぼリアルタイムで「1958年のサイバネティクス」[3041]、あるいは「1964年の速度感」[3124])ものの、その後、研究体制を継続的にアップデートしていける仕組みが機能しなかった([3041])とみられます。
(ある研究課題や分野などに即して、いわゆる「ブルーオーシャン!」な時分に)スゴい人(…とみなされるけれども、そもそも「ブルーオーシャン!」であれば誰でも『第1発見者!』になれる確率が高い!)がいたときだけグングンと研究が進んで、あとはそれっきりというのが東海道新幹線以後の国鉄(の研究所⇒※)であり「数量化理論」であり、との印象が否めず困ってしまいます。あとの時代の者は、いったい何をしてきたのでしょうか。…ギクッ。
※ラッパ型スピーカーも高らかに…国鉄解体への序曲をバックに「公団」というものが新設されて、(研究者としては)心機一転、コンピューターを使う新しい研究にまい進されたと、かようにナイーブな幻想を仮に持ってみるところであります(=別途まとめます⇒[3494])。
●高校2年生で読みたい「データを未来に活かす」(2011年7月)
・(再掲)「データを未来に活かす」ダイヤモンド社(2011年7月)
http://www.diamond.co.jp/book/9784478016343.html
https://images-na.ssl-images-amazon.com/images/I/81jfXZiUxXL.jpg
> (134ページ)
> 研究業績は、国民性の統計的研究・意識の国際比較方法論・動く調査対象の標本調査論など多岐にわたる。なかでも、質的データに合理的に数値を付与する「数量化理論」は、統計的方法の適用範囲を飛躍的に拡大させた。
> ◎数量化理論
> もとになるデータや目的に応じて手法を使い分けるため、I類〜VI類までの六つの手法が提案されたが、現在ではおもにI類からIV類までがよく使われている。
この本に書いてあることは、統計数理研究所(統数研)の一種「みなし公式見解」とみなされると思うんですけど、このあとにI類からIV類までの説明があるにはあるのですけど、うーん。実際にお読みになってみてください。高校2年生のかたが夏までに(6月ごろに)読むという前提では、「なぜV類やVI類は使われないのか?」という、そちら側から書かれたほうが興味を引くかもですよ。本当でしょうか。
※建物としての統計数理研究所については[3151]を参照。
・高解像度「統計数理研究所」のイメージです(2016年10月26日PST)
https://pbs.twimg.com/media/CvvH5rMUIAAQpaD.jpg
https://pbs.twimg.com/media/CyPCkgGUoAAa3Ge.jpg:large
http://topics.nichibun.ac.jp/data/d/2016/10/31/s002/imgs/01.jpg
https://twitter.com/tousuuken/status/791447517623820288
研究所の電話番号が050! …じゃなくて、「あんたがた天気予報くらいしかわからんじゃろ」キターっ。…やだなぁ。アンケートの分析などの話題も高校生や一般向けにできるはずですよ。本当でしょうか。
・(先述)
> 高校2年生の前半くらいで読んでいただきたいかなぁ、と思われました。(全編を読んでの見解でございます。)学校の図書館(図書室)になければ、購入希望を出されるとよいでしょう。必ず買ってくれますよ。ええ、買わないはずがないですとも。そして、図書館がだめなら、理科やコンピューターの部活動の先生に相談するです! 「高いから買えない!」だなんて、とんでもない。図書<ほん>は他人<ひと>に買ってもらうものなんです! へー…
さあさあ『図書<ほん>は他人<ひと>に買ってもらうもの!』ですよ。
・[3137]
> 情報(電気・電子・機械・土木・情報でいう情報)だけを勉強し、機械(同、機械)は勉強しませんでしたという身には、この図が衝撃をもって受け取られます。「電気系統」と「空気系統」が対等に並べられ、ああ、そういうことだったのかと、いまからでも機械に入門したくなってくるのです。
> 航空機の制御系として一般に知られているかと思いますから、「電気系統」と並べて示すには、まず「油圧系統」が好適だと感じます。その上で、ああ、電気でなければ油圧なんだ、さらに空気でもいいんだ、といって「空気系統」が(歴史的経緯に反した流れで勉強してしまった、つまり最新の「情報」分野だけを勉強した側からは、そういう順番で)無理なく理解できるように思われます。
・[3170]
> この流れでいうところの「機械」については既に詳しい本が古今東西たくさんありますね。
> ・日本機械学会「新・機械技術史」(2011年1月)
> http://pub.maruzen.co.jp/shop/9784888981965.html
> 「機械」と関連深いのが数学です。いかなる数学がいかに応用されているかをきわめて広く俯瞰できる本、というのもあるようなのですが、たいへん敷居が高く感じられ、まだ読めていません。
> ・広中平祐 編「第2版 現代数理科学事典」(2009年12月26日)
> http://pub.maruzen.co.jp/book_magazine/gendaisuurikagaku/
・(先述)
> 前述の「数理科学事典」([3170])を『大巾値下げ!!』([3359])で入手したので(あざっす@個別の取引価格については非公表とさせていただいております!)、そろそろココ口して読もうと思いまーす。いっけなーい! いったいわたし読めれるのかしら@アンキパンは切らしておりまして44周年さんからの「ふつおた」です。…えー。とりあえずは虫干しからですな。うん。
「数理科学事典」について後述します。
●「数量化理論」(1951〜1959年)をかみつたセンセイで読み解く(仮)
「計算機使用活動(Computer-aided activities)」([3403])も参照いただきつつ、そのあたりの『計算機使用〇〇!』に、まだ(たぶん、まだ)うまく取り組めていない感じのソレについては先に眺めたところであります。
・[3400]
> 『(この本を)ちゃんと知ってるよ☆知らないなんて××リだクポ!』といわれたような気にさせる、それが「エラボレイション!」というカタカナ語のはたらきだと思いました。(※個人には勝手な感想がございます!)
> 多次元(≒「3変数以上」)のデータを扱うことをそんなにおおげさにいわなくてもいいじゃないですかぁ。「小学校の自由研究にコサイン類似度を登場させてもいいと思いまーす!」([3330])など参照。
> 参考として、いま教科書に載っている知識の源流が、いつの時代のものであるのか、Wikipediaを参照してみます。こう、なんといいましょうか、その、必ずしも計算機の使用を前提としない感じが漂ってくるかもですよ。本当でしょうか。
・(再掲)(個人の日記)「A Practical Guide to Support Vector Classification」(2012年6月24日)
http://d.hatena.ne.jp/sleepy_yoshi/20120624/p1
> 使うことにしか興味がない人にとってマージンとかカーネルなどを理解することはあまり重要ではない気がする.
> かつての自分のようなゆとり学生が日本からひとりでも減ることを願っている.
・[3400]
> 実務者を育てるためのカリキュラムの洗練については別の話題であるとの認識を共有したいと思いました。
> そして、ここではもう少し『状況的!』([3358])なところをウダーしようとのコンタンにございます。
・かみつたセンセイがするっとスルーされている「V類」「VI類」付近
http://ibisforest.org/index.php?%E6%95%B0%E9%87%8F%E5%8C%96%E6%B3%95
えーっ。
・かみつたセンセイ「IV類」
http://ibisforest.org/index.php?%E6%95%B0%E9%87%8F%E5%8C%964%E9%A1%9E
> n個の点の間の類似度が与えられたとき,類似度の高い点を近くに,低い点を遠くに配置する方法.
> 点iをk次元ベクトル xi=(xi1,…,xik) に配置する.
> 解を求めるにはまず,対角要素が hii=−?馬j=1eij で,他は hij=eij であるような行列 H を生成.
> この行列の上位k個の固有値と,それに対する固有ベクトルを求める.
> するとxi は,k個の固有ベクトルのi番目の要素を取り出したものになる.
このように説明されたほうが理解が早いとの感触が得られるようになってくると、たわし、そつぎょーできるのかなぁ。(※あくまで演出です。)
そして、焼いもを食べる前に…じゃなくて、後ろから読むひととして「IV類」から順に、…飛ばして「I類」を読むとです。わあぃ名古屋飛ばしっ。(違)
・かみつたセンセイ「I類」
http://ibisforest.org/index.php?%E6%95%B0%E9%87%8F%E5%8C%961%E9%A1%9E
> 独立変数がカテゴリ変数で,従属変数が連続変数の回帰分析.
> 全ての独立変数をダミー変数に変換したベクトルを,新たな独立変数として回帰分析を行うのが数量化1類.
> 学習後の各ダミー変数に対する重みによって,各変数や,変数のとりうる値の,従属変数に与える重要性が評価できる.
トリッキーな方法って、こうですね! (2値でなく多値をとる)カテゴリ変数(※野球のチーム名や職業みたいなの!)を、(仮に12チームあるとして)「2から12までのどれでもなければ1!」「2でありそれ以外の何者でもなければ2!」みたいな「ダミー変数」に置き換えてから回帰分析を行なうとの理解にございます。つまり、(きわめて粗雑な)回帰分析そのものであります。
※チームでなく選手を単位として、移籍前のチームも含めて在籍期間を正規化してですね(略)…ゲフンゲフン。そういうことは考えないというのが「粗雑」ということです。
2変数ごとにしか計算できず、しかし計算しさえすれば、あさっての方向を向いていようとも何だろうとも回帰式が得られ、そこに不安があるといえば散布図を見ながら恣意的にナニしていけるという、最もわたしたちのナイーブな直感に沿ってのもっともらしい予測ができる方法であるとの早合点のほうなどしてみます。(※あくまで早合点です。)
・かみつたセンセイ「III類」
http://ibisforest.org/index.php?%E6%95%B0%E9%87%8F%E5%8C%963%E9%A1%9E
> m人の被験者が,それぞれn個の項目について,項目に反応すれば1,そうでなければ0をとるm×n行列 F を考える.
> 項目をm次元ベクトル x,被験者をn次元ベクトル y で表す.
> (中略)
> F の要素が1になる要素に対応する xi と yi の要素をとりだし,全部でT個の点を配置すると,近い反応項目は近くに配置される.
日本語だけ読むと(恐縮です!)「凝集型」っぽく読めてきます。
・「クラスター分析」
http://www.orsj.or.jp/~wiki/wiki/index.php/%E3%80%8A%E3%82%AF%E3%83%A9%E3%82%B9%E3%82%BF%E3%83%BC%E5%88%86%E6%9E%90%E3%80%8B
> 分類を行う方法に関わる探索的方法論の総称がクラスター分析である.
> 欧州圏では, 自動分類法(automatic classification)と呼称することが多い.
> 凝集型方法では, クラスター間の距離の定義によって, 分類結果が異なる可能性がある. そこで, クラスター間の距離の定義に対応して, 方法に名称が付けられている.
この、距離を計算したところで終わりにして、明示的には分類を行わないというのが「III類」であると…本当でしょうか。きわめて好意的にいえば、「確率的分類」(※)の1歩手前みたいなのが「III類」であると…もっと本当でしょうか。
※「各データが複数のカテゴリに属する多重分類問題」([3403])も参照。
・きわめて現場的な「主成分分析の使いかた」付近
https://oshiete.goo.ne.jp/qa/1235835.html
> 主成分分析で得られた軸のうち、寄与率(固有値)が上位の1〜3つぐらいの軸だけを使って他は無視すると、1〜3次元空間中に散布図が描けるから、これを眺めてどうこう感想を言う、というような使い方も、しばしばやります。
下位の軸の総和でサヨナラ…いえ、逆転とか起きないならいいんですけど。うーん。同点なら同点との判定もできなければいけないんですけど。うーん。
> 数量化理論IV類の場合は、共分散行列を作る代わりに、ともかくサンプル相互の「類似度行列」をイーカゲンに数値化する。そして、あとは主成分分析と同じように回転して散布図を作り、これを眺めてどうこう言う。
> 「定性的データを無理矢理数値化して、それに基づいて計算した共分散行列を使うぐらいなら、共分散行列そのものをイーカゲンに作ったっていいじゃないか」という発想と思えば良さそうです。
「II類」を置いてけぼりにしたまま「IV類」に帰ってきてしまいました。
・マクロミルの見解です
https://www.macromill.com/service/data_analysis/d001.html
> 多変量解析で何ができるのか、どんな時にどんな手法を使うのが最適なのか、結果をどう解釈するのか、といったことの方がはるかに重要なのです。多変量解析は万能ではありませんので、パソコンで計算をすれば求める結果が出るというものではありません。
> よい結果を導くためには入念な設問設計と得られたデータの予備解析が非常に重要で、実はこの部分に一番時間もとられるのです。
謙虚ですのう。いきなり模擬データとして血液型占いみたいなのを例示しちゃうような古い会社さんとは違いますのう。しかし、「入念な設問設計と得られたデータの予備解析」で「求める結果」を出してみせますぜ&ちょいとばっかしお高くなりますぜ★お客さーん。(恐縮です。)
※「わたしたちは「血液型」をどのように理解しなおせばいいのか」([3461])も参照。
> 相関係数が低い(r=0.26)からといって、2つの項目に関係がないとは言えません。相関係数だけを見て分析を行うと、2つの変数・事象には関係がないと言う間違った結論を出す危険性もあります。例えば、下記の図のようにケーキの甘さとおいしいと感じる度合いの関係を見ると、ある程度までは甘くなった方がおいしいと感じるが、度を超えるとおいしくなくなります。
そういう関係が複雑に絡みあっているのが現実の諸問題であります。
> 小学校1年生と6年生のデータ
げふっ…小学5年生と中学2年生が混ざってるデータ、この前、見ましたよ([3442])。
> 多変量解析の目的としては、大きく分けて「予測」と「要約」の2つがあります。この2つの目的によって、手法が異なります。
「図9」と「図10」は、ぜんぜんわかりませんでしたと申し添え…ぎゃふん。「予測」というからには実線の先に点線を続けるような表現がいいかなぁとか、「要約」というからには包含関係っぽいのを示したほうがいいのかなぁとか…無理ですやめておきます!(恐縮でした。)
> 多変量解析には、この表以外にもマーケティング上の課題解決によく用いる手法として、クラスター分析、コンジョイント分析等があります。
> これらの手法は、説明変数の関係性(からみ具合)や変数間の因果関係を明確にしようというもので、これらを定量的に把握したいときなどに極めて有用です。
> これらの新しい手法では、分析者の仮説の設定力、課題の洞察力などが、結果に大きく影響します。
あくまでマクロミルの見解です。あしからず。
・かみつたセンセイ付近
http://www.kamishima.net/jp/clustering/
ここから2003年3月の解説記事に飛びます。
・神嶌敏弘「データマイニング分野のクラスタリング手法(2) −大規模データへの挑戦と次元の呪いの克服−」人工知能学会誌(2003年3月)
http://ci.nii.ac.jp/naid/110002806512
http://www.kamishima.net/archive/2002-s-jsai-clustering-2.pdf
> Aggarwal らのORCLUS(arbitrarily ORiented projected CLUSter generation)[Aggarwal 00]は,軸に平行な射影だけではなく任意の方向の射影を扱う.この射影軸を見つけるために,共分散行列の特異値分解を用いる.この分解は主成分分析でも用いられ,できるだけ情報を保存する目的で固有値の大きな軸を選択する.ORCLUSでは逆に,対象がまとまって射影される軸を見つけるために,固有値の小さな射影軸を選択する.
こういうのがおもしろいと思いました。(※感想です。)
そして、やっぱり「II類」も見ておこうといって戻ってまいります。
・かみつたセンセイ「II類」
http://ibisforest.org/index.php?%E6%95%B0%E9%87%8F%E5%8C%962%E9%A1%9E
> 入力の属性ベクトルがカテゴリ変数で,出力もカテゴリ変数の場合に,各属性や各属性値の関係を調べる.
> カテゴリ変数は数量化1類と同じ方法で,0-1のダミー変数の横ベクトルに変換し,それらを縦に並べる.入力と出力の行列はそれぞれ X と Y と表す.
> X と Y に対する重み行列をそれぞれ A と B とする.
> 各属性値の重みによって,その属性値の影響の大きさを評価する.
(ある2つの変数だけで)「II類」を単独で行なって意味のある状況というものを想像できませんでした。本当でしょうか。両側が数量データであれば「判別分析」として意味のある分析になりましょうが、両側がカテゴリ変数で…うーん。2変量の1対でなく、最初から多変量であれば、意味がありましょう。もっと本当でしょうか。
・「数量化2類における追加情報検定と変数選択法」(2009年3月9日)
http://ir.c.chuo-u.ac.jp/repository/search/binary/p/4497/s/2310/
> 多群の場合への拡張についても, 検討を進めている.
> 多群の場合への拡張においては, 多変量回帰モデルや多群の場合の判別分析との関係を調べることになる. 多変量回帰との関連においては, 目的変数の得点化が基本になる. 多群判別の係数ベクトルと多変量回帰の係数ベクトルが同じになるための得点化については, Hstieetal:(1994) によって与えられている. この得点化を利用して, 2群の場合におけるような追加情報検定統計量の一致性, 検定統計量の近似分布の検証, 変数選択法などについて, 拡張結果を得ている.
そのように考えていくのが自然ですよね、わかります。しかし、最初から最後までベクトルで扱われたいかもですよ。新品がなければヤ×オクで…じゃなくて、パンがなければケーキ! 確率的な結果しか得られなくてもいいじゃない。…その発想はなかった!(※あくまでイメージです。)
※やーい「ケーキ納豆」([3181])っ! じきにガトーショコラ風のシフォンケーキが空から落ちてくる算段になっているんだ([3450])。頼むよ、この通りだ。(違)
・「質的データの判別分析 数量化2類」現代数学社(2011年4月)
http://www.gensu.co.jp/book_print.cgi?isbn=978-4-7687-0414-1
あくまでエクセルで取り組まれますかっ&2011年4月にもなってのうのうと「II類」だけの本を上梓なさっちゃいますかっ。なるほどねぇ。…実になるほどねぇ。
> 具体例に基づく多群数量化2類の解説,具体例に基づく拡張型数量化2類の解説
もはや「II類」とのネーミングにこだわる必要、ないんではないですかねぇ。(見解です。)
・『算段になっている』←「手はず」
http://thesaurus.weblio.jp/content/%E7%AE%97%E6%AE%B5%E3%82%92%E7%AB%8B%E3%81%A6%E3%82%8B
http://thesaurus.weblio.jp/content/%E6%89%8B%E3%81%AF%E3%81%9A%E3%82%92%E6%95%B4%E3%81%88%E3%82%8B
http://thesaurus.weblio.jp/content/%E7%AE%97%E6%AE%B5%E3%81%A7
> 物事を行うにあたっての進め方の順番を確認する表現
※「算段になっている」という表現をしていいのか迷いますが、「算段で」「手はずで」といってどちらでもよいとされるなら「算段になっている」と表現してもよいと考えられます。しかし余談でした。
●土木学会(1983年・1985年)で「数量化I類」「数量化II類」それに「数量化IV類」を読み解くココロミ(土)
・なぜに土木学会だし!「II類」の用例です(1985年1月)
http://library.jsce.or.jp/jsce/open/00037/353/353-003.pdf
http://library.jsce.or.jp/jsce/open/00037/353/353-118563.pdf
https://www.jstage.jst.go.jp/article/jscej1984/1985/353/1985_353_67/_article/-char/ja/
> 数量化理論は適用の歴史が浅く,応用例の有効さの判断が不統一となっている.
あくまで著者らの1985年1月の見解です。あしからず。
> 住環境満足度調査に本研究の信頼度分析を行って,住環境評価における信頼度の指数的変化を実証した.
うーん。「数量化理論」になどこだわらず、きちんと数学を勉強してからきちんと分析すれば、それでいいのではないかと&ぎゃふん!(それができたらクロウしないよ、の意。)
> 本論文をまとめるにあたり,**が文部省内地研究員として京都大学工学部交通土木工学科滞在中,天野光三教授,****講師,****助手から適切なご指導をいただいた.さらに,本論文の投稿に際し,匿名の査読員の方から有意義なご意見も数多く頂いた.ここに,記して,感謝の意を表する.
わあぃ天野センセイ!([2289])
・なぜに土木学会だし!「IV類」「I類」の用例です(1983年)
https://www.jstage.jst.go.jp/article/journalhs1981/3/0/3_0_164/_article/-char/ja/
http://library.jsce.or.jp/jsce/open/00044/1983/03-0164.pdf
> 調査に先だって関東地建管内の国道バイパス25路線の写真撮影を行ない (340葉余), このなかから66葉の写真を選んでアンケート調査を実施した (被験者81名)。
(あくまで現在の水準で読み解きますと)SD法([3218])を簡略化した感じで5つの感性語への反応を測っている感じでございます。
> 数量化IV類,MDS(多次元尺度構成法)によるタイプ分類
> 7要因の数量化I類により分析
・「人力クラスタリング!」してもらった結果(a)と数量化IV類を比べるということです
・「5つの感性語」のソレ(b)を数量化I類にかけるということです
そして、aとbをどうやって総合するのかは、結局、よくわかりませんでした。(※恐縮ですけどわかりませんでした! すなわち「5.結論」だけを読んでもわかりませんでした&そういうことですかっ!)
※「メタ目次」については[3093]を参照。
論文の原稿がワープロ(=ワープロ専用機)で書かれていると見受けられ、著者自身としても、ワープロのほんのわずかな表示領域で表示できる、部分部分の文章しか読まずに執筆され、編集が不十分であるという印象が否めません。現在のわたしたち、画面上で完全な印刷イメージをプレビューでき、マウスとクリップボードを駆使してのカット&ペーストと呼ばれる編集が自在に行え、スクロールも高速で、アンドゥもできると、この差はとてつもなく大きいといって往時をシノビます。
「VI類」に飛びます。
・「VI類」の用例です(1984年12月)
http://iss.ndl.go.jp/books/R000000004-I2733861-00
> 動物概念の発達的検討--クラスター分析と数量化6類による
> 千葉大学教育学部研究紀要
> p181〜196
うーん。紀要に16ページもの…タイブである。実にタイブである…じゃなくて、「付録いっぱい!(もう食べられないよ!)」みたいなのを想像してみます。本当でしょうか。
・あのぅ…「VI類」って、こちらでよろしかったでしょうか付近
http://mitizane.ll.chiba-u.jp/metadb/up/AN00179512/KJ00004298780.pdf
> IV類による
えーっ。「数量化6類による」との副題は何かの間違いなんでしょうか。「IV」を「6」だと思いこんだひとがデータベースに入力しちゃったとか、そういうことなんでしょうか。(※まったくの憶測です。)
> 図1 刺激カード
わあぃ刺激カードっ! かわいいなぁ。実にかわいいなぁ。
※1984年の時点での実験の実施の都合上、こうしかできないという支配的な制約があるわけではございますが、動物図鑑のカラー写真とか、動物園で写真を撮ってくるとかして、写真を刺激としなくていいんですかねぇ。ここまで図案化されたかわいらしい動物の絵で実験して、本当に実験になるんですかねぇ。(※あくまで現在の感想です。)
●「現代数理科学事典 第4刷」(1994年4月)をひも解く(紐)
さっそく「現代数理科学事典」を参照するです! なんと、最初に引くのが「数量化理論」になるとは思わなかったとです@本当です!
※入手してすぐにパラパラとはめくっていますけれど、目的をもって「引く」のは初めてです! …どきどき。
・広中平祐 編「現代数理科学事典」(1994年4月1日 第4刷)
※個人的な事情で恐縮ではございますが、あえて古い版を入手したと、こういうわけです。
> 和文事項索引
> 数量化理論 X〔5〕3-9
おおー!(略)「X 数理統計学」の「〔5〕多変量解析法」に「3. 多変量データのまとめ方」があり、「3-9 質的データの分析(数量化理論)」として柳井晴夫氏が執筆されてございます。
※「3.」では、「3-1 特異値分解」「3-2 主成分分析法」「3-3 因子分析法」「3-4 多次元尺度法」「3-5 クラスター分析」「3-6 重回帰分析」「3-7 正準相関分析」「3-8 判別分析」と続き、最後に「3-9」で締めくくられてございます。
※「〔5〕多変量解析法」のうち、「1. 多変量データの記述法」と「3. 多変量データのまとめ方」が柳井センセイの執筆で、「2. 多変量モデルの推測」が竹村彰道氏の執筆です。
> (略)理論的には,第1類,第2類は,名義尺度の変数を用いた重回帰分析と正準判別分析に対応する.第3類は,名義尺度を用いた主成分分析とみなすこともできるが,正準相関分析において2組の変数群をともに名義尺度のダミー変数に置き換えることによって導かれる,フランスのデータ解析学派による対応解析(correspondence analysis)の特別の場合とみなすほうがより適切であろう.
「IV類」「V類」「VI類」にはまったく触れられず、おお、もはや探さなくてもいいかなぁとの気分が高まってまいります。
・ウィキペディア「柳井晴夫」
https://ja.wikipedia.org/wiki/%E6%9F%B3%E4%BA%95%E6%99%B4%E5%A4%AB
> 『多変量データ解析法−理論と応用』 (行動計量学シリーズ8)(朝倉書店・1994年)
事典の執筆の直後の書き下ろしかなぁ、といって期待が高まってまいります。(※感じかたには個人差がございます。)
・柳井晴夫「多変量データ解析法−理論と応用」朝倉書店(1994年12月)
https://www.amazon.co.jp/%E5%A4%9A%E5%A4%89%E9%87%8F%E3%83%87%E3%83%BC%E3%82%BF%E8%A7%A3%E6%9E%90%E6%B3%95%E2%80%95%E7%90%86%E8%AB%96%E3%81%A8%E5%BF%9C%E7%94%A8-%E8%A1%8C%E5%8B%95%E8%A8%88%E9%87%8F%E5%AD%A6%E3%82%B7%E3%83%AA%E3%83%BC%E3%82%BA-%E6%9F%B3%E4%BA%95-%E6%99%B4%E5%A4%AB/dp/4254126484
> 本書は、まず、第1,2章において多変量データ解析全般にわたる基本的事項を解説した後、第3章から第8章にかけては、多変量データ解析の手法を、多変量データの構造解析の方法、予測と判別の方法、多群の変量間の関連分析、質的データの数量化、潜在変数分析、および多重配列データの解析法に分類し、それぞれに含まれる手法の理論的側面を多くの数値例とともに紹介する。
「現代数理科学事典」の記事に具体例を添えて講義っぽくしたような本かなぁと想像してみますが、図書館で探すしかないようです。
いまどきブックオフでおすすめされるのは、こちらでございます。
・「入門 共分散構造分析の実際」講談社サイエンティフィク(1,800円)
http://www.bookoffonline.co.jp/old/0012788356
http://www.kspub.co.jp/book/detail/1557512.html
> クリックしたらアウトプットは出たけれど……
> ベテランユーザーによる悩める初心者のための入門書
デスヨネ〜…。『大学は出たけれど』…じゃなくて、「学校でAmosを習ったです!」といいさえすれば…ゲフンゲフン。
・「大学は出たけれど」(1929年、1955年)
https://ja.wikipedia.org/wiki/%E5%A4%A7%E5%AD%A6%E3%81%AF%E5%87%BA%E3%81%9F%E3%81%91%E3%82%8C%E3%81%A9
・よくある「Amos入門」の1例です
http://www.lit.nagoya-u.ac.jp/~psyclass/2007_2nd/PES/lesson05/document01.html
> n次の積率(moment)とは,確率変数をn乗した値の平均値である。1次の積率は平均値に等しい。変数から平均値を引き(平均偏差),n乗した値の平均値を平均値まわりのn次積率という。平均値まわりの2次の積率 が分散である。。 2変数の各々の平均偏差を掛け合わせた値の平均値を共分散という。この定義より,分散は,2変数が同じ変数という共分散の特殊例となる。
「平均値との差」という値を煮るなり焼くなり! 2乗すれば分散なり! たったそれだけといえばそれだけのことであって、わあぃ「最初の感動を返してっ!」([3406])。
※大学で、特定の商業製品のネーミングばかりが前面に出る「カタチ」で「授業!」を設計しないといけないような状況というのは、本来はアレなんです。それならそれで、もったいぶらずに専門学校で効率的に対応可能なはずなんです。…その発想はなかった!(棒読み)もっとも、「Amosのオペレーター!」というレヴェルでは仕事にならないといって、ほかの科目とセットで、やはり大学で対応すべきではあるという…なやましいですのう。そういう部分に、昔はきちんと短大というものがあってですね(略)カリキュラムを見直してから人材が輩出されるまでのタイムラグが短い短大って、本当は必要なんですよ。本当でしょうか。
「平均値との差」という値だけで云々するということは、すべての変量および変量間の相関について、すべて正規分布を仮定するってことですね、わかります! …本当でしょうか。
※『相関が正規分布』という表現はアレですが、こういうの、なんと表現すればいいんでしょうか。(あくまで比ゆ的には)相関係数のヒストグラムを描いてみたら正規分布であるとか(=あくまで比ゆでございます)、グラフ構造にあってエッジの重みがだいたい同じである(⇒エッジの重みのヒストグラムを描いてみたら正規分布である)というようなことです。…たぶん!(※恐縮ですけど、残念なたわしに過度な期待はしないでください。)
> 共分散構造分析のひとつの有力な方法は,モデルを図で表して分析をすすめていく。もちろん図表現を使用しなくても共分散構造分析は可能であるが,図表現を用いた方が理解しやすいという意見も多い。
> 共分散構造分析の妙味は,直観的に理解しやすいパス図を用いて複雑なモデルを表現・評価し,より適合度のよいモデルに修正していくところにあるとも言われる。
わたしたち、わかった気になれる分析ツールがいいんです! メッソウもフタもあったものじゃありませんっ! …あ゛ーっ、背中のネジが飛んでゆくぅ。(※実在する背中のネジとは無関係であり、演出はイメージです。)
・[3406]
> 「EAP!(ほおぉ!)」「MEDっ!(フーン)」「MAPッ!!(へー…)」といって、その実、ただの▼期待値、▼中央値、▼最頻値ですよん@なんてこったい(最初の感動を返してっ!)。
> あくまで「図」として描けるかどうかというところで思考にブレーキがかかってしまうか、「図」には描けないけれども多次元の計算をバッチリ(意味がわかりながら)『完遂!』していけるか、このあたりに分かれ道がありそうですよ。
> 散布図は散布図、決定木は決定木だといって学ぶ時代はとっくに終わっている(かもしれないみたいな)ッ!! …この一連の話題を一連だと認識できなくてはいけない気がしてきます。もっとも、それは別の科目の役割なのでしょう。
・狩野裕「多変量解析と共分散構造分析」日本統計学会会報(1999年3月)
http://www.sigmath.es.osaka-u.ac.jp/~kano/essay/index.html
http://www.sigmath.es.osaka-u.ac.jp/~kano/essay/statistics_for_future.html
> 「一気に実行する」という方法は,実は多くの長所を持つ.
> 分析方法として帰納的なものと演繹的なものは,両者とも開発されているべきであり,優劣をつけるものではない.90年代になって,共分散構造分析の(使える)プログラムがそろい,やっと,応用の研究者に帰納・演繹の両方のツールが提供されることになった.
※「統計学の本質は,帰納的推論の中に演繹的論理の過程を導入することにより科学的な結論を導く点にある。」([3403])も参照。「アダプティブ!」に「チックタックぅ!」([3125])も参照。おおらかな気持ち的には「複眼的」とか「複線型」ともいいますよね。
> 最近注目を浴びている多水準データの共分散構造分析は,分割法計画に対応する.
> より大きな話題としては,やはり「非正規」「非線形」「シミュレーション」がキーワードになる.
※「ノンパラメトリック」([3401])ともいいます。
> 共分散構造分析で扱う構造方程式は線形である.非線形への拡張は急務である.非線形因果構造に対するアプローチとして現在,操作変数法を用いた二段階最小2乗法があるが,理論体系は整備されていない.ニューラルネットワークとの相互乗り入れも将来起こりそうである.双方向因果モデルに非線形構造をいれるとカオティックな現象が生ずる可能性があり,意外な方向へ発展しそうな研究対象である.「シミュレーション」の重要性は改めてここで強調することはあるまい.
・[3466]
> ・相関関係(⇒「多変量連関図」[3403])が複雑で、ふるまいがカオス的だということを暗にいっていますぞ
> ・そこに「ブラウン運動」的なノイズ(⇒「まったくの個体差」[3097])がのってくるということも暗にいっていそうですぞ
・(いま明らかに再掲)ウィキペディア「バタフライ(数学)」のイメージです
https://upload.wikimedia.org/wikipedia/commons/e/ed/LogisticCobwebChaos.gif
https://upload.wikimedia.org/wikipedia/commons/8/85/Cobweb_Bifurcation_Logistic_Map.jpg
https://ja.wikipedia.org/wiki/%E3%83%AD%E3%82%B8%E3%82%B9%E3%83%86%E3%82%A3%E3%83%83%E3%82%AF%E5%86%99%E5%83%8F
> カオスを生み出す系は非線形性を持つ必要があるが、このような非線形関数の中でも、ロジスティック写像は最も単純なものの1つである二次関数の差分方程式からカオスを生成する。この単純さと、他のカオスとも共通する現象がいくつも現れることから、カオス理論の入り口としてよく採り上げられる。
> 簡単な話のように聞こえるだろうが、あえて言い添えておくならば、この単純な2次関数の反復が完全に理解できるようになったのは、何百人もの数学者の努力の末、やっと1990年代の終わり頃になってからのことなのである。
・(先述)
> 「K-means法」と似たようなもので、これよりむずかしいことがわからないとわかったうちには入らないということですね、(そのことだけは)わかります!
(カナシイかな、自力では)解けないパズルの答えが知りたくてもんもんとしているような(=正解が載る「次号」が待ち遠しいような)、そんな気分であります。
なお、回帰式についても明快な説明が読みたいなといって、その実、「XVIII 基礎数理」「〔9〕 確率論」「1-5 平均値、モーメント(多次元の場合)」に、飛田武幸氏による、相関係数から始まって回帰関数で終わる、とっても爽快な解説がございます。なんと、相関係数から始まって回帰関数で終わる、ここまで1つの「1-5 平均値、モーメント(多次元の場合)」なんですよ(しかも短い!)。こういうのを『確かな視座!』というんですよ&こういうのを読みたかったんですよ!(※感想です。)
・ウィキペディア「飛田武幸」
https://ja.wikipedia.org/wiki/%E9%A3%9B%E7%94%B0%E6%AD%A6%E5%B9%B8
余談ではありますが、高校2年生くらいに数学で悩んだら、数学事典のほうなどぜんぶ通しで読んでみるとセカイが開けるのかもですよ。
・「数学ハンドブック」ほか
http://www.comp.tmu.ac.jp/kzmurota/mybooks.html#asakuraKiso
> 朝倉 数学ハンドブック
> 本書は理工系とくに専門にこだわらず工学系の学生が知っていれば良いことを主眼として,専門のみならず専門外の内容をも理解できるように平易に解説した基礎編である。
> 岩波 数学入門辞典
> 本辞典は,高校から大学で学ぶ数学用語を中心に解説したものである.数学を学ぶために必要な概念の解説のみならず,数学の歴史や社会的な背景にも配慮して解説をつけた.項目を拾い読みしても楽しめるように工夫したつもりである.
> 第2版:現代数理科学事典
> 編集代表の広中平祐氏を始め、200余名の第一線の専門家が編纂・執筆。わかりやすく本質を正確に捉えることができる精緻な説明に力を注ぎ、一般人でも理解できる内容となっています。
まず「現代数理科学事典」を眺めて、どうしてもわからないことがあればせんせいに聞く、そこで聞けないとあらば岩波の「数学入門辞典」を読むと、こういう順番かなぁと思いました。(※見解です。)
「現代数理科学事典」は数学のカタログです。ほしいものが何でもそろう! …じゃなくて、見ているうちにほしくなるぅ! 特に興味をひかれる分野が見つかれば、朝倉書店の「数学ハンドブック」を読みながら、大学選びにも役立ちそうですよ。本当でしょうか。大学に入ってから初めて知ることばかりでは遅すぎるとかなんとか。(高校のうちに)だいたい知っていたことを(大学では)詳しく学ぶということであってほしいですよね。…ギクッ。
・(先述)
> 「用語」って、えーっ。「事典の見出し語」を指して、しかし、その中身は「概念」から「手法」までさまざまです。(初等教育の教科書や参考書でいう感覚で)「用語」といって総称できるものばかりではないと思うんだなこれが。
そういう意味では、明るいところでのうのうと『数学用語!』などといってしまう岩波は、あくまで「辞典<ことばてん>=用語集」であります。大学を目指す上では学習に一種『名状しがたいガラスの天井のようなもの!』をつくってしまう、よからぬ本ですらあるかもですよ。本当でしょうか。(※あくまで私見です。)
・レファレンス協同データベース「カーマイケル数(Carmichael number)について、561(数列の最初の数)より後の数を知りたい。」(2014年7月7日)
http://crd.ndl.go.jp/reference/detail?page=ref_view&id=1000160329
> 下記データベースおよび辞典(事典)には掲載がなかった。
> ・Japan Knowledge(有料データベース)
> ・『数学辞典 普及版』朝倉書店、2011(BB06069882)
> ・『岩波数学辞典 第4版』岩波書店、2007(BA81141250)
> ・『現代数理科学事典 第2版』丸善、2009(BB00520850)
…そりゃあ、「セカイの数表を集めた本!」ではないのですから、あたりまえですよね。レファレンス協同データベースで「現代数理科学事典」を回答とする事例はないことがわかりました。(所蔵されている館とあらば)ちょっともったいない感があります。(※感じかたには個人差がございます。)
パラパラとめくる限りでは、以下のようなレファレンスのシナリオが考えられそうでしたと申し添えます。
・QC(品質管理)の理論について歴史を含め平易に解説した資料はないか?⇒あります
・コンピューターを使って言語を数学的に解析する学問の名前がわからない⇒数理言語学といいます(※1)
・完全2部グラフとラゲール多項式について平易に解説した資料はないか?⇒あります
・「種の多様性」に関する数理モデルを俯瞰できる資料はないか?⇒あります
・カルノー図と2分探索木についてわかる資料はないか?⇒あります
※1 「計量〇〇学」というのは文系の学問で、数え上げて割り算をするくらいの簡単な計算しかしません、の意。
※ラゲール多項式だけを引いてもしかたがないんです。カルノー図だけがわかってもしかたないんです。<それある〜!!
応用的なトピックについては専門書が充実していながら、こう、広辞苑でいう「歩く、書く、悲しむのような基礎的な説明」([3464])って、なかなかないんです。ましてや「歩走行」([3403])みたいなのは、もっとないんです。そういう部分にすとんとすとすとまいるなのが「現代数理科学事典」であると、こういうわけです。
なお、レファレンス協同データベースで「数量化<AND>類」の検索結果は37件だったことを申し添えます。そのほとんどは数量化理論と無関係ですが、豊中市立図書館の事例は数量化理論に関するものであるとわかります。まずレファレンスカウンターで聞くという習慣があって、さらに数量化理論について独習しなければならないという状況にあるという一種「ケッタイ」な市民(ただし市外から市内の職場へ通勤し昼休みなどに市立図書館を訪れる人を含む)が、いくらかはいるということがうかがわれましょう。そこには、ウェブでも探したけれどもピンと来ないという状況があるのかなぁ、との推察でございます。
・「統計の取り方で、多変量解析の一種である数量化III類について、具体的な数式やプログラミングの例が載った資料はあるか。」豊中市立図書館(2011年8月10日)
http://crd.ndl.go.jp/reference/detail?page=ref_view&id=1000099920
いえ、8月10日って、あなた、職場をてきとーに出てきて図書館に入り浸れそうな感じでもありますね。東京でいえば丸の内地下北口とか、閉まってますよね&そっちですかっ。
※なお、2011年の8月であるということを申し添え…うわぁ過度な節電はしないでく・だ・さ・いー。困ります困ります! わたしたち、蒸し焼きになってしまいます。(棒読み)
> 成人室・参考室の41(数学)の書架を探す。
(市立)図書館のひと、いま初めて「数量化X類」なるものを聞いたかのような探索を行なってあられます。…ぜんぶローマ数字のせいだっ。(棒読み)お客さまお客さま「数量化III類」とのご指名とあらば、数学ではなく社会心理学や社会調査方法論のあたりを探しに行かないと…デスヨネ〜。
> 「数量化3類」で府立図書館の蔵書を検索すると、『行動計量のヴィジュアル表現 数量化3類、4類の解析』(山愛書院)がヒット。こちらを取り寄せて提供した。
ヴィジュアルねぇ。…あくまでヴィジュアルとねぇ。いえ、なんでもないですからお気になさらず、どうぞヴィジュアルを追求なさってください。(※演出です。)
・「行動計量のヴィジュアル表現 −数量化3類、4類の解析」(2002年9月)
https://www.amazon.co.jp/dp/4434023659
なぜに「たばこ総合研究センター」だし。…なぜに「たばこ総合研究センター」だし!
> 1051位 − 本 > 科学・テクノロジー > 数学 > 微積分・解析
なぜに1051位だしっ!!(=それっておいしいの?)…それに「微積分・解析」の「解析」とは、ちょっと違うと思うよ。(※表現は演出です。)
・ウィキペディア「蒲焼」
https://ja.wikipedia.org/wiki/%E8%92%B2%E7%84%BC
> 参考文献
> 美味しんぼ 第3巻 炭火の魔力
えーっ…。「登亭」については[3430]を参照。
・Rで「林の数量化」付近
https://rpubs.com/kosugitti/49933
> 林先生自身は統計パッケージもなかった時代に,必要に迫られてその都度データに沿ったモデリングを行っただけであり,最初から理論化を考えて作られたわけではありません。
最終的にも「理論化」には至っていないかとぐこー…しっ、失礼しましたっ。(※演出です。)ネーミングに数字がついているからといって、「I」から順にというのは感心しないなぁ。(※見解です。)
・同じかた2008年付近
http://kosugitti.net/archives/3206
> Rはすげぇ
・同じかた2010年付近
http://kosugitti.net/archives/2696
> 量的な分析をする人は、それで言えることと言えないことの限界が、痛いほどわかるものである。
> 手法が客観的=誰がやっても同じである限り、数字が無味乾燥なものであるからこそあらゆる分析法を駆使しても、答えが出ないときというのはある。そのときに無理に答えを出さず、「意味なし」、「判断保留」、「データの限界」を宣告する責任がある。
> 自分が見たいものを、見たとおりに表現したい、数学というよくわからないフィルターで見えなくなったら嫌だ、という考えに通じるからである。よくわからないのであれば、学べばいい。
すげぇ! …じゃなくて、スバラシイ。また1つ、オトナになりましたナ。そういって我々、ブラインドの隙間を押し広げて西日を浴びようとする「逆ミーアキャットみたいな顔」でむにゃーっと席を立つと(略)。
・[3234]
> オペラは大会議室で起きているんだっ! ブラインドの隙間から江戸川に沈む夕陽を見ながら高らかに歌い上げればごはんがうまいっ!!
・[3384]
> > 家臣が華美な服装をしていると、一切返答せず、じっとその服装に目を注いで暗に注意を促した。
> > 近年のテレビドラマや小説などのフィクションでは、吉宗の緊縮経済政策と宗春の自由経済政策が対比されることが多い。しかし、後述の改鋳と共に幕府は金融緩和政策を行ったが、尾張藩は藩内の風紀が乱れたとして倹約政策を打ち出すなど、どちらの政策も単純な視点で捉えることはできないはずであるが、双方の政策は極単純な比較・構図で捉えられがちである。
※「留保的決定」「懐疑的寛容」「冷静な超然性」について[3174]も参照。
いま、豊田センセイの講義([3406])で4か月ほどRに触れるだけではかなり不安が残るでしょうけれども、卒論や修論にかけて、時期は問わず2年、必ずどこかで2年ほど、(研究成果を求められるという切羽詰まったカタチでの)『R漬けな生活!』のほうなどなさると、これはもう、どなたでもこのかた2010年の見地に到達できるといって疑いません。本当でしょうか。
・立川ブラインド工業の見解です
http://www.faq.blind.co.jp/index.php?itemid=62&catid=3
> 一般的に遮光性(外からの光の漏れ具合)や、遮蔽性(外からの視線の届き具合)は、羽根幅が広い方が方が優れています。見た目は好みもありますが、羽根幅が細い方が柔らかい感じがし、広い方がしっかりした感じになります。
> 一方、羽根幅が広い方が羽根の枚数も少なく、羽根もしっかりしているので、お掃除は楽でしょう。
※「方が方が」は原文ママ。
あれ全体が「ブラインド」と呼ばれていることは知っていても、それ1枚ずつを「スラット(羽根)」と呼ぶということまでは知らなかったかもですよ。ええ。(※演出です。)
●それでも気になる「V類」「VI類」(1973〜1976年)
・「戦後日本の統計学の発達」行動計量学(2005年)
http://ci.nii.ac.jp/naid/110004045671
> ビデオリサーチ 研究開発室
…なるほどなるほど。論文扱いされないような発表しかなされてこなかったとか、事実上、ビデオリサーチさん専用の分析方法であるとか、そういうことですかっ。
※読み進めていきますと、そういうことではないとわかりますが、それはそれとして、公開されていない「ビデオリサーチさん専用の分析方法」みたいなのは(ビデオリサーチさんに限らず)、たくさんありそうですよね、の意。
> 第II類と呼ばれている.
> 二番目に定式化された(略)第I類と呼ばれている.
> 三番目に(略)1950年8月,社会学者,心理学者との間で行われた「国鉄の保線区員調査」であった.この調査は,国鉄総裁室業務運営調査委員会からの依頼で(略)ソシオメトリー(略)第IV類と呼ばれている.
「国鉄の保線区員調査」は、どこかで習った記憶がかすかにございます。そんなに古い時期の調査だとは教えてくれなかったような記憶でございます。それどころか、あたかも「おととしくらいに実施されて去年くらいに発表されたのを聞いてきたばかり!(わあぃ臨場感っ!)」みたいな話しぶりの授業ですらあったような…ギクッ。これからは「絶対年代」([3126])で見ましょう。…あざっす。
> 最後に定式化された(略)1955年(略)第III類と呼ばれている.
> 数量化第III類と数学的には強い関係のある研究に,Louis Guttman(1916-1987)の尺度解析法の研究(1941)があり,また1970年代以降の計算機の急速な発達とともに生まれてきたJean-Paul Benzécriの対応分析法(Correspondence Analysis)の研究(1973),Nishisato,Shizuhikoの双対尺度法(Dual Scaling)の研究(1980)などがある.
> 以後,林によって開発された「一対比較法による数量化」,「K-L型数量化」についても,飽戸によってそれぞれ第V類,第VI類と命名されたが,これらについては多次元尺度解析法(Multidimensional Scaling)(林・飽戸共編,1976)に含まれるものとして,本稿では特に取り上げないこととする.
> 朝日新聞社広告部内に設けられたAOR(Asahi Operations Research)研究会
…やーいリサーチ研究会は万年「鋭意研究中(字余り)」っ。(たいへん失礼いたしました。)
※「鋭意○○中(字余り)」というのは、進捗が芳しくないときに使う表現であってだなぁ(略)えっ? これ××です?(※あくまで1970年代の雰囲気を模した演出です。)
> 計算機による心電図の自動診断
なるほどねぇ。…実になるほどねぇ。あまりにもナイーブなので、何にでも『効く!』かのようなですね(略)そのすべてを(おおもとでは)林のおかげというようないいかたや見かたをしてはいけないですぞ。
・「獣医学分野における多変量解析の応用」獣医科学と統計利用(1981年)
https://www.jstage.jst.go.jp/article/jve1977/1981/6/1981_6_5/_article/-char/ja/
https://www.jstage.jst.go.jp/article/jve1977/1981/6/1981_6_5/_pdf
> 多変量解析法の理論が,行列算法の知識がないと理解しにくいこと,現在まだ十分には,コンピュータ利用に関する知識が普及していないこと,地方での大型コンピュータ利用に,系統的あるいは金銭的に困難性が存在していることなど
> 「どのようなデータを,どのように集めて,どのような解析法で,どこでどうしたらできるのかがわからない」
> データ例に示したような3変量以上,さらにデータが多くなるほど,データを客観的に要約することが困難となってくる.
> この問題を解決する手段が多変量解析である。変量間の相関関係あるいは類似性などを考慮しながら,P種の変量の持つ多面的な特性を,理解しやすい最少次元へ客観的に要約する手法である。
「VI類」など出てこないのに検索ではヒットするといって、OCRの何かを疑います&草々。なお、「MDS法」への言及はございます。
・「数量化理論と方法」朝倉書店(1993年11月)
http://rnavi.ndl.go.jp/mokuji_html/000002293110.html
> eij型数量化;数量化IV類
> KL型数量化;数量化V類
> APM
> eijk型数量化―3人寄れば文殊の知恵の解析―
> 数量化III類の多次元化
> 一対比較法における矛盾と数量化;数量化VI類
1993年にもなって、林センセイの個人的な勉強の過程(見て見て! ひとりでここまでできたよ★さあさあさっそく使いたまへしょくん)につきあわされているやのような気配すら漂ってきて、実務者としてはうんざりかもですぞ! …その発想はなかった!(※恐縮ですが見解です。)いやいやいや、それこそを「追体験」というのであってだなぁ(略)早くオトナになりたい高校生のかたにとっても「もどかしい」でしょうが、これこそが最短の勉強法なのかもですよ。本当でしょうか。
・[3169]
> 研究の流れというものは、同じ人を時間方向に見ていくと、とってもよくわかります。いまから研究したい人も、もれなく、箱田センセイの1985年から追体験して追い越さなければ、先へは進めないといえます。
> 「知見」って、ナマモノですねぇ。
・[3168]
> 勉強とはそういうものだ(あらゆる考えかたを追体験してから納得するものだ)という見かた
・(先述)
> 仮にも研究会なんですよ、いいですか、いつからそこまで研究人口が増えたんですかっ。「参加費無料」だからって、『有名なセンセイ!』に初歩的な質問を直接してみて困らせるチャンスだなんて、とんでもない! …「虫が良過ぎるような」とはこのことだッ。(※わざと「不機嫌なひと」を演じています。)わあぃ小町的に「装いの人工知能」低〜い。
勉強は自力でするものであり、しかし、勉強したてのソレをただちに吹聴して回るものでもないと、たぶんこういうわけです。…ギクッ。
■表1 「数量化N類」一般化のココロミ(※森本2005年より作成)着手年 発表年 | 林 | 飽戸 | 現代たわし気質(仮) | | | | | 1941 1952 | (末綱の確率論、小平邦彦の報告から) 「仮釈放の研究」 | (数量化II類) | 林センセイ23さい〜34さい (2変量だけで行うと)意味のない判別分析 | 1947 1951 | 「日本人の読み書き能力調査」 | (数量化I類) | きわめて粗雑な回帰分析 | 1950 1951 | 「国鉄の保線区員調査」 「eij型数量化」 | (数量化IV類) | 最長距離法のクラスタリングのようなもの | 1942 1955 1956 | 日冷の缶詰ラベルのデザイナー 佐藤敬之輔氏のための「佐藤スコア」 | (数量化III類) | 凝集型クラスタリングのようなもの | 1959 | 「数量化と予測に関する根本概念」 | | 林センセイ41さい | 1964 | | 「数量化X類」と命名 | 飽戸センセイ29さい | 1971 1973 | 「「考えの道筋」の違いを分析する方法」 | | 林センセイ55さい | 〜 1976 | 「KL型数量化」 | 数量化V類(共著) | 飽戸センセイ41さい | 〜 1976 | 「一対比較法による数量化」 | 数量化VI類(共著) | 林センセイ58さい |
※「現代たわし気質(仮)」については、あくまで1私見ですので、あしからず。いつかどこかで若者がぴよぴよいっていると思ってくださいね、の意。
・「V類」と「VI類」はどちらがどちらかはっきりわからず。もしかすると逆かもですよ
・「IV類」では、最長距離法(みたいなの&もしかすると逆かもですよ)といって距離の決めかたを1種類、データの種類や意味も考えずこれだっ、といって決めつけているのですよ&とんでもない!
・「III類」では、デンドログラムを念頭に「道筋」などと詩的に表現されている気配がありますが、デンドログラムの構造そのものを定量的に扱おう(グラフ構造として扱おう)という気配はなさそうですよ
・「I類」は、ふつうに回帰分析(連続的な実測値から連続的な予測値を得るソレ)です
・「II類」は、ふつうに判別分析(「的中」を当ててよろこぶソレ)です
主に「II類」と「III類」のうち、分析法(定式化)の部分を除く、質的データのコーディング(符号化)のしかたが有用であるので、今日まで「数量化」と呼ばれながら重宝されてきたとの理解でございます。他方で、本来はデータ(分布のカタチ)に応じて使い分けるべきクラスタリングの距離の決めかたまでが、実質的に「IV類」と「III類」で(非明示的に)決められてしまっている(学習者に考えさせない)というところにシヤクシヂヤウギすぎるきらいがあったといえましょう。「I類」については、回帰分析の手法としては後年、より工夫されたものが続々と生まれていながら、(授業や研修で)あくまで「I類」だと言い続けたり、使う側が好き勝手に「拡張型I類」などと呼んでみたりといった混乱があったのではないかとうかがわれそうです。(※あくまで私見です。)
このようなことを踏まえると、こういう感じになるのかなぁというたわしでございます。
■表2 現代の水準で新規「エレガントな多次元質的分析へのいざない」のイメージですのん(※独自に作成)ののんのん | …かぽーん。(きらーん) | | | 「II類」なんていってないで | 判別分析 (教師あり学習としてのSVMなど) ですのん | 「I類」なんていってないで | 回帰分析ですのん (一般化線形モデルですのん) | 「IV類」なんていってないで | クラスター分析 (教師なし学習としてのクラスタリング) ですのん | 「III類」なんていってないで | SD法ですのん | 「V類」なんていってないで 「VI類」なんていってないで | ネットワーク分析 (グラフ理論・中心性指標) ですのん |
※まったく好き勝手な表ですから、あえてダミー文字列のほうなど混ぜておきますのん。本当かどうかはご自身で確かめてください!
※「多次元質的分析」などという定まった用語はございません。あえていえば「多次元(※次元はじゅうぶんに多くなければならない)」で「質的(※単一の種類の質的データを扱いさえすればよいのでなく、なるべく異種のデータを総合できてこそウレシイ)」で「分析(※解析とも調査とも違う、狭い範囲の手法を指していいたい)」かなぁということです。(まったくの私見です。)
あくまで林の、もともとの目的や研究課題に即しての理解であり、飽戸による命名を受けての普及後の使われかたはまったく考慮に入れてございません。(恐縮です。)
「VI類」の方向性としては、ほかに「一対比較法」と「四者択一法」の比較というトピックもあるようです(≒ないかもです)。『重複あり9者択3法!』みたいなのも、やろうと思えばできるけれども意味があるかどうか、というようなことを地道に考えていくと勉強になるかもですよ。本当でしょうか。
・[3433]
> 特定の計算法だけ教科書に載せて満足という時代は終わったッ!! いかなるときにいかなる計算法を編み出さねばならないかを考えさせるような教育というものをだなぁ(略)たいへんメッソウでした。
・[3461]
> > 「若い者(弟子)が落語を聴いていて、名人と言われる落語家の芸は凄い!とは感じますが、その理由を分析する力は当然ありません。ところが、なぜこの落語家の噺は面白くないのか、なぜお客が離れていくのかは、若いうちでも分かるのです。良いことより、悪いことの方が分かりやすいのです。授業でも同じではありませんか」
うまくいかない例、明らかにダメな例というのを、他人が演じてくれるのを待たずじぶんでつくってみて、「なるほど…こりゃダメだ!」といってナットクするという学びかたもあるんです。
・「リサーチ研究会」2007年の用例です
http://www.komaki-aic.ed.jp/kyouikuiindayori/H19/iindayori186.htm
> 「学校の授業研究が教師を育てる。そのためには授業を良し悪しで評価しないことが重要だ。授業中にどんな事実が起きたのか、それはなぜ起きたのかを理解できなければ評価などできない。これまでの授業研究は助言のし合いだった。事実を基にその場で学んだことを語ることが大切だ。厳しさは、〈ひとり残らず学びに参加していたか〉を問うことで保たれる。だが、教師の育ちは校内研究だけでは不十分であり、それを補うのが校外のサークル・研究会である」
しかし研究会の名前がおかしいよ@ゼッタイおかしいよ。(※感想です。)
・小平邦彦「怠け数学者の記」岩波現代文庫(2000年8月)
https://www.iwanami.co.jp/book/b256268.html
・かみつたセンセイ「ファジィc-means法」
http://ibisforest.org/index.php?%E3%83%95%E3%82%A1%E3%82%B8%E3%82%A3c-means%E6%B3%95
●「SD法」(1952〜1957年)に寄せて(寄)
「III類」の、クラスタリングの手法としての側面については上述の通りですが、林のもともとの目的(=缶詰のラベルのデザインに対する反応の分類や比較)に即していえば、これはSD法によって上書きされる知識であろうと、こういうわけです。(あくまで私見です。)
・「日本におけるSD法による研究分野とその形容詞対尺度構成の概観」教育心理学研究(1985年)
https://www.jstage.jst.go.jp/article/jjep1953/33/3/33_253/_article/references/-char/ja/
https://www.jstage.jst.go.jp/article/jjep1953/33/3/33_253/_pdf
SD法も、1952年から1957年にかけて原著が出てきて、日本国内でも1958年から遅滞なく「日本語版」が開発されていったという経緯のある方法です。林の専門ではないので「数量化理論」には入ってこないというのはもちろんではございますが、学習者としては、最初からSD法を視野に入れた学習をしていただかないと、調査や研究の最初の段階で、SD法というものは頭にないということが起きてしまいかねません。バランスよく、まんべんなく学習したいというのが、カリキュラムに対する本来の要件でありましょう。「数量化理論」を学びさえすれば「基礎」はオッケーで、SD法は「応用」だと(やらなくてもいいんだと)いうような誤解をいただいては困るということです。(あくまで私見です。)
もっとも、SD法というのもなかなかにシヤクシヂヤウギなところがあって、ことばの使われかたが変わってきたり、辞書に載っている一種「伝統的な」形容詞の使用が廃れてアドホックなオノマトペが主に使われるようになれば(※)、従来の形容詞対では測定がうまくいかないという局面も出てくるでしょう。ひいては、そもそもわたしたち、形容詞よりも副詞(とも形容動詞ともつかないソレ)や名詞(「○○みたい!」)を使って印象や感情を表現していることのほうが多いかもしれず、SD法を使って調べるときだけ形容詞を使いなはれといわれましても、そこには日常との断絶があって、不自然な観察しかできていないということもあるのかもですよ。(あくまで私見です。)
※がーっといってあーっといってちゅどーん! 大阪のヒトはもとよりそうであったとかなんとか。大阪ではまともな調査ができていなかったとか、調査の時だけ標準語(「標準語は敬語!」[3399],[3403]も参照)でタテマエ的な回答をなさっていたとか、ありません? …ギクッ。「日常日本語会話」については[3103],[3132]も参照。
そういう意味では、SD法を主に使うシーンにおいても、豊田センセイのおっしゃる「暗記しなくてよい」「シミュレーションしなはれよキミたち」というアプローチは必要性が大いに増すとの感触でございます。
・槙センセイ「SD法で印象を測るわけ」(2007年7月25日)
http://www.jissen.ac.jp/kankyo/lab-maki2/maki/essay/essay51.html
> 何年か前に、ある委員会の席で「未だにSD法をやっている人もいるみたいだけど。」という発言があったのを憶えている。もっと進んだデータ収集方法がある、解析方法があるという趣旨だろう。でも、私はそこで揶揄されたようなことを続けている。それには理由が在る訳で、それを書いておいてもいいかなあと思い、このコラムを書き始めたのである。
> そうは言っても、私がやっていることは正統的なSD法の概念からは若干ずれることかもしれない。
> オズグッドが(略)さまざまな地域で、さまざまな対象に対してSD法を適用し、いずれも3次元が得られたことから、人の印象の主要な軸は3次元であり、それは人類に普遍であると主張したのである。私も10回以上はSD法のようなことをしていると思うが、確かに主要な次元は3次元が得られることが多い。
…あ、いや、その、まあ、引用にあたって、このように恣意的な「(略)」をするのはいけないんですけど、すぐに原文を読めるんですから、原文を読んで、どこを「(略)」したのかというのは確かめてくださいね。(恐縮です。)
> 印象の数値化が必要なだけで、必ずしも次元を特定する必要はない。
> 次元を表現するより、尺度(=特定の印象)を表現したいのである。したがって、最初から評定尺度を絞り込んでしまうこともある。好まれるデザインの特徴が知りたいのであれば、好ましさだけ尋ねればよい。その方が、同じ時間でより多くの対象について評価してもらうことが可能になるのだから。
> 私は配色の印象評価の研究をしてきたが、いつもサンプル数を多くしたい衝動と戦っている。20色のバリエーションを用意したとして、2色配色なら 20×20=400サンプル、3色配色であれば20×20×20=8000サンプル。サンプル数は累乗で増えていくから、網羅的にサンプルを作成すれば、サンプル数の爆発につながる。
> 人間は比較は容易にできるが絶対的な評価は苦手だという(昔の?)心理学者の思い込みは、現実にそぐわないような気がする。
そこで「一対比較法の矛盾」というトピックに戻っていくと、こういうわけです。わたしたち自身が矛盾の中で生活しているとあらば、測定にあたっても、矛盾は矛盾として検出できなければならない…とも考えられそうですよ。本当でしょうか。
|