フォーラム  最近の主な話題 投稿要領の改訂について | 個人情報保護方針 | 利用規約 neorail.jp

neorail.jp/forum/

「情報と鉄道」「ユニバーサルデザインと鉄道」「社会と鉄道」がテーマのフォーラムです。(16歳以上対象) 【このフォーラムについて】



by tht

[3542]

「AI見てみる?」(2017年8月)を見てみた(談)

研究 道路 主成分分析 散布図 多変量解析 クラスタリング 変量 重回帰分析 主成分 データ同化


NHK「AI見てみる?」(2017年8月)を見てみた(談)
筑摩書房「ちくま」(2017年9月)かく語りき(談)
「SN比」から「共分散比」「入れ替わり率」「ルールスペース法」まで(談)
「マイニング」とはにわ(再)


 [3514],[3521]の続きです。


★NHK「AI見てみる?」(2017年8月)を見てみた(談)


[3514]
 > AI(を用いた解析システムならびにインタラクティブ可視化システム)

 > ・「開発」といっても「発明」とは違いまっせ★お客さーん!

 > ・NHKには研究所があって、(たぶん)博士もいるんですよ

 > ・デジタルカメラの「流し撮り(コンティニュアスAF)」みたいなの!=ここが「AI」なんですよ
 > ・├「5年移動相関」 ⇒ 一律に5年でいいのか?(ファインダー内に異なる速度で動く被写体が混ざっていたらAFが狂うでしょ&どれか1つに合焦してほかは無視することになっちゃうでしょ)
 > ・└「47都道府県」 ⇒ 複数の都道府県にまたがった相関は分析されていない(「スポット測光」みたいなの! 隣がでっかい大きな東京都でも東京都のことはまったく知らないよ! やーい盛大な測光ミスで真っ白だっ!)

 > ・使っているのは「ビッグデータ」じゃないですよ(なんとか白書や小売物価や国勢調査という意味での統計ですよ)

 > 「ディープラーニング」を仕込んだNHKご謹製のシステムに、経済指標をどかんと放りこんで、入れたデータの範囲でわかる連関表を、その場でつくってしまおうと、たぶんこういうわけです。

 > ・シミュレーションやデータ同化に取り組んで行くための最初のステップっぽいですよ
 > ・└じぶんが昔ならった統計学だけで考えず、統計数理研究所の最新の研究内容をしっかり見てくださいね

 > ま、「AI見てみる? COMING SOON」と大文字で書かれたソレが公開されるまでは、なんともですかねぇ。

 この[3514]の内容をすべてお読みいただいたという前提で、次へまいります。

[3521]
 > 「NHK AI 相関」といって検索すれば、そこそこ上のほう(⇒現在は61番目…61番目! やーい61番目っ…ひとのことはいえんなぁ)に出てくる状態でもありました。…なんだかなぁ。

 いまみると56番目…やーい56番目っ。ゲフンゲフン。

・(再掲)…いつのまに!!「TOP100」が載っていた件(掲載日時不明※)
 http://www.nhk.or.jp/special/askai/rank2017.html

・(再掲)いつのまに!「放送を終えて」が載っていた件(掲載日時不明)
 http://www6.nhk.or.jp/special/detail/index.html?aid=20170722

 > CmColumn04

 さらに、8月31日とのヘッダーが表示されながら、いつのまにか「AI見てみる? COMING SOON」が公開されていました。…いつのまに!!

・「探索! AIの脳内」
 http://www.nhk.or.jp/special/askai/visualizer/index.html

 URLの「visualizer」がしょーじきなのでゆるしてつかはす! ハハー!! …じゃなくてですね(略)メッソウではございますが、あくまで可視化システムの1実装に過ぎないとの…ゲフンゲフン。

 このたび公開されたページで新たに説明されている内容を検めようではありませんか。

 > 主にパターン認識と日本語テキストのディープラーニングを用いています。
 > NHKニュース原稿やtwitterなどのインターネットにある日本語の膨大なテキスト
 > 経済や医療など5000の分野のデータ、47都道府県×30年分など

 うーん。「WikipediaやNHKのニュース原稿など、100万本を超える記事」と説明されていたのが「NHKニュース原稿やtwitterなどのインターネットにある日本語の膨大なテキスト」に変わったとですばい@なんてこったい…うーん。(略)…うーん。それでもまだ(たぶん、「まだ」)、このような使いかたでは「ビッグデータ」とは呼ばないですよね。うん。(※あくまで私見です。)

※当初の記述では「Wikipedia」だったので「ビッグデータではない(ビッグデータと呼ばれうるデータは使われていない)」と断定的に述べることができたのですが、「twitter」が含まれるとなると、その使われかたが具体的に説明されない限り、なんともいえないんですよ、の意。「twitter」から「買ったモノ(ほしいモノ)」や「行った場所(行きたい場所)」、それに個人間のメッセージのやりとりの件数など、定量的な指標を抽出して使っていたりすると、ビッグデータ(購買履歴など)そのものではないですけど一種『みなしビッグデータ!』みたいなのにはなってくるわけです。そのように使われるということを(未成年を含む)ユーザーがあまねく承知しているかといって…びみょーかなぁ。(棒読み)

 可視化されたエゴセントリックなサブグラフ(※「「注目するノード」から「2hopまで」のノードを切り出したグラフ」から、さらにエッジを減らしたとみられるグラフであり、かつ「ツリー構造」にされていて「もはやネットワークではない」)において、エッジの重みが「-1」と「1」みたいになっているっぽい(※「ほぼ-1」「ほぼ1」とみなせるような重みのエッジだけを残した上で、「簡略化」と称して重みを本当に「-1」と「1」に2値化してしまったような「ざっくり!」した可視化ですよ@なんてこったい)ですよ。本当でしょうか。▼ノード(連動する変量)ごとに大きさの変わりかたが違うという表現はなされておらず、▼「U字型!」「V字型!」「M字型!」などの変化をする関係は扱われず、▼注目するノード以外のノード間の相互における関係は無視していることがわかりますから本当です。…たぶん!

・「エゴセントリック・ネットワーク」の用例です
 https://mieruka.dc.affrc.go.jp/seika/show/234822

 > 農商工連携の取組みについて時系列でネットワーク分析を行う。ネットワーク構造の可視化により主体間のつながりの強弱を明らかにでき、数値化により主体間の情報の共有のしやすさと各主体の競争優位性を評価できる。

 うーん。教科書が1997年ですぜ。おっと、安田センセイにはナイショでたのむぜ★(棒読み)…ぎゃふん。

[3514]
 > 計算結果(全5000指標の総当りペアにおける、各ペアの重みや向き)を使って、それらしく(エッジを張るか張らないかの閾値など『あしきり』などと称して恣意的に決定されながら)本件ネットワークをつくってみせているんですよね。ま、それがふつーですよね。ま、「あしきり」とかいっちゃだめですよ。少なくとも漢字で書いてはいけない気がするよ、うん。(※見解です。)

 URLで「visualizer」と表記される可視化システムにおけるグラフ構造(ネットワーク)の扱いが、どのように「簡略化」されているのかというのは、よくわかったと思いました。

※「グラフ構造」と「ネットワーク」の違いとはにわ! ▼「つながりをグラフィカル(図式的)に扱いさえすればツリーでもグラフ」、▼「ネットワークと呼ぶにふさわしい所望の特性を備えていればネットワーク」ということですね、わかります。…えっ、わからないですって?(大巾に中略)冗長性とか到達性とか平均距離とか、いろいろあるじゃないですかぁ。や〜だなぁ。

・(あくまで参考)高速鳥取!「冗長性」のイメージです
 http://isss.jp.net/isss-site/wp-content/uploads/2017/03/2016-049.pdf

 > 数え上げられる経路に関する調和平均をとることとなる.ただし,ネットワークの規模による影響をなくすため,調和平均を最短経路距離の逆数で除す.

 > 鳥取港を起終点の一つとするケースでは,ほぼすべてのケースで経路数が増加していることが判る.道路整備前の鳥取港は,防災幹線道路ネットワークが行き止まりのような形状となっていたが,路線A の整備により周辺道路が環状をなすようになり,2 方面に行けるようになったことから経路数の増加につながったと考えられる.

 > 鳥取港〜鳥取空港,鳥取港〜清流茶屋かわはら,の変化量が相対的に大きく,災害時に県外から救援物資を受け入れる際の備蓄拠点間の連結性の向上を示唆するものであると言える.

 > 整備の優先順位を検討する問題は別の機会に委ねることとしたい.

 日本語の質が低いの、どうにかならんとですか。▼じぶんたちが提案するのに他人事みたい(⇒責任感が乏しいという誤った印象が生じかねない)、▼じぶんたちはやらないのにえらそー(⇒やらないことは書かなくてよい、もしくは「〜こともできる(※我々の方法はつぶしがきく&ほめてほめてー!)」「応用が期待される(※誰かやってー!)」とのみ書けばよい)…ゲフンゲフン。(※あくまで個人の感想です。もってまわったような書きぶりをしさえすれば論文っぽい…とんでもない! 本当は責任感と熱意にあふれていて謙虚であっても、それを書き言葉で表現できていないのですよ。)

・Google ストリートビュー 高速鳥取!「入口」「ENTER」付近のファミリーマート(※本件とは無関係です)
 https://goo.gl/maps/Dvq79ALTS3S2
 https://goo.gl/maps/1PWB2yNeL5Q2
 https://goo.gl/maps/nE5dJH9eHn52
 https://goo.gl/maps/JGQu6w1YQyn

・「つぶしがきく」
 http://thesaurus.weblio.jp/content/%E6%BD%B0%E3%81%97%E3%81%AE%E3%81%8D%E3%81%8F

・「もってまわったような」
 http://thesaurus.weblio.jp/content/%E6%8C%81%E3%81%A3%E3%81%A6%E5%9B%9E%E3%81%A3%E3%81%9F%E3%82%88%E3%81%86%E3%81%AA

 > 婉曲的な
 > 直接的でない
 > 率直でない

 すなわち、▼婉曲表現を避け、▼直接的に、▼率直に書くべし、と、こういうわけです。「経路の総数の調和平均を最短距離の逆数で正規化する.」「路線Aの整備により周辺道路が環状となり,どの地点からも2方面に行けるようになったことから経路数が大幅に増加している.」「特に○○の拠点である鳥取港〜鳥取空港間,鳥取港〜清流茶屋かわはら間では,道路による拠点間の連結性が向上したことが確認できた.」くらい、いいきってほしいんですよ。うん。(※見解です。)


★筑摩書房「ちくま」(2017年9月)かく語りき(談)


 そして、よくわからないタイミングでいつのまにか公開されている「AI見てみる?」を、忘れずにきちんと「見てみた」するひとも、なかなかいないのかしら。本当でしょうか。

・その後「見てみた」した気配のない感じのひと
 https://www.facebook.com/research.terakoya/posts/1559787104052209

 > 番組を見ているときに感じたこと・・・、
 > 因子分析や判別分析、クラスター分析、決定木などの基本的な考え方や仕組みを知っていると、理解が格段に違うだろうなということでした。

 > これはそもそもAIじゃないです。

 わかってないなぁ!(棒読み)

 > どんなデータが、どのように処理されているのかは、私も疑問ですが、番組ホームページで「AI見てみる?」がcoming soonなので、こちらが出てくるのを待ちましょう。

※それは「疑問」とはいいませんよ@(学んだ分野や時代が違うので)あなたの想像が及ばないだけで、(輪読をさぼっていない&きちんと最新の論文を輪読している)工学部の4年生以上(※ただし8月における)ならじゅうぶんに想像できるレヴェルでしょ。んだんだ。(3年生ですとちょっと足りないこともあるかもですよ。この間に進む、広い意味での勉強の実に大きなこと!)

 待ちきれないほど待たされている間に忘れてしまうんですよ。うん。一種の『逆マーケティング!(忘れてもらうための何か!)』ですよね。(さらに棒読み)

 ひいては、この話(「AIに聞いてみたのよ(AIなのよ)」)に上野センセイまで生半可な言及をなさる(≒生半可なのに、それでもわざわざ言及なさる)とは…それだけ耳目を集める話題ではあるということですね、わかります。NHKのひとが「ググる!」だけでは、こんなところで(※失礼ではありますけど、やっぱり「こんなところ」で)上野センセイが言及しているということは発見できないと思うんだなこれが。(※推定です。)

・筑摩書房「ちくま」9月号で上野センセイいわく(※リンク先は目次です)
 http://www.chikumashobo.co.jp/blog/pr_chikuma/entry/1373/

※上野センセイと呼ばれるペルソナ(仮)における「AIとは」にわ! …いえ、AIに関する認識がうかがえる箇所を参照します。

 > 「同じか違うか」はYes/Noの二つの値しかとりません。これを二値論理といいます。
 > AI(人工知能)とはこの大脳シナプス連結を模倣したものにほかなりません。どんなに複雑なAIでも、基本は二値論理の膨大な集積回路から成っています。

※コレハヒドイ(=後述)。

 > 言説の意味を解読できるのは、(今のところ)人間だけです。AIにはできません。ビッグデータによるデータ・マイニングがあてにならないのは(略)という三つのワードが関連して現れるとしても、それが肯定か否定かは、文章全体を読まなければわからないからです。

※あくまで上野センセイによる理解はそういうことになっているということがわかるということです。実際、かなり粗雑なテキストマイニングが幅を利かせているといって…ギクッ。「「ポジネガ語辞書(みたいなの)」に載ってない言葉や、単語レベルでなく語彙レベル(≒文レベル)でののしったり憤りを示したりすると「判定不能」になるのでしょうから、そういう冷静でないつぶやき(=もはやありきたりの「ネガ語」で批判するレヴェルを超えている)が急増したとあらば、(判定可能な)ポジティブもネガティブも減ったように見えるということですね。仮には(ツイッター上で言い争いになるなどして)「じゃあ**なんですかっ!!」「**(※過去に何かネガティブな文脈で登場した固有名詞など)みたい」みたいな表現は、ポジネガのどちらとも判定できていないのではないでしょうか。本当でしょうか。(※あくまで一般的な推測です。)」([3487])、「シソーラスで3つに「ばしつと」分けてしまうのは、説明のためには必要なことではあるのですけれども、わたしたち、その上で「正統な」という表現をなぜ使おうかというときには、3つの意義素にポヤンとまたがった複合的なニュアンスを表現したくて「正統な」という表現を使おうということがあるのだということです。」([3498])、「質問紙調査(アンケート、有効回答119件)で、自由記述を「茶筅」で「テキストマイニング」するという、ちょっと(かなり)時代を感じさせる内容です。」([3050])、「明治以来の判決文の語彙(日本語)から概念辞書(WordNet)を人手で作ることでしょうか。しかも、ノード、リンクともに「TTLのようなもの」を考慮する必要もあるでしょう。」([3125])それに(手前ミソですが)「「見えざるキーワード」の壁」([3313])など参照。

 > 社会には疑似相関を含めておびただしい相関関係があります。最近NHKが「課題解決型AI」を使ってビッグデータを処理したところ、(略)という予測を得たと発表していましたが、これは「因果関係」でしょうか。媒介変数に(略)を入れないと説明できない、疑似相関かもしれません。

※上述の通り「ただちにビッグデータとはいえない」ですよ。うん。内容そのものは本題ではないので省きます。(恐縮です。)しかし「社会問題解決型AI」と称されているものを「課題解決型AI」と呼んでしまっていいんでしょうか&むしろわざとでしょうか。

・同じく(詩人の)最果タヒ先生いわく

 > ネットにある正論のうち、いくつかはすでにAIが書いていると思っています。というか、もう私はめんどくさいのでネットでみた正論については、すべてAIが書いている、と思うことにしています。あと、正論を書いたらAIが書いている、と思われるような気がしています。

 ぬはっ(略)しかし、いまはコレジャナイ。(※恐縮です。)

 ぜんぶ疑似相関のせい! 我々がいちばん疑似相関なのかもしれませんね…じゃなくて、「偶然」は無視したり取り除いたりすべきと決めつけるのでなく、「偶然」が起きる確率がじゅうぶんに高い(ような、混沌とした状況である)のなら、それはシミュレーションに組み入れておきたいんですよ(=連関図の「確からしさ」といいましょうか、どのくらい構造が安定なのかというメタなところもパラメータとして扱えるとうれしいはずなんですよ)&そっちですよっ。(棒読み)

[3461]
 > > What makes a Research Question Answerable?

 > 抄訳:ポリシーはどうであるべきかという問題そのものを問うてはならない。研究では、▼人々が実際のポリシーにどう反応しているのか、または、▼実際には運用されていないが具体的なポリシーを提案してみて、それに対してどのような態度をとるのかということを問うものである。

 直接の相関関係がわかることのほうがうれしくて、因果関係(向き)がわかるともっとうれしいというのは、単なる思いこみなのかもしれません。本当でしょうか。仮に、疑似相関の全体の「足し合わせ」のほうが影響力の大きさにおいて個々の(明確な)関係を上回ると見込まれるのであれば、疑似相関のほうこそ詳しく調べていかなければいけないのですよ。

[3155]
 > **県内の**のPC教室で、***のデスクトップPCが使われているようすがみられます。このくらいの台数、どうやって調達するかといえば、うーん、****さんで「ポチッ」と、そして「大阪」で計上([3143])されてもおかしくないと思われてきます。(「法人」だからといって「大量」とは限らないが、そういう「小さな法人」がたくさんあって、合計ではかなりの量になりそうだ、の意。)

 いわゆる『決定権者じゃ!(どやぁ』みたいなのが、たいへん細切れにたくさんいるということになって、どこのメーカーのPCを買おうかというのが、かなり個人の客と似た傾向を示したり、ささいな事情に大きく左右されたり、まったくランダムであるように見えたり…しそうですよねぇ。

 > 翻って、市場規模ってなに、そもそも市場ってなに、大きいから「取りに行く」だなんて、小さいのは無視するんですか、などと、いろいろ考えさせられるような気がしてくるはずです。全然ちっとも気にせず「ぜんぶ○○のせいだ」などと…メッソウもないといってゾッとしてみます。

 > なんでも○○のせいにしてしまう我々が一番の○○かもしれませんね…などと「したり顔」で『コメント』してさえおれば…ゲフン。


★「SN比」から「共分散比」「入れ替わり率」「ルールスペース法」まで(談)


・「SN比」のイメージです
 https://ja.wikipedia.org/wiki/SN%E6%AF%94
 https://kotobank.jp/word/SN%E6%AF%94-1444
 http://ebsa.ism.ac.jp/ebooks/node/886
 http://ebsa.ism.ac.jp/ebooks/sites/default/files/ebook/886/pdf/ch10.pdf

 > SN比で考える信号と雑音の定義は、何に着目しているかによる。見方によっては、通常「雑音」とされている成分に着目する場合など、逆転することさえありうる。

 > SN比を不必要に大きく保つことは,経済的に問題があるので,それぞれの情報信号の性質によって適当な値で回路が設計される。

 > エスエヌ比
 > エスエヌ比

 > 測定法の評価尺度として,分散分析の最も重要な応用分野である.
 > データの全二乗和をいろいろな原因系の効果に分解する計算は,2次形式の応用として変動の分解をいわれ,データ解析として本書で説明してきたものである.
 > データの統計解析にエスエヌ比という言葉を用いることについては,1962年筆者がプリンストン大学にいた頃,J.W. Tukey教授なども何回もつかっていたが,エスの意味についてのはっきりした見通しが無かったために,誤差対誤差の比に用いられているだけだったのである.エスエヌ比がアメリカなどの外国で普及していない原因はそこにあると思われる.

 「アメリカなどの外国」って、ずいぶん『ざっくり!』してませんこと? あらあら、まあまあ! そして「筆者」といって、その実、田口玄一氏(⇒「MT(マハラノビス・タグチ)システム」については[3283])であり、1972年の図書(現在は絶版)でした。

・大学入試センター 全国大学入学者選抜研究連絡協議会「合否入替り率」の用例です(2016年2月)
 http://www.dnc.ac.jp/sp/albums/abm.php?f=abm00007067.pdf&n=%E5%A4%A7%E5%AD%A6%E5%85%A5%E8%A9%A6%E7%A0%94%E7%A9%B6%E3%82%B8%E3%83%A3%E3%83%BC%E3%83%8A%E3%83%ABNo.26%28Web%E6%8E%B2%E8%BC%89%29.pdf

 うわぁ全国大学入学者選抜研究連絡協議会。いわゆる全国大学入学者選抜研究連絡協議会。…えーっ。(略)▼まず「(主要)大学『入試連絡協』」みたいなのあたりから始まって▼「全国」が付いて▼「入学者選抜」と言い換え▼略さず「連絡協議会」と書かれるようになり▼「研究」が挟まったと読み解けばいいのでしょうか。…わからないや!(※表現は演出の一部であり、個人差には感想がございます。)

・九州大学「合否入替り率を用いた入試データの構造把握 主成分分析、共分散構造分析、重回帰分析、正準相関分析を用いた検討」基幹教育紀要(2016年2月)
 http://catalog.lib.kyushu-u.ac.jp/handle/2324/1650905/p095.pdf

 > 共分散比が受験者全体における各成績指標の関係を示すものであったのに対して、合否入替り率は、合否に関しての成績資料の影響力を表す指標であり、前川・菊地(1996)によれば、吉津・藤本(1975)で合否入替り率が提案されたのが最初とされている。
 > 清水(1993)によれば、「課されている試験に対し、それが課されなかったならば合格しなかったであろう者の、合格者全員に対する割合」をその試験による「合否入替り率」と定義している(清水1993:1)。

※朝倉書店「多変量解析実例ハンドブック」については[3512],[3524]を参照いただき、その最後の章(「73.3 多変量解析の諸領域への適用をめぐって」)でも(多変量解析のギョウカイ…いえ、セカイの全体から見れば話題として局所的すぎるきらいがあるのですけれども、ハンドブックの編者の直近の関心といいましょうか、執筆時点でのエフォートの割き方として比率が大きいというようなことを強く反映しているのでしょう)「共分散比」「入れ替わり率」「ルールスペース法」への言及(853ページ)がございます。

・「ルールスペース法」の用例です
 http://www.jartest.jp/abst2-1_j.html

 > テスト受験者の認知的過誤を診断するルールスペース法(RSM)を紹介する。RSM開発のアイデアの基本は,統計的パターン認識,分類問題に由来する。
 > 項目×認知的スキルの照応行列Qによって表現される。
 > ベイズ決定規則によって,個々の生徒の反応はより近いと考えられる知識ステートに分類される。被験者の分類が済むと,どのアトリビュートに補習が必要かといった診断が可能となる。

 「あなたはちょっと残ってね」みたいなの…エーッ!!(棒読み)

・ジト目でカワサキ(※)「Rule Space Method(RSM)」のイメージです
 http://stat.web.nitech.ac.jp/haifu/bsj03_25.pdf

※疑いの目で遠巻きに眺める、の意。実在のカワサキとは無関係です。

 > 試験結果から受験者を学習進度に基づいてクラスタリングする手法として、Rule Space Method が開発された。

 > Tatsuoka らは、この Item と Attribute の関係(Incidence Matrix) に注目し、Item の解答パターンから学習達成度ごとのクラスター(Knowledge State)を二次元空間に付置(マッピング)する手法として Rule Space Method (RSM) を提案した。

 どのようなアイテムと属性を用意するのかというところに教育学としての専門性があると見受けられるわけですが(※ただし内容は読んでいませんので、あしからず)、それ以外はまったくふつーのありふれた「数量化III類」なのでは、ないんですかねぇ。アイテムと属性のセットのほうでこそ新規性と独創性を主張なさるべきであって、そうすると提案手法の名前も、もうちょっと違うものになるんじゃあ、ないんですかねぇ。(※個人の感想です!)そして、なぜに「二次元空間に付置」しちゃうんですかっ。多変量解析の結果の出力方法としてはきわめて平面的であるといわざるを…いえ、ま、その、まぎれもなく平面ではあるんですけどね。(棒読み)

[3469]
 > > m人の被験者が,それぞれn個の項目について,項目に反応すれば1,そうでなければ0をとるm×n行列 F を考える.
 > > 項目をm次元ベクトル x,被験者をn次元ベクトル y で表す.

 > 距離を計算したところで終わりにして、明示的には分類を行わないというのが「III類」であると…本当でしょうか。きわめて好意的にいえば、「確率的分類」(※)の1歩手前みたいなのが「III類」であると…もっと本当でしょうか。

 > 「各データが複数のカテゴリに属する多重分類問題」([3403])も参照。

[3500]
 > こういう分析のゴールとして、「図9」のような図が描けるのだとわかります。

 なんと、リンク先が「404」ですと? …なんだかなぁ。

 3月に参照したときに「ダウンロード」フォルダーに入っていたPDFを参照しますと、「図9」は「行プロファイル(ストレッチ・プロファイル)の重心座標系と主軸,成分スコアの対応」とキャプションされた図で、中心に原点のある「次元1」と「次元2」を横軸と縦軸にした平面でした。値はなんとなく-1〜1になっていますが、1.5になっている値もあります。そもそも何をしているかといえば、「4. 対応分析法の考え方」で「表30」に示される「評価項目:工夫・サービス、味、量」(3変量)で「レストラン」10個を「三角座標系」にプロットするというところから始まっています。あくまで説明のための模擬データですが、「1,284人」に「そのレストランを選択したときの評価基準は,次の3つのうちどれでしょうか。(1つ選ぶ)」と聞いて、単純に計数した段階の「表27」で、最小は7、最大は105…うーん。

※1,284人にも聞きながら、「表27」の3×10(=30)のマスのどれか1つに○をつけよという、すっかすかじゃんよ…いえ、まったく精緻さがない上に、3変量までしか扱えず、それなら「三角座標系」でじゅうぶんであるものを、なぜか平面にプロットしてみせるという、あくまでいまとなってはよくわからないものであり、もはや「対応分析法」として考えられた当時のいろいろな限界はすっかり忘れて、いきなり「6変量・625個・7クラスター」([3526],[3532])くらいのデータで遊んだほうが理解が早くてよかったりしないでしょうかねぇ。本当でしょうか。

※あくまで「対応分析法」の説明なので「主成分」とは書かれませんが、「次元1」「次元2」は、主成分分析でいう第1主成分と第2主成分のスコアだとわかります。それなら最初から(変量が3つより多くてもオッケーな)主成分分析をレクチャーしたらどーなんだい。いいぞ、もっといってやれ★。(恐縮でした。)

※むしろ問いかけを単純化したいという話題であれば「実例に見る総合評価(1) K市交・K重工:新型車両デザインの選定」([3420])のほうなど参照いただきたいと、たぶんこういうわけです。読者や聴衆が大昔に習ったというだけで「対応分析法についてレクチャーしてください!」などと『(古典すぎる手法を)ご指名!』で頼まれちゃったりするとセンセイたいへんですねぇ。(棒読み)

[3540]
 > 庭や外構それに街路樹というものは、プロにおまかせすればいいのですよ。我々がつまみ食い的に特定の樹種をご指名するなんて、プロの知見の前ではきわめておこがましいのですよ。

[3527]
 > > 理解を助けるため、2次元平面上の散布図を用いて

[3520]
 > 2次元なら散布図を「見ればわかる」という安心感はあるんですけど…ののんのん!! それじゃだめなんですよ。将来は必ず「多変量解析」に進むんですから(=そうすると散布図で確かめるというのは無謀になってくるんですから)、2次元の発想で妙な安心感など感じていただいては困るのですよ。

・「完全二部グラフ構造上の蔵本振動子系における双安定性の解析」(2016年)
 https://www.jstage.jst.go.jp/article/jpsgaiyo/71.1/0/71.1_2858/_pdf

 > 全結合に比べ,完全二部グラフ構造のほうが双安定領域が大きいなど,グラフ構造の違いによって系の振る舞いが異なることが示された.

・「畳み込みニューラルネットワーク」の説明例です
 https://jp.mathworks.com/discovery/convolutional-neural-network.html

 > 抽出された特徴が、平行移動などでも影響を受けないようにロバスト性を与える役割

 > 画像のカテゴリ分類というタスクにはあまり重要でない位置に関する情報を巧妙に削ぎ落としてやっている

 > 畳み込みニューラルネットワークは、近年のディープラーニング(深層学習)のブームが訪れるはるか前、1979年に発表された福島氏らのネオコグニトロンに起源を持ち、1990年代にLeCunらによって更に発展させられた技術ですが、その可能性に大きなスポットライトが当たったのは、2012年の世界的な画像認識のコンテスト ILSVRC (ImageNet Large Scale Visual Recognition Challenge)においてでした。

 > CPUによる並列演算ではなかなか効率的に高速化させることができなかった畳み込みニューラルネットワークが一気に加速するきっかけとなったのは、このGPUの演算性能にあると言っても過言ではありません。

 > 畳み込みニューラルネットワークをゼロから学習させる代わりに、他のタスクで学習を行わせたネットワークを元に自分たちのタスクに適用させる(再学習させる)ことで学習のための計算コストを節約するもの

 > MATLAB®ではアドオン機能を使って簡単にこうしたネットワークを利用することができます。

 わあぃMATLAB®。みんなMATLAB®だいすき。あなたはMATLAB®を使いたくなーる、MATLAB®を使いたくなぁるぅ〜(以下略)げふ。

 > ベイズ最適化は、一般的にはブラックボックス関数の最適化に使われるアルゴリズムですが、こうした最適化の手法をうまく使うことで、ニューラルネットワークの最適なパラメータを効率よく、自動的に探索するような手法も試されるようになってきています。

 > 画像を入力とした回帰のタスクにも畳み込みニューラルネットワークは使うことができます。画像を入力として離散値を予測するのが分類のタスクだとすると、画像を入力として連続値を予測するのが回帰のタスクになります。

 こういう説明は気持ちいいですよね。…ギクッ。翻って、「畳み込みニューラルネットワーク」の実にしなやかなこと。「二値論理の膨大な集積回路」だなんて、とんでもない。我々『いましがた畳み込みニューラルネットワークの説明を読んだばかりみたいな顔!』で…ギクッ!!(※一部の表現は演出であり、感想には個人差があります!)

※じぶんがわからないことを書かねばならない時は、きちんと最新の説明を的確に見つけてきて参照しないといけないのだと再認識されましょう。(※見解です。)

※じぶんが既によく知っているので積極的に言及しようということに関してばかり参考文献を子細に挙げる一方、よく知らないということ自体に無自覚なまま消極的な言及をしていることについては何も参考文献を挙げないというのは、あまりにもフェアでないといいたいです。知らないことについて逐一調べようというのは当然ながら、知っていると思っていることについても、実は知らない(正確なディテールはつかめていない)かもしれないと思って、知らないことと同じように逐一確かめようという態度も必要でありましょう。(※見解は個人です。)

[3500]
 > 我々「さっき「数量化X類」について読んだばかりみたいな顔!」で混乱してみます。

[3512]
 > 我々『さっきNTTデータ数理システムさんの記事を読んだばかりみたいな顔!』で…ゲフンゲフン。

[3514]
 > わあぃ同軸噴流の軸対称とヘリカルモードの流れ構造。***同軸噴流の軸対称とヘリカルモードの流れ構造だいすき。もっかい? わあぃ同軸噴流の軸対称とヘリカルモードの流れ構造。我々「さっき「同軸噴流の軸対称とヘリカルモードの流れ構造」を読んできたばかりみたいな顔!」で同軸噴流の軸対称とヘリカルモードの流れ構造だいすき…ゲフンゲフン。

 > 現実の変量間の構造はループありの「ぐるぐる☆どっかーん!」([3089])なネットワークなのであって、それでも各々の変量には(物理的、空間的、時間的、相対的のいずれかまたはぜんぶの)制約があるので、「結果的には現実的な結果」(?)だけが『現に現れて!』くるのだろうという、そういうセカイですよね。

 > 変量間の構造が循環していれば、いずれかの変量をゼッタイの「原点」と定めるようなことはしにくく、大域的には流れのおおよその向きというものはあっても、局所的には双方向のエッジとなるペアもあれば、フィードフォワードループやフィードバックループ([3125])を形成する一群というのも見られてくるはずです。いま12分42秒くらいのところでナレーションのおかたも「うわぁ…もじゃもじゃのカタマリ。」といっておられるじゃないですか(※)。高校までの物理のイメージに即して例えれば、渦みたいなものです。そこには、そのような構造そのものにより発現される機能(や動き)というものがあると考えられるのであって(≒渦というものは、この構造あってこそ『渦らしい』動きを見せるのですよ)、これをぶったぎって因果関係だとかなんとか…なにをおっしゃる。(棒読み)むかしのひとはいいました…じゃなくて、なんでもツリーにしないと考えられない、われわれがいちばんツリーなのかもしれませんね。…われわれがいちばんツリーなのかもしれませんね&2回いいました。(棒読み)それ、(当時)計算できないからしかたなくツリーにしてきたのであって、(今後)計算できるならツリーにしなくていいのですよ。もとは計算のための工夫だったことをすっかり忘れ去って、あたかも最初からセカイはツリーであったかのような(大巾に略)コレハヒドイ&そこからですかっ!! 先が長いなぁ。(※個人の見解です。)


★「マイニング」とはにわ(再)


 「全7回(予定)」とのことで、残り6回しかないんですけど、きちんと「うわぁ…もじゃもじゃのカタマリ。」が読み解かれていくのか注目されます。

・(参考)「Webページ群の構造解析とグループ化」(2002年3月)
 https://www.nii.ac.jp/journal/pdf/04/04-03.pdf

・(意訳)「うわぁ…もじゃもじゃのカタマリ。」の用例です
 https://books.google.co.jp/books?id=9TphDQAAQBAJ&lpg=PA142&ots=mS3tgsQ0GK&dq=SCC%20tendrils&hl=ja&pg=PA142#v=onepage&q=SCC%20tendrils&f=false

・平易な解説の1例です
 https://www.ai-gakkai.or.jp/whatsai/AItopics6.html
 https://www.ai-gakkai.or.jp/whatsai/IMG/web-butterfly.jpg

 > お菓子はべつばら
 > お菓子はべつばら

 うーん。「もう食べられないよ」([3099])…じゃなくてですね(略)。

 > マイニングの元の意味は「(鉱山から鉱石を)掘り起こす」ということですが,ここでは本当の鉱山を掘るのではありません.Webを,情報が埋もれている「鉱山」だと思って,情報や知識を見つけ出すことをマイニングと呼んでいます.

 いやいやいや、「マイニング」という言葉を的確に訳すなら「鉱山の開発」でしょ&「鉱山の開発」の成否(の判断)って、安全に効率よく、投資に見合った産出物がある程度の長期にわたってコンスタントに産出されるところまで含みますよね。『川で砂金を採るレヴェル!(笑)』じゃ、全然だめなんですよ。ひいては「鉱山のカナリア」も「鉱山(の開発)」の一部を成していますよね。(※個人の見解です。鉱山には油井を含みます。)

[3394]
 > 和英辞書で「デジタル化」を引いて一丁上がりとはいかないことがよくわかります。
 > 放送をデジタル方式に切り替えることを「digitization」とは到底いえないとわかり…いえ、その理屈を説明するのはむずかしそうだなぁ(略)。

[3207]
 > 編成両数という『記号的カタログスペック』だけを見て『JRの京急化!』などと経済誌で評される!

[3398]
 > 「英和辞書は4番目まで見ないと原語でのニュアンスをうかがい知ることすらできないのよ」「ましてや和英辞書を引いて一番上の説明をうのみにするなんて信じられないわ」(=後述)からの「滑稽だわ!」キターっ。

[3405]
 > surveyという語だけでかなり広い(1語で言い尽くした感じがある)ので、これにsystemという(狭い)語を続ける感覚がよくわからないような気がしつつも(略)「査定システムっ!」と書いてから和英辞書を引いたかのような感じなのでしょうかねぇ。

・古式ゆかしくは「鉱業」との対訳がございます付近
 https://ja.wikipedia.org/wiki/%E9%89%B1%E6%A5%AD

 > 鉱業(こうぎょう、英語:mining)とは
 > 広い意味では任意の再生不可能な資源の採取を含み、石油や天然ガス、さらには化石水の採掘も含む。
 > 鉱山は操業中だけでなく、閉山になってから何年か経っても、周囲の環境の悪影響を及ぼすことがある。

 > 音が同じ「工業」などと区別するために「山の鉱業」「金偏の鉱業」などと称することもある。

 わあぃかねへんのこうぎょー。それにかねへんのてつどー…じゃなくて、(放送用語としての)『アンケート調査!!』じゃないですが、(放送の普及と電話料金の低廉化によって)話し言葉だけでの「(自称)スピーディーな意思決定!」みたいなのばかりが幅を利かせるようになるとともに、あまり使えなくなっていった書き言葉でもあるかもしれません。本当でしょうか。わたしたち、もっと書き言葉というものを使って精緻な日本語対日本語のコミュニケーションというものをだなぁ(略)メッソウではございました。

※類題として「Machining(マシニング)に使う機械(マッシーン)が工作機械であり、機械を使って材<まてりある>を加工(=切ったり削ったり曲げたり磨いたり)するのが機械加工と訳されるmachiningであり、その工場<こうば>はmachinery(マシナリー)と呼ばれると、こういうわけです。すとーんとすとすとまいる、いただけましたでしょうか? …ガガガガッテン!(違)」については[3476]を参照。

・産経新聞より「新潟製油新発田鉱山」のイメージです(2017年3月1日)
 http://www.sankei.com/life/news/170301/lif1703010073-n1.html

 > 新発田市中田町1丁目にある「新潟製油新発田鉱山」の油井からガスや油が噴き出していた。

 > 辺りは田園地帯で、1日もガスが「シューシュー」と音を立て、油の臭いが充満。作業員が地面にたまった油などを回収していた。

 しゅわしゅわとぱちぱちについては[3440]を参照。

・Google びゅう鉱山 国道7号線「新潟製油新発田鉱山」付近のファミリーマート(※本件とは無関係です)
 https://goo.gl/maps/DH2WWThT54s
 https://goo.gl/maps/GgtQbvYkEZH2

[3514]
 > 「コンビニエンスストア数」
 > 飲食店や小売店にしても『変な業態!』の店が「たけのこ」みたいににょきにょきする(=流行らなければ、すぐにたたんでしまう!)ようになると、(この「たけのこ」によって活況が生まれているのかどうかという部分は測れていないという意味で=単に飲食店の開店・閉店を数えさえすればよいというものでもない=ひいては閉店や廃業の増加をただちに不況のサインとみなすこともできなくなってゆくという意味まで含めて)統計が一種「骨抜き」になっていくんですよ。

 あまねく全国あなたがたほとんど役場の出張所でしょみたいなの(仮)から「コンビニはいいぞ(仮)」みたいなの(?)まで、コンビニ各社はかなり色合いが異なるので、単に「コンビニエンスストア数」といって、系列を問わず数え上げてよいという時代は、もう終わっているのではないかなぁ。(棒読み)仮には「トネヨッタツ」([3434],[3533])と『ビジョーぷじょ木』…じゃなくて「シトロエン美女木さん並び「プジョー美女木」」([3455])みたいなのを同じカテゴリだといって数え上げる、ひいてはビジョーぷじょ木…いえ、「シトロエン美女木さん並び「プジョー美女木」」みたいなのを愚直に(延べ)2店と数えるようなことに、果たしてどれだけ意味があるんでしょうかねぇ。

[3455]
 > いやいやいや、地図にも電話帳にもカタカナで書いてあるんですもの。…プジョー美女木っ! ビジョーぷじょ木じゃないよ☆ダイジョーブだルーク、まだビショップはここにあるっ。…すー…はー…。(あくまでイメージは映画と呼ばれるスターウォーズであり、実在するチェスならびに駒形どぜうとは無関係です。)

※「シトロエン美女木さん並び「プジョー美女木」」みたいなのが(ある地域に)1箇所でもあるというのは、特徴量として『ポイントが高い!』(≒情報量が多い⇒SN比が高い)という気がしました、の意。

・(再掲)東京港湾福利厚生協会「ポートストア」のイメージです
 http://www.t-port-kousei.or.jp/shisetsu.html
 https://goo.gl/maps/M7sGCx49gHk

 > 売店(コンビニエンスストア)

・Google びゅうマーチエキュート神田万世橋 「1912階段」付近の「コンビニエンスストア」のイメージです(※本件とは無関係です)
 https://goo.gl/maps/scM2x3LbBaN2

[3517]
 > 「コンビニ? あるよ。」からの「コレジャナイやい」みたいなの…ゲフンゲフン。(※酒屋さんです。)「『ザ・コンビニ』みたいなの」と「コンビニエンスストア ○○屋(○○酒店)」は違うのだよ@圧倒的じゃないかっ。(棒読み)オトナは気にしないけど(=缶ビールやたばこはブランドが同じなら完ぺきに同じものが手に入るのだし…そっちですかっ!)、子どもって、きわめて細かな差異を気にするよね。…ギクッ。がけ崩れの兆候とか橋に溜まる流木とか、子どものほうが早く気づけると思うんだなこれが。(※あくまで私見です。)

・「国道に強い」ファミリーマートのイメージです(※本件とは無関係です)
 http://www.family.co.jp/company/news_releases/2017/20170424_020.html

 > バスのドリンクホルダーに収まるサイズの筒状の菓子やペットボトル飲料など、バスをご利用になるお客さまが手軽にお召し上がりいただける商品のラインナップをさらに拡充いたします。また、日用品においても、車中での使用も多いマスクや携帯充電器、旅行や出張で便利なミニサイズの洗面用品などの品揃えを強化するほか、

※実は県道にも強い(?)佐賀駅バスセンター「ファミリーマートとも呼ばれる売店」からの「掃除!」については[3458]を参照。

[3458]
 > 「清掃」と書けば、あらあら、まあまあ! 姿勢正しくホウキのほうなどざっざっとドライでフォールな落ち葉のイメージでありますが、「掃除!」と書くと、なんですかねぇ。腕まくりしてゴム手袋のほうなどしながら、たわしのほうなど

 …じゃなくてですね(略)「鉱山」といって、その実、『山』じゃないけど…まぎれもない「鉱山」ですよ。うん。(棒読み)トンカツの生きたの! …じゃなくて、(水でも油でもガスでもいいから、その鉱床までの)(縦でも横でも斜めでもいいから)坑の(まだ掘ってなくてもいいから)掘ったの! 地下部分を指して鉱山というんですよ。本当でしょうか。(もっと棒読み)

[3503]
 > 「分水嶺の下」…うーん。「分水嶺の下」っ。えーっ。分水嶺というのは真上から見ての地点(や、それをつなげた線)をいうのであって、上も下もなかろうかと…えーっ。(※個人の感想です。)

 > 工学的に「分水界」と「山稜としての分水嶺」を「ばしつと」分けて『用語する』と、「分水嶺の下」という表現が出てくるのかもですけれど、しかし、分水嶺といってなお、これは分水界という、山の表面(上に出ている地表面)で起きる現象のことをいうことばなんですから、山のカタマリを指して、その「下」という表現に使おうというのは、かなり違和感があるなぁ。本当でしょうか。

・NTTビズリンク「スピーディーな意思決定」のイメージです
 https://www.vcd.nttbiz.com/solution/solution_boardmeeting.html

 > テレビ会議を活用することで、相手の表情はもちろん、感情や細かいニュアンスも伝わる高臨場感でスピーディな意思決定を実現します。

 高臨場感なテレビ会議を大枚はたいて(中略)表情の変化が乏しく発話に抑揚もなく声だけが大きい…いえ、なんでもないです!!(棒読み)

・1例として「スピーディーな意思決定!」のイメージです(=当時)
 http://www.huffingtonpost.jp/kunio-komoriya/speedy-decision-making_b_7740780.html

 > もともとは日本企業の意思決定スピードが遅すぎてチャンスを逃している、あるいは危険回避行動が遅すぎる、という問題認識が背景にあります。
 > しかし遅すぎるのが悪いからと言って、とにかく早ければ/速ければいい、ということには決してなりません。

 > KKDD(=勘と経験と度胸とど根性)と『インテリジェントエイヤ!』

 > 誠に残念な状況です。
 > 誠に残念な状況です。

 ごもっともごもっとも!!(棒読み)

・「幅を利かせる」
 http://thesaurus.weblio.jp/content/%E5%B9%85%E3%82%92%E5%88%A9%E3%81%8B%E3%81%9B%E3%82%8B

 > ふんぞり返る
 > 影響力を行使する
 > 無言の内に支配する

 ま、それを「幅を利かせる」と形容するんですけどね&「幅を利かせる」は、これ全体で1つの形容詞みたいなものですよね。2字熟語や4字熟語それに古語などをあざとく使いさえすれば書き言葉だなんて、きっととんでもない&たぶんとんでもない。(※あくまで私見です。)


この記事のURL https://neorail.jp/forum/?3542


(約21000字)

この記事を参照している記事


[3543]

実例に見る総合評価(2) A県警:交通事故当事者の誕生日の区間分割

2017/9/19

[3544]

【JR30年】「ファイナルファンタジー山手線」が山手線でなければならない理由とは

2017/9/22

[3546]

いま問う『確率的駅勢圏(非定形)』のススメ

2017/9/27

[3547]

新しい広域流動(7) 東京都台東区・荒川区

2017/9/27

[3557]

研究ホワイトボックス(25) ハイパー・ゼロ:「博物館評価」とは

2017/10/16

[3560]

【国際VHF】「千葉灯標」(1964年)とその周辺【横浜パイロットビルあり】

2017/10/29

[3566]

「決定木」を1度忘れて再び「ランダムフォレスト」に至る(談)

2017/11/19

[3575]

研究ホワイトボックス(29) 多変量データの全域を考察するには〜駅弁の商品構成を例に(後編)

2017/12/3

[3584]

研究ホワイトボックス(30) ハイパー・ゼロ:「主成分分析」FAQ

2017/12/19

[3591]

風見鶏は飛立った〜年初に愛でる『展望塔』

2018/1/1

[3610]

【205系500番台】「運輸白書」(1990年度)ほかをひも解く(紐)【クロ253形100番台】

2018/2/24

[3617]

武蔵野市「武蔵野市地域公共交通総合連携計画」(2010年3月)を読み解く

2018/3/10

[3640]

研究ホワイトボックス(32) 「単元」と「難易度」を示した「総合的な教材」をつくるには

2018/4/30

[3675]

研究ホワイトボックス(34) 行列と行列の差を検定するには

2018/9/1

[3676]

【正宗の名刀で速射砲と立合をするような奇観を呈出】発生学から出立するディープラーニング(仮)【社会調査工房オンラインあり】

2018/9/13


関連する記事


[3581]

実例に見る総合評価(4) T工務店:ビル外壁汚れ認知構造のモデル化 tht - 2017/12/7

研究 数学 仮名 主成分分析 散布図 多変量解析 クラスタリング 相関係数 重回帰分析 ゼミ


[3571]

実例に見る日英対訳(17) 「ランダムフォーレスト」に野生はあふれ tht - 2017/12/3

研究 道路 数学 仮名 主成分分析 散布図 多変量解析 クラスタリング 相関係数 摂取


[3582]

10年後に読む「よりよい環境創造のための環境心理調査手法入門」(2000年5月) tht - 2017/12/7

研究 建物 自由研究 数学 主成分分析 散布図 多変量解析 クラスタリング 相関係数 説得力


[3669]

【自由研究】ゆるシミュ(9) tht - 2018/8/16

研究 道路 自由研究 数学 仮名 主成分分析 散布図 多変量解析 クラスタリング 素敵


[3567]

いま問う「正射影ベクトル」からの「凸最適化」を『ほぼSVM』と読み解くココロ(試) tht - 2017/11/19

研究 数学 主成分分析 多変量解析 クラスタリング 相関係数 重回帰分析 回帰分析 クラスター FORTRAN


[3649]

【お知らせ】ストリートビューの表示を休止します tht - 2018/5/31

研究 建物 自由研究 数学 仮名 主成分分析 散布図 多変量解析 クラスタリング アフォーダンス


[3639]

【自由研究】ふわコレ(6) tht - 2018/4/30

研究 道路 建物 自由研究 数学 仮名 主成分分析 多変量解析 相関係数 公式マスターズガイド


[3674]

研究ホワイトボックス(33) なるべく「一般的」といわれる方法に則るには tht - 2018/9/1

研究 道路 自由研究 数学 仮名 主成分分析 散布図 多変量解析 相関係数 素敵



キーワード (索引)
キーワードを選んで
話題を見つけよう


リファレンス 【使いかた】
参考文献を探そう


四半期ごとの主な話題
(1999年度〜最新





neorail.jp/は、個人が運営する非営利のウェブサイトです。広告ではありません。 All Rights Reserved. ©1999-2018, tht.