フォーラム 個人情報保護方針 | 利用規約

「情報と鉄道」「ユニバーサルデザインと鉄道」「社会と鉄道」がテーマのフォーラムです。(16歳以上対象)

ご利用状況について
このフォーラムについて
機能の改廃等について

(※新規の掲載はお受けしていません。)

全角と半角、大文字と小文字が区別されます。

検索の代わりに:
キーワード (索引)もどうぞ。


【自由研究】の話題

 → 茨城県内で必要な「主論文・野帳・掲示物」とは? 【詳細】(2017/10/19) NEW!
 → 【自由研究】の記事一覧(新着順)


【研究ホワイトボックス】

研究を楽しく「追体験」! 真っ白のキャンバスに虹色の未来を描く方法、教えます。



[3514]

【5年移動相関】おそらくTensorFlowを用いたであろう「時系列パターン認識」を千葉県「産業連関表(平成17年表)」ならびに「リクルート」で読み解く(推)

発想 研究 実装 仮名 数学 プレー 主成分分析 多変量解析 クラスタリング ワークステーション


「AI」とはにわっ!?
「時系列データマイニング」+「『ディープラーニング』と呼ばれるAI(人工知能)」の“妙”
「開発」とはにわ
「NHK技研」ここにあり
経済学と社会学を『がっちゃんこ』
「宿題」はわわ
ツイッター(ほか)かく語りき
さらにかく語りき(談)
「ぐるぐる☆どっかーん!」を金沢大学「同軸噴流の軸対称とヘリカルモードの流れ構造」で読み解く(試)
略年表 ニューラルネットワークの研究とNHKの関わり
データセット1(「5000を超える公共のデータ」)
データセット2(「タイプ分け」)
データセット3(番組ホームページで説明あり)


●「AI」とはにわっ!?


・NHK「NHKスペシャル AIに聞いてみた」(2017年7月22日放送)
 https://www6.nhk.or.jp/special/detail/index.html?aid=20170722

 これ、何の番組かといって、経済ですよね。うん。テクノロジーやサイエンスの番組ではないんですよ。(※比ゆ的には「科学文化部」ではなくて「経済部」なんですよ。)経済が専門でなければ、とりあえず「はぁ」と聞いておくしかないんですよ(=わたしのことです、あしからず)。大越氏は「連関」といっているので、ああ、経済なんだと(「政治部」ではあるけれども、とっさに「連関」というくらいには経済を勉強しているのだと)、合点がいきました。

・NHK「解説委員室」
 http://www.nhk.or.jp/kaisetsu/

 情勢を分析してみせて、解説委員が考察を述べるという形式の番組は、既に長い歴史がございます。これを夜の7〜9時台に持ってくるとこうなるのだと、こういうわけです。…なるほどねぇ。ナレーションのおかたって、いま何歳でしたっけ…そっちですかっ。(棒読み)

 解説委員が解説委員という名のもとに好き勝手なことを言っている! …とんでもない。番組に直接には出てこないところで、多くの記者やリサーチャーが取材や調査を重ねた上での解説委員なのですよ。

 外部の専門家との連携がどのようになされているのかといって、その実、いわば学術版「見えざる記者クラブ」みたいなの(!)とでもいいましょうか、特にニュースがなくても取材や調査をなさっておられるはずですし(=甘い期待としては、専門家が何を常識、何を今後の課題だと捉えているかというようなことは、記者も承知できている…はず!)、どこにどの分野の専門家がいるのかという「専門家名鑑!」みたいなのも、部内でつくられていることでしょう。(※あくまで一般的なイメージです。)専門家から異論が噴出するようなお粗末な番組が作られることはないだろうという、これまた淡い期待を、専門家としてはお持ちであろうとの推察にございます。

 その上で、分野間で見解が分かれるような部分については、あえてNHK側に責任がある(=「NHKスペシャル」として放送する=)という体裁をとることによって、かえって(伝統的な)専門家が先入観(や従来の分析手法)を捨てきれないところをあっさりと突き抜けた内容になっているのではないかとも…うーん。それでよかったのでしょうか。

 AI(を用いた解析システムならびにインタラクティブ可視化システム)そのものについては、ちょっとした工学部の研究室くらいの陣容で、NHK内(※場所は技研かもですが&人は院生のインターンシップくらいのソレかもですが=あくまで一般的な推察です)に「開発ルーム」と称して1部屋ほど確保なさっているようすが映し出されています。…うーん、いいモニターを使ってるねぇキミぃ(略)@うりうり!(※モニターはイメージです!)

 なお、「データ同化」については[3151],[3400]を参照ください。


●「時系列データマイニング」+「『ディープラーニング』と呼ばれるAI(人工知能)」の“妙”


 「AI-たにし」さん([2],[127],[130])…は無関係ですけど、なんとなく思い出しました。(恐縮です。)

・かみつたセンセイ「頻出パターンマイニング」
 http://www.kamishima.net/archive/freqpat.pdf

 > (13ページ)

 > Apriori
 > VLDB 1994

 1994年のアルゴリズムなので、そのつもりで読むのですよ、の意。

 > 直接的な解法: 作ることが可能な相関ルールを,全て作って,その支持度と確信度が条件を満たすかを検査

 > しかし!

 > アイテムが10種類の場合でも,それらを組み合わせて作ることのできる相関ルールは57,002種と多い
 > アイテム数が増えると,さらに膨大になる

 > 無理!

 > 支持度と確信度の特徴を使って効率よく探索

 「5000を超える公共のデータ」…ぎゃふん!! 5000として、そこから2つをとる組合せは12,497,500、3つなら20,820,835,000にまでバクハツするのですよ。そこで「ディープラーニング」なのですよ。いかにも妥当なアプローチではございませんか。

 最終的に得られるのがAprioriと同じ相関ルールであるとしても、この、同時に「5000を超える公共のデータ」を扱おうというところにはかなりの工夫が要るのであって、それを(仮には、ある1期・1地域のデータを5000×5000ピクセルの画像で表現し、12月×30年×47都道府県=16920枚の画像を積み上げて、あとはもう、単に画像として扱って)「ディープラーニング」で特徴抽出(「パターン認識」)しようということです。

※相関行列としては斜め線を引いて半分でいいので画像を折りたたんでピクセル数は半分にできたりするんでしょうか&したいですよね、の意。

※年単位であれば1410枚の画像を積み上げるだけですよ@まさに卒論レヴェルですよ&論文に「Pentium!」とか書いちゃいそうな勢いですよっ。CGで「パターン」を積み上げてみせている「高さ」は、かなりおおげさではないかなぁ。もし1410枚なら、500枚入りのコピー用紙をつごう3冊ほど積み上げて、そこからつごう90枚ほど抜いたくらいの高さなんですよ。…ギクッ。

・まじかる☆だいおうじ!「コピー用紙」のイメージです
 http://image.itmedia.co.jp/bizid/articles/0903/19/ts_majikaru.jpg
 https://www.officedepot.co.jp/user_data/packages/b2c/img/sku/134000/133276_sk_lg_121121162947000000.jpg
 https://www.kaunet.com/kaunet/images/goods/option/extra/K3412644.jpg
 https://www.kaunet.com/rakuraku2/base/images/template/k034_t_170928_987_search_exp01.jpg

 (あくまで比ゆ的には)天井の模様が顔に見えるっ!! …じゃなくて、デジカメの「流し撮り!」みたいな処理に近いとでもいえばいいんでしょうか。

・「流し撮り(コンティニュアスAF)」のイメージです
 http://fujifilm.jp/support/information/move/index.html?link=n2u

 おっと、まずは「『AI』とはにわっ!?」との疑問に答えておかなくてはいけません。「パターン認識」(⇒マイニング)というのは、(「知能を持つ」)人にしかできない高度な知的タスクだと思われていたところ、これが計算機にもできるんですよん=これを「人工知能(AI)」というんですよ。それだけなんですよ、ええ。ですから「パターン認識」を使っていれば(=必然的に、その部分がコアになるわけですし)、そのシステムの全体を「AI!」と呼んで、…まあ、呼んでいいですよね&むしろ呼びたがっているんだ的な叫び(?)はわかりますよね。(※あくまで1つの見解です。)

 これまでの経済指標の分析の「お作法」に則った入力と出力でありながら、しかし、途中に「ディープラーニング」を組み込んで…という、そこが見どころであるように思われそうです。

・千葉県「産業連関表を利用しよう(平成17年表)」
 https://www.pref.chiba.lg.jp/toukei/toukeidata/sangyou/h17/17riyo.html

 > 産業連関表利用のためのリーフレット
 > 『入門産業連関表その見方・使い方』

 > 第2次波及効果

 グラフ理論でいう「ホップ数」([3496])としては、わずか「2」までしか追わない(=追えない)のが、手作業で産業連関表([3494])と諸統計を参照しながらのソレであったということなんです。これ自体が1970年代ひいては1960年代を引きずっているといえばそれまででもあると思いますけれども、いまとなってはスマホでも計算できそうなくらいの計算しかしていないですよね。そこに、きちんと最新の計算機資源(…にかかるお金! 要はお金ですよ、お金!!)をじゃぶじゃぶ投入しようと(ストレージではなくCPUにお金!!、の意)、こういうわけです。そこにはクラウドを使うのかなぁ。(…気になります!)番組の進行上「もっと高性能な『パソコン』がほしい」といわされてからの…げふ…やだなぁ。Xeonが2つとか4つとか載ってるサーバーとかXeonが載ったボードとかでしょ、あなたがほしいのは([3302])。

[3358]
 > わあぃXeonがいっぱい。***Xeonがいっぱい***。

 > prevailing:優勢な、今流行の⇒目先の(?)、only be changed or improved in the long term:⇒長期変動としてのみ観測できる。

 > 「目先の○○!」と「長期変動」を対置して述べているのかなぁ

・ベンダーニュートラルをきどって「EPYC」のイメージです(2017年7月13日)
 https://japan.zdnet.com/article/35103876/

 > 128レーンものPCI Expressを使用できることから、最大6枚のGPGPUカードを搭載できる。

 その時点その時点の「いちばんいいやつをたのむよ☆」のほうなどしないと、ライバルに後れをとりますぜ★お客さーん!(※表現は演出であり、ベンダーから見ればNHK殿もお客さまですよ、の意。)

[3302]
 > > 実際の計算時間を以下に示す(単位は秒)。実行したマシンは PentiumII 400MHz x 2, メモリ 512MB, Kondara MNU/Linux 1.2 (kernel-2.2.17-15ksmp), Octave-2.0.16 (ディストリビューション附属のノーマル状態のもの) という感じである。

 > ※2001年2月のスペックです(=当時)。現在の気分としては、Xeon E5を2つ載せたデルやLenovoのワークステーション(もしくはタワー型のサーバー)を1台だけフンパツするような感じですね、わかります!(あくまで気分です。)メモリが64〜128GBくらい(一般的な「PC」の8〜16倍くらい)といって、その実、「約409,379円くらいヨリ」とのこと。(=2016年のお値段です。)記事が書かれた当時には、わざわざ書くまでもないくらいの(研究室で使うマシンのスペックとしては)「あたりまえのこと」であったかもしれませんが、こう、15年後に読もうという時にはとっても参考になります。

・合成「ライバルの後れをとる」付近
 http://thesaurus.weblio.jp/content/%E6%B0%97%E5%BE%8C%E3%82%8C%E3%81%99%E3%82%8B
 http://thesaurus.weblio.jp/content/%E5%BE%8C%E5%A1%B5%E3%82%92%E6%8B%9D%E3%81%99%E3%82%8B
 http://thesaurus.weblio.jp/content/%E7%B6%9A%E8%A1%8C

 > 相手の持つ力に圧倒されること
 > 優劣で遅れを取ること

 > ビハインドする
 > 幕なし

 なお、データが「30年分」といって、仮には1985年から2015年くらい、つまり、ほとんどは『平成時代!』のデータなんですよ。JRだって「30周年」なんですよ。…その発想はなかった! わたしたち、「30年分」といわれて、はいそうですか…じゃなくて、1960年代や1970年代のデータが入っていると、勝手に思いこんだりしちゃってません? えーっ!!

・総務省統計局「主要耐久消費財の所有状況」
 http://www.stat.go.jp/data/zensho/2004/taikyu/gaiyo1.htm

 最後のソレとして「クーラー」がほぼ普及し終えたあと、「みんながほしがる耐久消費財!」って、なかったのだと、(番組内で言及されている通り)そういうわけです。この30年のデータでは、最初のほうで「クーラー」の普及([3174])、自動車の複数台保有などが観測された後は、まったくよくわからないデータになっているのではないかと思われないでしょうか。本当でしょうか。そして、そのよくわからないところこそ『平成時代!』の核心であると仮定すれば、逆算的に、どのようなデータを持ってくれば「補間」できるのでしょうか。考えるべきは、そっちなのですよ。(…たぶん!)

[3174]
 > いまや「野×家」にも『据え置き型ゲーム機』(セガ「ドリームキャスト」の本体形状に任天堂「ゲームキューブ」の色とコントローラ!)があり、「松×家」にはブランド不明の『薄型大画面テレビ』が、しかし「×野家」には『東芝のエアコン』はないんですねぇ…などと(略)。「温熱」については[3162]を参照。「磯×家」にエアコンがないのは住宅の気密性の問題であって、たいへん技術的に妥当な判断です。かといって、他の家電を1990年以降のものに「リプレース!」してしまうと、「ルームエアコンの世帯普及率」の統計に反することとなり、たいへん(統計上)不自然になります。それを避けるために、作中のすべての家電が1988年くらいで止まっているんですね! ……さすが東芝っ! 仮に『演出の都合上!』の理由だけで説明がつくとしても、実際にはもっと複雑なのですよ、と勝手に決めつけてみます。(あくまで決めつけです。)

 ゲーム機はみんなほしいですけど(=賞品や景品として大人気!)、100万円前後という(当初の「クーラー」や自動車)ところからは1桁以上小さく(※ゲーム機をほぼぜんぶ買い揃えてソフトもじゃぶじゃぶ買ったとしても、維持費込みでの自動車ほどにはかからない)、ローンを組んで150万円のワークステーションやサーバーを買う個人がふつーにポンといるかといって、うーん(※建築士やデザイナーなどの個人事務所を除く=これは設備投資であって耐久消費財ではない、の意)。「クーラー」や自動車に相当する「みんながほしがる耐久消費財」って、やっぱりないですねぇ。

・「個人消費と設備投資の現状」京都総合経済研究所 東京経済調査部 村山部長の見解です(2016年8月)
 https://www.kyotobank.co.jp/houjin/report/pdf/201608_02.pdf

 そして、産業連関表の改訂が追いつかないよ! そっちなんですよ!!

 いきなりステーキ…じゃなくて、いきなりスマホが普及したりドローンで荷物を運んだりなんて、変化が速すぎるんですよ! 飲食店や小売店にしても『変な業態!』の店が「たけのこ」みたいににょきにょきする(=流行らなければ、すぐにたたんでしまう!)ようになると、(この「たけのこ」によって活況が生まれているのかどうかという部分は測れていないという意味で=単に飲食店の開店・閉店を数えさえすればよいというものでもない=ひいては閉店や廃業の増加をただちに不況のサインとみなすこともできなくなってゆくという意味まで含めて)統計が一種「骨抜き」になっていくんですよ。民泊? ありゃあ、ダメだね。宿泊者数の実績を正確に報告させることができる見込みとかあるんです? ないでしょ。(※個人の見解です。)

・「たたむ」
 http://thesaurus.weblio.jp/content/%E5%BA%97%E3%82%92%E3%81%9F%E3%81%9F%E3%82%80

・東洋経済オンライン「いきなり!ステーキ」のイメージです
 http://toyokeizai.net/articles/-/67357

・産経新聞「宿泊統計に「民泊」データを算入 観光庁、来年にも調査 訪日客の実態把握」(2017年5月21日)
 http://www.sankei.com/politics/news/170521/plt1705210007-n1.html

 > 日本政府観光局(JNTO)によると、平成29年の訪日客数は推計で5月中旬に1千万人を突破するなど順調に伸びている一方、宿泊施設にカウントされない民泊などを利用する訪日客も増え、最近の宿泊旅行統計調査では、外国人の延べ宿泊者数は前年同月を割り込む月があるなど乖離が見られていた。

 「ディープラーニング」を仕込んだNHKご謹製のシステムに、経済指標をどかんと放りこんで、入れたデータの範囲でわかる連関表を、その場でつくってしまおうと、たぶんこういうわけです。どれだけ(指標でなく連関表のほうが)フレッシュな分析になっているかということが、千葉県「平成17年表」と見比べると、わかってくるのではないでしょうか。

・千葉県「産業連関表の仕組みと見方」
 https://www.pref.chiba.lg.jp/toukei/toukeidata/sangyou/h17/documents/nyumon_1.pdf

 > (前略)そして、190部門表となると、とても見開き1頁の表には表し切れません。産業連関表の最も基本になる部門分類は行520×列407という細かいデータからなっており、それをどんどんまとめていって、190部門表、108部門表、36部門表、13部門表の順で作成されるのです。
 > もっとも、部門分類が変わっても、分析の理論や手順は同じです。早い話が3部門表での分析の仕方がわかっていれば、190部門表でも同じやり方で分析すれば良いのです。

※「行520×列407という細かいデータ」も、いまとなっては計算機で使うために、最初から使いたいとも思われるかもですよ。

 本件番組でつくられる相関関係の構造は、もちろん産業連関表とはまったく異なるものです。それでも、▼採用する項目を「産業」に限っていないこと、また、▼お金の移動ではなく、指標そのものが一定の時期に連動するかどうかという「相関」を調べて表をつくるのだという、この2点で、産業連関表を「一般化」したものであるということができましょう。こう考えれば、必ずしも「ディープラーニング」の詳細を知らなくても、産業連関表は知っている(≒大昔に習った!)かたには話が通じることでしょう。

 フレッシュな分析をこれまで誰もやっていなかったかといえば、いいえ。消費者物価指数など、個別の指標としては、調査内容のフレッシュさが確保されてきたはずなんです。しかし、連関表そのものをフレッシュに保とうというのは、きわめて困難であったとみられます。

・総務省統計局「消費者物価指数」
 http://www.stat.go.jp/data/cpi/4-1.htm

・「日本統計年鑑」
 http://www.stat.go.jp/data/nenkan/index1.htm

 > 30の分野,537の統計からなり

 「5000を超える公共のデータ」というと、よほど雑多なのではないかと心配されるかもですが、たぶんいいえ、足元ではこの年鑑のように、よく吟味された統計であろうと想像してみます。そして、この年鑑だけで537なんです。5000とはいっても、冊子体やCD-ROMの枚数でいえば、さほどでもないのではないかなぁ。銀行系のシンクタンクでは、あたりまえのように常備しているかもですよ。本当でしょうか。(※あくまで一般的なイメージです。)

 NHKとしても、1人で「5000」の全域を熟知しているという記者やリサーチャーはいなかったでしょうが、NHK全体の「チーム報道!(みたいなの=端的には部内の図書館とかデータベースとか)」としては、すべてこれまでに実際の報道や番組制作に使ったことのある、一種「手慣れた統計処理」の域を出ないともいえそうですよ。

※「47都道府県」でバラバラに出されている統計は、きっと1項目でも47と数えるんですよ。5000といっても、だいぶ内訳が見えてくるような気がしてきますよね。うん。そして、当然ながら「NHK放送文化研究所(文研)」([3215])の調査も使ってますよね。「パターン認識」「ディープラーニング」との文字の直前で「家庭内会話率(中学生)」「携帯・スマホ所有率(中学生)」「米生産量」「年間雨日数」「コンビニエンスストア数」…など出てきます。かなり文研っぽいですよね。ほかに「震度3以上の地震」というのも見えたような…気のせいですかねぇ。注目したいのは震度4以上なんでしょうけれども、(震源地ではなく、注目する地域で)震度4になるかならないかの境目で、もう1桁ほど精度がほしいといって「震度3以上」なんですね。(…たぶん!)

 本件番組では、「総務省 統計図書館」との字幕が出されながら、青い「館内」とのラベルも鮮やかに…じゃなくて、「国勢調査報告」「患者調査」「家計調査年報」「住宅統計調査報告」「国勢調査報告」「社会福祉施設調査報告」があざとく冊子体で映し出されています。そこに出てくる「602 男子寝巻き」(※「寝巻き」は原文ママ)くらいの細かさのソレ(しかし、そもそも統計を取る時点でよく吟味されているソレ)も数えて「700万」との…そういう数えかたなんですよね。本当でしょうか。…あ、「700万」ということは、月単位のデータはなくて、年単位なんですね。失礼しました。…そうしないと季節変動([3142])とか面倒すぎるじゃないですかぁ! <それある〜!!

※「総務省 統計図書館」と自前のデータ以外については「データ提供」として、「東京大学社会科学研究所」「大阪大学社会経済研究所」「慶応義塾大学パネルデータ設計・解析センター」「東京都健康長寿医療センター」「リクルート」がクレジットされています。この「リクルート」が雑多ではないかと疑われるかもですが、仮には「旅行先(市町村単位)」とか「ペットのえさ代」みたいなのは、同社くらいしか(網羅的には)持っていないのではないかなぁ。本当でしょうか。そして、「リクルート」もまた30年なんですねぇ。それでも「しょせんリクルートでしょ」「『あの』リクルートでしょ」といって、何か的なものを決して忘れ去りはしませんぞ的なげふんのほうなど、いまだに完全には拭えないかなぁ。ここテストに出ます!(違)そういう偏見は抜きにして、いかにも『平成時代!』っぽいデータとして「リクルート」は申し分なく(公的統計の)隙間を埋めていると思われましょう。…民間って、こうですね!(棒読み)

・ウィキペディア「寝巻」
 https://ja.wikipedia.org/wiki/%E5%AF%9D%E5%B7%BB

 > 現代では当て字で寝間着とも記すが、こちらは「寝間(すなわち、寝室)で身に着ける衣服」という意味合いが強く、旧来の和装を指すイメージが強い「寝巻」に対して、洋装にも当てやすい字として用いられることが多い。新聞は「寝間着」を統一表記としているが、文部省(現在は文部科学省)は『公用文の書き表し方の基準 資料集』で「寝巻き」としている。なお、「寝巻」は旧来の表記である。

※「602 男子寝巻き」という表記だけを見ても、いかにも1985年っぽいですよね。統計上の項目(継続的に調べる品目)として「602 男子寝巻き」と表記されながら、1985年くらいより新しい時期の数字なんですよ、の意。さあさあ「老人会」で「1985年に「602 男子寝巻き」をじぶんで買ったことのあるひと!」のほうなど…ぎゃふん。そんなことは考えたこともないよ! …旅館じゃあるまいし。

・(参考)損害保険料率算定機構「602 男子寝巻き」付近のイメージです(2007年11月)
 http://www.giroj.or.jp/disclosure/q_kenkyu/No13_3.pdf

※なるほど、家財の損害保険といって、いかなる世帯がいかほどの総額の家財を持っているのかという、そちら側からの調査のニーズにございます。…なるほどねぇ。(棒読み)

 番組内では「5年のタイムラグ」との言及がありましたが、平均でいう「移動平均」のウィンドウみたいなのの相関係数バージョンみたいなの(!)のことですよね。(…うーん、呼びかたがわからん!)

・海洋研究開発機構、東京大学「日本近海の夏の大気圧分布に数十年規模で変化する関係を発見 〜コメの収穫量や台風数との相関を指摘〜」(2015年7月30日)
 http://www.jamstec.go.jp/j/about/press_release/20150730/

 > この相関関係について長期解析
 > 主成分解析:指定した地域で典型的に見られる変動の空間構造とその時間的な振る舞いを抽出する統計解析手法。

・同「図4」
 http://www.jamstec.go.jp/j/about/press_release/20150730/img/image004.jpg

 > 図4. PJパターン指標と南方振動指数(ENSOの指標)との21年移動相関(ある年を中心とする前後21年の相関係数を毎年計算したもの)。縦軸の数字が大きいほど両者の相関が強いことを示す。点線より大きな相関係数は統計的に有意であることを示しており、相関の強い時期が数十年周期で繰り返し訪れていることがわかる。

 これですよ! そのままな呼びかた(移動相関)でよかったんですね。ここでは「21年」のウィンドウをとって『21年移動相関』といっています。本件番組では『5年移動相関』だと理解しました。…これでいいんでしょうか?

 本件番組のCGに即していえば、「パターン」の画像を積み上げたときの、高さ方向で(30年のうち)5年分、画像が月単位なら60枚、年単位なら5枚、同時に見るということです。(5年分の「窓」を、下から上へスライドさせながら、その範囲ごとに相関を求めるということです。同じ「窓」の中では順序を無視するのではないかとも思われ、「5年のタイムラグ」というのは「変化が起きる順番までわかる(≒『因果』がわかる)」ということでは、決してないと思われます。)

 なお、5年もあれば、14歳のひとが19歳になって、中学生が『大きな学生!』(や社会人)になるんですよ。「****(中学生)」という指標(平均すれば14歳のひとを調べた指標)を取り上げる中では、5年のウィンドウは広すぎないだろうかという心配もあるかもですよ。

※「データの境界に生じるノイズ」については[3281]を参照。

[3281]
 > AIの学習を阻む(精度を下げる)要因には、▼正解データの質や量、▼恣意的な加点、▼過学習([3100],[3142])などあることが知られていますが、これらと違って、まだあまり気にされていないかなぁ、と思われるのが▼「(データなどの分割の)境界に生じるノイズ」だろうと思っています。

 > ひとくちにノイズといって、EMC的な意味で、▼クロストークと減衰(古典的な電磁気のソレ)はわかりやすいですが、▼時間方向のソレであるタイミングのソレ(制御のソレ)、さらに▼境界面の反射(材料のソレ)といって見ていくと、ノイズというものが立体的に見えてくる気がしてまいります。その延長線上に▼データの分割の境界に生じるソレ(情報のソレ)があるというわけです。

[3469]
 > > 小学校1年生と6年生のデータ

 > げふっ…小学5年生と中学2年生が混ざってるデータ、この前、見ましたよ([3442])。

[3442]
 > 大阪府にあっては、複数の設問にまたがっての多変量解析([3403],[3406])を経ての考察が熱望されます。読売新聞のレヴェル(=わたしたちがわかるのはこのくらいだろうと思われているレヴェル、の意)で『(施策や補助金の額などを左右する)議論!』をしてはなりませんぞ。


●「開発」とはにわ


 「AIを開発!」といって、「発明」との混同もあるのかなぁと推察してみます。あるいは、「…あっ、あんなの! 卒論レヴェルだし! …卒論そのものだし!」みたいな焦りのようなものも、学生のかたはお持ちかも知れません。いや、大学の外で、じぶんでAIを使いたければ、▼買ってくるか、▼人に頼むか、▼オープンソースなどを使って内製するか、選べ! …うーん、迷っちゃう!(違)

・「Jubatusの機械学習ラインナップと利用シーン」
 http://jubat.us/ja/overview/machine_learning.html

 > 時系列データのウィンドウ設定つき統計分析を行います。
 > 与えられたグラフ構造から中心点や最短経路を抽出します。

 うーん。ちょっと違うかなぁ。(棒読み)

・ウィキペディア「TensorFlow」
 https://ja.wikipedia.org/wiki/TensorFlow

 > 処理にGPUを使う事も可能。ディープラーニングに対応

 挙げられているのはアプリケーションであって、TensorFlowそのものの説明にはなっていないと感じました。

・TensorFlow
 https://www.tensorflow.org/

 > TensorFlow™ is an open source software library for numerical computation using data flow graphs. Nodes in the graph represent mathematical operations, while the graph edges represent the multidimensional data arrays (tensors) communicated between them.

 > TensorFlow was originally developed by researchers and engineers working on the Google Brain Team within Google's Machine Intelligence research organization for the purposes of conducting machine learning and deep neural networks research, but the system is general enough to be applicable in a wide variety of other domains as well.

 多次元のデータ配列を放りこみさえすれば「ディープラーニング」ができますよ、との触れ込みでございます。「5000×5000ピクセル(仮)の画像」を積み上げて、というのは直感的な理解のためのソレで、途中で実際に画像ファイルをつくることなどなく、5000種類の指標のある1期・ある地域の値を0〜1に正規化し、0から4999まで並べたバーコードみたいなビット列を用意して、それを時間方向には360月、空間(地域)方向には47都道府県あるのだと、こういうような多次元のデータ配列を、どかんと放りこむというようなことなんでしょうか。実装の詳細はわかりかねますが、いたってふつーのまじめなポン…いえ、実装をしたはずだとの期待にはございます。

 そして、TensorFlowは「™」なんです。…なんと、TensorFlowは「™」なんですよっ。…なんてこったい。そして、TensorFlowの提供者としては、いかなるユーザーに対しても特別な協力などしないはずで(使いたければ自力で使いなはれよ、の意)、本件番組にTensorFlowとの名称は…ゼッタイに出てこないのではないでしょうか。本当でしょうか。ま、「ディープラーニング!」といっているので、十中八九、これですよね。

・ツイッター(2016年10月12日PST)
 https://twitter.com/hidemotoNakada/status/786342313584840704

 > NHKで昨日のtensorflow UGが流れてたけど、「製品発表会」みたいな扱いになってた

・NHK「AIで主導権!? グーグルの戦略を聞く」(2016年11月11日)
 http://www3.nhk.or.jp/news/business_tokushu/2016_1111.html

 > グーグルは去年11月、画像検索や音声認識、自動翻訳などに使われる人工知能のツール「テンサーフロー」を無償で公開し、個人や企業が自由に使えるようにしました。

 > 経済部 ****記者

 そら、経済部ですよん。(あたりまえですけど。)そして、このツールに関する「ユーザー会」がユーザーの自主的な会ですって? とんでもない! Googleの製品(※無償ですけど、事実上の製品ですよ)がなければ成り立たない会であり、もっぱらGoogleがユーザーに情報を(先行的に)提供するのが主旨の会だといって、まったく疑いません。「TUG! TUG!」([3434])も参照。

[3434]
 > > 東芝ITユーザ会(略称:TUG/ティーユージー)
 > > 1965年に「TOSBAC研究会」として会員相互の情報交換、スキルアップ、親睦交流などを目的に発足。

[3461]
 > メーカーのほうが(※個々人の社員でなく、その集合として)圧倒的に多くの『情報知識!』を持っているという状況下で「会員相互!」の「情報交換!」なんてよくいえたものだとの…ゲフンゲフン。(メーカーやベンダーが予備校の講師など引き抜いて)テーマごとのセミナーをすればいいんですよ…などと、先に「答え」を見てからのうのうとですね(略)たいへん失礼いたしました。


●「NHK技研」ここにあり


 技術の採用時期の早い遅いという、これまた経済学みたいなアレでいうと、どういう状況になっていたでしょうか。

・(参考)
 http://www.publickey1.jp/blog/15/googletensorflow.html
 https://ja.wikipedia.org/wiki/%E3%83%87%E3%82%A3%E3%83%BC%E3%83%97%E3%83%A9%E3%83%BC%E3%83%8B%E3%83%B3%E3%82%B0

■略年表 ニューラルネットワークの研究とNHKの関わり

1979年福島邦彦(NHK技研)が「畳み込みニューラルネットワーク」を発表
1988年音素の認識に応用される
1989年文字の認識に応用される


・ご近影のイメージです付近(2015年5月22日)
 http://techon.nikkeibp.co.jp/article/INTERVIEW/20150521/419523/

 1985年ごろにかけての「PC」の発展と歩調を合わせて応用が進んできたとふり返られます。研究者がいつでも好きなだけ計算機を回せるということは大切なことなのですよ。うん。…実にうん。(力強くうなづいて見せるとGOOD!!)…あっ、まだ計算中なんで空調のほう、止めないでもらえますぅ? …そっちですよっ!! 守衛さんにあきれられながら『変な時間!』にたこやきやラクトアイスのほうなど買い出しだっ。(※あくまでイメージです。)

 近年の研究開発に直結する研究の源流は、2006年に見出されましょう。そして、1990年代以降のNHK技研というと「ハイビジョン1色!(MUSE!)」というイメージがございますけれども、本来は基礎研究もしっかりしてきているのですよ、と申し添えます。…そもそも、NHKに技研があるって、ご存じないですと? (大学と違って教育の体制を持たず、必ずしも論文の執筆をゴールとしないという違いはありつつも)いたってふつーの大学の研究室と同じような研究室の集まりである研究所が、NHKにもあるのですよ。

※「MUSEデコーダー」については[3490]を参照。「技研公開で4K8Kをスルーしてポスターセッションへまっすぐゴー!」については[3213]を参照。

2006年ジェフリー・ヒントンらが「ニューラルネットワーク」
を改良し「ディープネットワーク」と呼ぶ
2007年1月NHKが「NHKスペシャル」でGoogleを長期取材
2011年Googleがクローズドソースの「DistBelief」を開発、
自社サービスの開発に使用
2015年11月Googleが「TensorFlow」を公開
2016年11月Googleが日本で「説明会」
2017年7月NHKが「TensorFlow」を番組で使用?
(※あくまで推定です)


 きわめてポヤンとしたソレで恐縮ですが、TensorFlowというもの自体が、研究の最前線からは5〜7年遅れくらい(=一般の技術者に普及させようという狙いですから当然です&公開する前にGoogle自身がどっぷりと使いこんでいるんですよ@我々Googleの搾りかす…いえ、ベストなプラクティスを口を開けて待っているっ)、そこからさらに、仮に最前線でも訳書が出るのを待っているような感じのタイムラグで1年(⇒2016年)、そこから約半年でのNHKであると、こういうわけです。さらには、一般の技術者があたりまえのように使う先には、JAの選果場やものづくりの中小企業などが、TensorFlowが組み込まれた『システム装置!』の恩恵に浴していくという展望が描かれましょう。さらにその先には、簿記やマーケティングのカリキュラムの刷新とともに、個人の商店などでもAIっぽい売上予測を使いこなしていくという未来が開けているわけであります。そこを先取りして一種「演示実験」してくれているのが、NHKスペシャルなのですよ。(…たぶん。)

・丸与の見解です
 http://www.maru-yo.co.jp/blog/2013/08/post_152.php

 > ひょんなことから大阪府教育センターより私へ大阪府下の家庭科の小・中・高校の家庭科の教師対象の研修会で日本料理に欠かせない『鰹節』についての講師を務めて欲しいとの依頼がありました。

 > 各テーブルでは料理に使う八方だしと素麺つゆに使用する二番だしをとっていただきました。

 おおー!(略)だしの授業では「おかかおにぎり」もつくるのですぞ。…そっちですよっ。(棒読み)

・「初年次の基礎物理における演示実験の導入」
 https://most-keep.jp/keep25/toolkit/html/snapshot.php?id=23021261694861

 > 履修学生のほとんどは環境科学部の1年生である。このうち、20%程度の学生は高等学校で「物理学I・II」を履修しているが、残りの学生は高等学校で物理をほとんど学習していない。

 > 「手渡し返却の時間がもったいない」との指摘が学生からなされる場合もあるが、この「手渡し返却」により、私自身は学生の名前と顔を一致させるよう努力している。

 > 演示実験導入による学生の学習へのインパクト

 > 授業者として、「学生の集中度が上がる」「学生がモチベーションをもって授業に臨んでいる」ことを授業中に実感している。


●経済学と社会学を『がっちゃんこ』


 「がっちゃんこ」([3461])って、こうですね!

[3461]
 > これまで通りの研究は各自で進めていただいて、報告としてはがっちゃんこしておきますんで、よろしくのほど。(…メッソウでしたっ!! よくあることですよ。たぶん?)そして、私が見落としているだけだと思うのですが(※)、「融合」って、結局、本当になされたのでしょうか。

 経済指標を中心とした「5000を超える公共のデータ」での「ディープラーニング」からの「アドホックな連関表みたいなの(3Dでうごかせるよ☆たのしいよ)」で「全体」をポヤンと眺め、ここぞというところは、東大社研(東京大学社会科学研究所)の追跡調査のデータを主成分分析したみたいなの(「タイプ!」)で詳細に実像を描こうという両面からのアプローチでございました。

 じゃあ、スタジオには東大から社会学のセンセイが来ればいいじゃない…とんでもない! 調査の当事者であるので、中立とはいえません。東大社研のデータを(第三者として)レビューする資格は、京大の社会学のセンセイにしか(事実上)ないですよね、わかります。

 (院生を含めた)研究者の陣容が手薄な研究コミュニティですと、ほぼ全員が同じ調査に関わってしまったりして、誰もレビューできないということも起きるのかもですが、ここで東大と京大がいい感じに交わらずにおられるというのは、ピアレビューのためにはよいことだなぁと再認識されるかもですよ。

 そして「5000を超える公共のデータ」は、これだと決めたら、みんなが同じものを使うことが望まれます。

[3494]
 > 本来の「経済効果」というものは、無名の銀行員(信金や農協を含む)が就業時間内に試算して「提出」する類の、実にあたりまえでつまらない数字の1つであるという理解でございます。『経済効果!』といって何らかの華々しさが出るというのは、そもそもおかしいことなのだという理解が欠かせません。

[3347]
 > あなたが素朴に感じる重要度や優先順位(「よそより早く、うちの前のアレを何とかしてよ」)が、客観的にもそのような重要度や優先順位になるものであれば、それは指標だけで説明できるはずなんです。

[3382]
 > 藤沢市、鎌倉市、それに意見を表明する市民の間で、まずは適切に手法が理解されることが必要不可欠であるといいきります。勉強せずに好き勝手に意見を述べたり、じぶん(たち)に有利になるように指標を選択する(※「相手が不利になる指標」を意図的に組み入れる=一般には使われない雑多な指標まで入れる=ことを含む)など、論外でございます。

※「いきなりステーキみたいなのが入っていないじゃないか!(だから無意味だっ)」…とんでもない。そういうのはもともと、統計に入らないところで成り立つ隙間なんですよ。そのたくましさに敬意を払いつつも、しかし、経済の全体像を描くときには、いきなりステーキそのものを指標に入れるのは抽象度が足りないんですよ。仮に牛肉の『流通量』(=事故や期限切れで廃棄される分を含む!=飲食店がどのくらいの客数を見込んで仕入れたかが反映される)という指標があれば、そこにはちゃんと、いきなりステーキも入っているんですよ。

 そこに「わが社しか持っていない秘密のデータをひとつまみ!(あら不思議!)」みたいなこと(⇒「食味計」における「水分」[3512]みたいなの!)を差し挟んでは、いけないのです。もはやそういう時代が訪れようとしているのですよ。…いえ、我々「銀行員の『平均顔』みたいな銀行員らしい顔!」([3513])で、ふつーの産業連関表を使ってまじめにポンしてきたひとには、あたりまえのことであるはずですけれどもね。(=マグロミルみたいなのはまじめじゃないといいました! わわっ、マグロミルっ!![3513]…まあ、それが民間というものでも、あるんですけどね、の意。)

※一部の表現は演出です。民間の調査会社を否定するものではありません。

[3477]
 > わたしたち、きわめてナイーブに「ひとにめいわくをかけてはいけないよ」のレヴェルであらゆる刑罰を読み解こうとしますので、まず、罪というのはそれだけじゃないんです、「データに対する罪(=データが被害者である)」「動物に対する罪(=動物が被害者である)」というようなものを、きちんと考えることができなくてはいけないわけです。例えば『石室!』の調査中に壁画が破損したりカビたりしたといって、『業務上過失文化財き損!』で実刑などと…まあ、そこまでカリカリな法律は、まだ実現されていませんけれどもね。(恐縮ですが、怠慢や重過失が認められないと問えない上、問われても過料30万円だとかいうとの文化財保護法でございます。)

 > 「データを汚す」([3142])、「わりとヒマな館長の午後ティー(ここで効果音「バラ色!」入りまーす…いただきましたっ)」([3452])…じゃなくて、「わりとヒマな店長!(わりちょー)」([3455])も参照。


●「宿題」はわわ


 いやー、締切を過ぎてから…ギクッ。

[3409]
 > 「締切を守れない人は締切を設定することすらできない」([3092])って、こうですか! わかりませーん!

・「探索的因子分析(直交回転)」「探索的因子分析(斜交回転)」「確認的因子分析(斜交回転)」「高次因子分析」それに「多重指標モデル」のイメージです
 http://psy.isc.chubu.ac.jp/~oshiolab/teaching_folder/datakaiseki_folder/add_folder/daad_02.html

 > 確認的因子分析は,多重指標モデルの潜在変数間の因果関係を共変(相関)関係に置き換えたものといえる。

 5000からいくつかをとる組合せで、あらゆる潜在因子を、機械的に置いてみてから「うん。これはさすがにないな」みたいなことをするところにも「ディープラーニング」が使えたりするんでしょうか。

 > 遺伝ACEモデル(豊田, 1998, p.259-263参照)

・豊田センセイ「共分散構造分析による行動遺伝学モデルの新展開」(1997年)
 https://www.jstage.jst.go.jp/article/jjpsy1926/67/6/67_6_464/_pdf

 > 適合度は,因子寄与率よりも優先して確認すべき指標である.たとえば20変数程度のデータに因子分析を実施し,ある因子数で累積寄与率が0.5であつても, GFIが0.55くらいでは,その因子分析の結果はデータを説明するための候補から外さなくてはならない。

 > 因子分析を行う際にも,統計モデルのみにたよつて因子負荷をすべて推定させるのではなく,興味の対象となつている特性の意味から因子負荷の一部を0に固定したり,手引書に掲載された信頼性係数の値を利用して影響指標と独自性を制約する(豊田・前田・柳井, 1992, p. 198)等の工夫は有効である。もちろん,思い込みにすぎない不適切な固定母数を設けることは好ましくないが,それとて適合度指標やLM検定(指定した固定母数がデータとの適合を損ねていないかどうか調べる検定)によつて間違いを修正することが可能であるから,固定母数・制約母数はもつと積極的に使用するべきである。

 このへんが「宿題」になるでしょうか。


●ツイッター(ほか)かく語りき


(24日に追記)

・ツイッター
 https://twitter.com/FreeFromTheSoul/status/889290500884250624

 > プロ野球のデータ分析マニアには、ストレートに球速と配球の関連性に目を向ける人が少なくない(ストレートの調子で戦略が変わるのは素人でも想像できる)けど、そういう論拠のある分析とは違う感じ。

 そこまで直接的な分析だけで何でも予測できるならAIの出番はないんですけど、これでいえば、リーグの全チームの投手のソレを全試合通じて云々(勝敗で気分が変わるとか練習量が変わるとかいう相関(?)も含めて)みたいなことを(開幕前に全部!=試合を見ながらじゃダメですよ、だって、すぐに答えが出るじゃないですか)しているんですよ。…たぶん!

※「試合を見ながら予測を修正」のほうは「データ同化」だという早合点にございます。

・ツイッター経由わいやぁど行(佐原から普通)みたいなの(どやぁ)※「ワイヤード」ではありません。…なんと、「ワイヤード」ではありません!!(なぜに2回いうし!)
 https://wirelesswire.jp/2017/07/60636/

※まぎらわしいよこのどめいんまぎらわしいよ(じあまり)、の意。

 > NTTデータ経営研究所にてコンサルティング業務に従事後、イタリアに渡る。ローマの国連食糧農業機関(FAO)にて情報通信官として勤務後、英国にて情報通信コンサルティングに従事。現在ロンドン在住。

 じぶんが学校で習ったもの以外は知らないよ(調べもしないよ)という態度ではいけませんよ。あなたの専門とは異なる専門を持つ人が、想像以上に幅広くいるのですよ。

 > 国連食糧農業機関(FAO)
 > 国連食糧農業機関(FAO)

 いや〜、番組を見るとFAO的な意味ですとんとすとすとまいる、いただけたかもですよ。えー、どれどれ? …ロンドンでは見られないや!(※あくまでイメージです。)

 > NHKは莫大なデータをAIに入力したといっていますが、「どのデータを選ぶか」によって分析結果は変わってきますが、「何を入力するかを決める」のもAIではなく人間様です。
 > 「どこからデータを集めるか」「データの質が良いかどうか」を判断するのも人間様です。

 (NHKとしては)極力、データの取捨選択をせず、(NHKとしては)恣意性を排除しましたというのが「5000を超える公共のデータ」だと思いました。特に、過去30年分のデータについて、それぞれは今回のような分析に供されるとは予想もされずに(統計を取り始めたり項目を改訂した時点で)項目が決定され、これまで継続調査されてきたデータなのです。現状でできる限りは、かなりのベストなプラクティスではないかなぁ&「よりよく取捨選択」しようとすること自体が(データに対して)おせっかいなことなのではないかなぁ、という気もしてきそうですよ。

※わたし残念なたわし、VTRやスタジオでああだこうだというのは、完全に無視しています。計算機にしか興味ないんで、すんませんすんません…あいすんません。んだんだ。(違)

・NHK「一部抜粋」…抜粋じゃだめでしょ付近
 http://www.nhk.or.jp/special/askai/

 > AIが学習したデータ(一部抜粋・略称含む)

 字幕で出てくる「リクルート」はどこに消えたんですか&「文研」を使っていないとは思えないんですけど。…思えないんですけど!(※恐縮です。)

 > ハンバーガー店やラーメン店の数といった民間のデータ

 某「ぐるなび(仮名)」ですか&某「ぐるなび(仮名)」ですかっ!!(棒読み)

※「ぐるなび」はリクルートとは無関係です。

 > 注)AIが描き出すネットワークは複雑です。番組で紹介したネットワーク図は簡略化されています。

 (いっさい削減されない場合)5000次元の空間なんですから、あたりまえです(※そもそも「可視化」には意味がないと考えています[3483])。そして、▼(数学的な手続きで)次元を削減した結果、番組に出てきたくらいの密度のソレ(ネットワーク)になっているのか、▼(そうではない、または)それをさらに人手で「抜粋」しちゃっているということを申し訳なさそうに「簡略化」と(ホームページで)記しているのかわからないですから、ここはぜひ、冗長になってよいですから厳密な用語で書いておいてほしいかなぁ。(棒読み)

[3483]
 > 現に可視化できる範囲や方法だけで可視化しても(ほとんど)意味がないと思わされる例(2005年8月)
 > 20ページはともかく(※)、24ページもご覧いただいて、みなさま思うところがたくさんありましょう。卒研や修論にぶつけていただければと思います。

[3511]
 > 確かに最初は「たこひご!」([3337])から始まって、しかし、いつまでも「わあぃヒンメリ!」([3091])…滑稽だわ!([3364],[3398])そういうひとは多変量解析に挑んでも3次元までしかイメージできないのよ!

[3326]
 > > 輪ゴムを交差しないようにして少しだけねじるとある方向から見て8の字にみえるようにできます。蟻はこの輪ゴムのコースをもちろん交差点を経験することなくぐるっと回れますが、2次元の世界しか知らない生物にはそれを想像できない、あるいは想像しにくい。私たち4次元空間の見方になれていない生物に4次元時空での曲面のすり抜けが想像しにくいのは同じような理由からでしょう。

 (空間全体や、じぶんの周囲の構造を)想像(≒可視化)できようができまいが、何次元だろうが、足元の道(エッジ)は確かだじぇ☆…その発想はなかった!(効果音「きらーん」入りまーす…いただきましたっ。)

[3461]
 > 1973年に物理学の修士をとられたかたとのことでございますが、計算工学というか数学という意味での多次元空間の応用よりも、3次元の空間(⇒「いろいろな物理学!」のうち、力学でいう空間など?)というそちらに関心が高いのでしょうか、可視化とクラスタリング(分類や索引)を混同なさったような記述がみられます。
 > (新聞の読者が)(高校までの科目としての)「数学や物理」しか知らない(ことを前提にしている)かのような書きかたも、(読者が「新しい現実」[3352]を知る機会を奪うという意味で)…なんだかなぁ。

※ネットワーク(グラフ構造)というものの本質に迫らず、高校までの数学や物理の発想で可視化しようというのはヤメテクダサイ。(棒読み)人が見てもまるで全体像がつかめないのではあるのですけど「隣接行列」が最もすべてをそのまま表しているのであって、しかたなくエッジ(リンク)を1本1本たどってみようと、(人としては)そういう謙虚さがないと、グラフ構造で扱う意味が失われるのですよ。中途半端に途中の計算だけグラフ構造(=隣接行列)の上で行なって、もっともらしい単一の指標を得たらサヨナラ…構造なんて、構造なんて、忘れちゃうんですか黒たまご置き去りですか週末って幻だったんですね、わかります。(棒読み)…なんだかなぁ。

・Wikipedia「Adjacency matrix」のイメージです
 https://en.wikipedia.org/wiki/Adjacency_matrix
 https://upload.wikimedia.org/wikipedia/commons/2/22/Symmetric_group_4%3B_Cayley_graph_4%2C9_%28adjacency_matrix%29.svg

・自称「国内最大級のグルメ情報総合サイト」付近(推定)
 http://www.recruit.jp/service/gourmet/hp-gourmet.html

※いやいやいや、「素」で「ぐるなびみたいなやつのリクルートのやつ、なんていったっけかなぁ!!」みたいなのが発動しちゃいましたよ。あいすみません。

 そして、「5年移動相関」(※あくまで推定です&違うかもです)というのは、現実的にこうするしかない的な方法に思えてきそうなんですけど、▼こうすることによって、5年を超えてのよくわからない連鎖は無視している(「バタフライ」を強制的に断ち切っている)、▼こうすることによって、2〜3年のタイムラグでの連鎖を見落とさないようにしている、という両面の効き目があって、しかし、ではウィンドウは「5年」でいいのか、というのが、指標にも地域にも年代にもよるのではないか(一律には決められないのではないか)という不安が残りそうでございます。

・わあぃ疑似相関
 http://b.hatena.ne.jp/entry/s/ja.wikipedia.org/wiki/%E6%93%AC%E4%BC%BC%E7%9B%B8%E9%96%A2

 > わぁい擬似相関、あかり擬似相関大好き

 手続き上、定義を正確に暗記していなくても計算はできてしまったりするので、…実はわたしも曖昧だったとわかりました。わあぃ疑似相関。わぁい…。

[3171]
 > > 海外の和食レストランは15年7月時点で8万9千店。13年には和食は国連教育科学文化機関(ユネスコ)の世界無形文化遺産に登録された。こうした和食人気の高まりも背景に日本酒の輸出は21.8%増え、しょうゆも2ケタ増だった。

 「背景に」というのは、便利なマジックワードですねぇ。…ギクッ。

 > 「海外の和食レストラン」は、無関係とはいわずとも、どうやっても疑似相関でしかないのではないかと疑います。仮には、和食レストランが『減った』国や地域で、和食の食材の額も減っていれば…などと素朴には考えられます。

 「無関係⇒偶然」、「どうやっても疑似相関⇒潜在変数を介しての相関しかなさそう」といわないとですね。いま認識を新たにいたしました。(恐縮です。)

 その上で、再びNHKでございます。

 > 番組で紹介する"社会構造のネットワーク"は、膨大なデータの中から特徴を見つけ出すことができる「パターン認識」や「機械学習」という手法を用い、さらに、WikipediaやNHKのニュース原稿など、100万本を超える記事を「ディープラーニング」によって学習させることで、社会に関する5000もの情報の「近さ」や「つながり」を描き出した図です。数値的な振る舞いがただ「似ている」だけなく、現実世界で私たちが共に語る"近しい関係"といった概念もネットワークには色濃く反映されています。そのため、明らかに相関のないものがつながることもあります。

■データセット1(「5000を超える公共のデータ」)

データ項目の数(種類)5,000
地域(都道府県)47
期間(年単位)30
データ件数7,050,000


■データセット2(「タイプ分け」)

東大社研ほか調査データ
番組テーマに即した属性の者を抽出しクラスター分析


■データセット3(番組ホームページで説明あり)

WikipediaやNHKのニュース原稿など
1,000,000


 うーん。30年分×5000種類×47都道府県=700万件のデータの「数値的な振る舞い」を「ディープラーニング」で「パターン認識」することで見い出したのでしょ。違うんですか? それとはまったく独立に「WikipediaやNHKのニュース原稿など、100万本を超える記事」の、『何』を、『何』に学習させたんですか? …うーん。

・Wikipediaの見出し語のリンク構造をそのまま使おうという安直すぎる卒研はいくらでも見かけますけど、あれは計算機をごりごりするための例題であって(卒研のコアは計算方法のほうにあって、データは大きければ何でもいい)、データの使いかたとしてはほとんど意味がないと思うんだなこれがっ!
・ニュース原稿の『何』を「機械学習」にかけて、最終的に『ナニ』するんですか&黒たまごのほうなど思い浮かべながらアナウンサーのお仕事してもらっちゃっていいですか(違)

 「共に語る」といっているので、まあ、アレですね、わかります。ある記事の中で「幕張メッセ イベント」とか「喜多方 ラーメン」とか「会津 ラーメン」とか「博多 ラーメン」とか「ジャカルタ 秋葉原」とか(!?)いう、そういうのは「近しい」とみなすんですね、わかります。そして「赤福」([3480])は「赤」と「福」に分かれ、「利き○○師」みたいなのも分解されて意味を成さず、「ゆるキャラ」の固有名詞などはぜんぶ「未知語」なんですよ(もしくは1〜2回しかニュースになっていないものは、なかったことにするのですよ)。これだね。(違)

 「700万件」のほうの潜在変数やクラスターにラベル付けをしたくて、ラベルの候補語を持ってくる(⇒テキストのほうも「機械学習」で単語のクラスターをつくって、似ているのがあれば持ってきて使う?)ようなのを別建てでおつくりになろうとされたのではないかとは邪推しますけど、そこまでなんでもかんでも読む側の邪推に頼るのはアレですよ。

 「タイプ分け」のほうは、(考察を述べやすいとされる[3469])『上から3つ!』までしか見ていないと見受けました。それより下に、密林さんと呼ばれるEC最大手に関する「2.0!」みたいな話で引き合いに出される「長い長〜いしっぽ!」が、きっとあるんですよ。(たいていのデータでは、ありますよね、の意。)そういう意味では、(『区間を区切った』結果)「しっぽ!」が見えないデータになってしまっているということは、属性を絞りすぎなのであって、年齢、性別(…あのひとが困ってるじゃないですかぁ)、世帯構成とも先にばしつと切り取ってしまわないで分析すれば「境界的」なサンプルを分析に含めることができて、もう少し事情のディテールが見えてくるのではないかなぁ。…ないかなぁ!!(棒読み)

・(再掲)ツイッター ワレワレハー…赤福をよーきゅーするッ!
 https://twitter.com/meechan50/status/825515566177718272
 https://twitter.com/meechan50/status/858876019024961536

 「伊勢名物」ではあるけれども、これまで特にニュースにならなかったのでMeCabの辞書には入っていなかったんですよ! 急にニュースになっちゃうと困るんですよっ!!(棒読み)

 ほかに、「AI=イコール=機械学習=イコール=協調フィルタリング(利用履歴データに基づくレコメンド)=イコール=いわゆるビッグデータでしょ★ちゃんと知ってるよ」との、あなたいったい何段論法(※)なんですかっ…いえ、確かにそういう一連の分野というのはあるんですけれども、機械学習もAIもそれだけじゃないでしょ(つなげるときの関係性は「イコール」しかないわけじゃないでしょ※)、という、そこが知られていないやのような空気も漂います。メディアもベンダーもセンセイも説明不足なんですよね、それはわかります。

・かみつたセンセイほか「パターン認識と機械学習 - ベイズ理論による統計的予測」
 http://ibisforest.org/index.php?PRML

 「AIか?」「AIでないか?」というのは、アプリケーション(≒目的)としての考えかた(≒有用性)なのですよ([要出典!])。

・(※)「…ダケジャナイ!」付近
 https://ja.wikipedia.org/wiki/WordNet

 本件番組では、いわゆるビッグデータと呼ばれうるデータ(何らかの利用履歴データ=匿名化されつつも個人を追跡できるデータ、ただし東大社研の追跡調査は除く)は使われていないと読めますので、「『AI○○○くん』は何ではないか」といって、確実に「いわゆるビッグデータ(の応用)ではない」といえることがわかります(=わかりますけど明示的には説明されていないんですよ@不親切だなぁ、の意)。本件番組内で説明される限り「47都道府県」より細かいセグメントは考慮されていません。同意を得て(記名や対面で)個人を長期追跡したデータである「東大社研」のほうは、AIが云々とは独立して扱われていると理解しました。

 しかし、都道府県をまたがっての相関は扱っているのかいないのか言及がなかったですよねぇ。「700万件」といいきっているので、「関東」「近畿」などブロック単位での分析もしていないと推定できます。今回のデータセットでは、最終的には「都道府県」のタイプ分けをしてみせるのがせいぜいではないのかなぁ。(棒読み)

※それすらも「東京・北海道タイプ!(この2者だけ!)」「埼玉・兵庫・岡山タイプ!(通勤快速&家庭でお好み焼きっ!)」「長野・千葉・宮城タイプ!(城下町でコシヒカリと果樹!)」…みたいなことになっちゃいそうですよねぇ。…ギクッ。そうならないように、最初から「各データが複数のカテゴリに属する多重分類問題」([3403])というものをだなぁ(略)。そうすれば、ことさらにクラスターのラベルがわからなくて困るということも、起きないのではないかなぁ&本当でしょうか。

・熊谷市の見解です
 http://www.city.kumagaya.lg.jp/kurasu/sumai/sinkansenhojo.html

 > 熊谷市に転入して新幹線通勤をする40歳未満の方に、月額最大2万円の新幹線定期の補助があります!
 > 熊谷市に転入して新幹線通勤をする40歳未満の方に、月額最大2万円の新幹線定期の補助があります!

 上越新幹線の「こだま」みたいなの(!)って、なんていうんでしたっけ…みたいなの(!!)、「こだま」でいえば小田原から乗ってよ的なソレですよね。手続きは自治体と市民の間で完結しており、JR側に新たな事務は発生しません。しかし、そのためJRでは、補助の効果を直接には把握できないとみられます。

・熊谷駅「上越新幹線の「こだま」みたいなの(!)」付近
 http://www.jreast-timetable.jp/1708/timetable/tt0625/0625030.html

 じゃあ(※…『じゃあ』!)、「熊谷と本庄早稲田」とか「高崎と本庄早稲田」とかいうのはどーなんだい([3439])。

・長野県の見解です
 http://www.pref.nagano.lg.jp/nogi/sangyo/nogyo/okome/index.html

 > 生産者の技術が高く、玄米検査時の品質を示す1等米の割合は、長年全国1位を保っています。

 > さらに、10アール当たりの収量も600kg台でこれも全国トップレベルです。

 > 全国と比較しても病害虫の発生が少ない傾向にあり、農薬使用回数は全国でトップレベルの少なさです。

 水産物のインパクトが大きいのだといえば、「長野」と「千葉・宮城」は別のタイプ(クラスター)に分類されるのだろうと、たぶんこういうわけです。(多重分類でない)クラスター分析では、こういう、どっちつかずの『惑星!』みたいなデータがよくあるわけです。それを見なかったことにして「タイプ分け」しちゃって、いいんですかねぇ。…いいんですかねぇ!!(棒読み)

・NTTタウンページ「<図4>都道府県庁所在地および政令指定都市1世帯(総世帯)の「ソース」年間支出金額(2012年)」のイメージです
 http://tpdb.jp/townpage/order?nid=TP01&gid=&scrid=TPDB_GY01
 http://tpdb.jp/townpage/tpdb/ranking/images/img_ranking30_04.gif

 埼玉で「さいたま市」だけを採ってしまうと見えなくなると思うんですけど(=東京の「下町」で遊びがてら、もんじゃ焼きを食べに行くよアリガトウ)、兵庫と岡山は県庁所在地に人口が集中していて、たぶん(≒だいたい)、この通りなんですよ。わあぃごらんの****だよ! テレビでお好み焼きが出てきて食べたくなるけど店はないっ!! …なるほどなるほど。それで?(もしゃもしゃ)…あざっす。三菱商事食品グループからの「オタフクソース」については[3492]を参照。

・いわゆる「がてら」系(違)
 https://kotobank.jp/word/%E3%81%8C%E3%81%A6%E3%82%89-464743

・佐々木商店の見解です
 https://www.otafuku.co.jp/recipe/cook/monjya/monj01.html

(29日に一部加筆。)


●さらにかく語りき(談)


(29日に追記。)

 みなさま、反応を示すまでに時間がかかっていらっしゃる感じが漂います。

・ツイッター 南武線はてっくてくじゃんよみたいなの(2017年7月22・28日PST)
 https://twitter.com/nitrotake/status/888878709104562177
 https://twitter.com/nitrotake/status/891090766432321536

 > AIが進化したら幾つかの論文を統合化してメタアナリシスの論文がぱーっと書けちゃう時代が来るのかしら?

 > 統計でいうとα過誤(第一種の過誤)みたいな話じゃんね

 さすが「薬理」! 教科書が漢字で書かれていて図表が少なそうな感じのほうなど想像します。ものすごーくかんたんにいえば(かみつたセンセイ)「TP」「FP」「TN」「FN」([3283])ですよね。その全体を図でイメージ(…『図でイメージ!』…まいっか)することなく「α過誤」だけを(ことさらに『α過誤』という専門用語を強調して)注意させる指導のしかたというのは、あなた、「薬理」という実務でミスをさせないための(センセイの)おせっかいなのであって、これで統計学を修めたかのようなこと(「じぶん、統計学にはちょっと詳しいんでいわせてもらいますけど」みたいなの)をのうのうと述べてはいけないのですよ。(※見解です。)

・…ダイヤモンド社なんですけど!(2017年7月29日)
 http://diamond.jp/articles/-/136897

 まったく同じ意味で、▼専門職大学院しか修めておられないかたに議論の資格はなく(=実務で「上級○○!」とみなされて責任が重くなるという、それより重い責任を担うには資格が不足している⇒博士号をとらねばならない、の意)、もうひとりのかた▼医療政策学の博士(=ドメインを限定した「狭い経済学」みたいなの!)として議論することが許された範囲を超えているという自覚が必要です。仮には統計数理研究所でデータ同化の研究をしているセンセイに聞きに行かないとイケマセン。その聞きに行く(もしくはしかるべき文献を調べる)という土台(基礎)はお持ちなのに、聞きに行かずにじぶんの知っていることだけで述べる(※参考文献が的外れ! 専門だけ詳しくて、それ以外はいきなり新書や白書を挙げちゃうひとみたいなレヴェル!)のは、とってもいけないことなのですよ。(※個人の見解です。)

※病院と医療費の話なので黙ってはおられんと、…お気持ちは察しますが、それより前に(冷徹に)資格を問わねばなりません。

※じゃあ(※)、NHKに博士はいるのかといって、あたりまえのようにいますよね。うん。

※統数研の「みなし公式見解」みたいな本も、『御社』から出されている([3330],[3469])んですけどみたいなぁ? …なんだかなぁ。

・統計数理研究所(統数研)「統計数理研究所の研究紹介図書」
 http://www.ism.ac.jp/library/aboutism/

 > 外部サイエンスライターの取材・執筆による統計数理研究所及び研究プロジェクトの紹介図書です。

 > ダイヤモンド社
 > ダイヤモンド社

 > 研究テーマは確率論や最適化理論、地震の発生、株価の変動など多岐にわたりますが、共通して、データに基づいて有効な知識を発見していくアプローチを大事にしています。
 > この本を通して、統計数理の研究の大切さに触れていただければ幸いに思います。

 (単に出版しただけでは)触れていただけてないんですよ! …その発想はなかった!(棒読み)

・はてな界隈かく語りき…いえ、はてなでも少数派っぽいです? えー、わかんないや。(※表現は演出です。実際とは異なる場合がありますのでご注意ください。)
 http://b.hatena.ne.jp/entry/342600945/comment/NATROM

 > 『「原因と結果の両方に影響を与える第3の変数」を統計学的に見つけ出すこと』ことは、教えればAIはできそう、というか人間より得意そうな気がする。

 (あらかじめ「学習」させておくけれども、アプリケーションとしては、その場でいざ)1パスでそれっぽくやって(精度が)「どやっ」というリアルタイムの系(ただし自動運転も含む)と、2パス…どころか、一種「持ち時間」がある限り8000回くらい回すのを何通りでもやっていいからといって(大巾に中略)ほとんどまったく別の分野だという、そこからですよね。わかりますわかります。…本当でしょうか。

※このあたりは、わたし残念なたわし、よく理解できていないっぽいですよ。『今後の課題』だなぁ。(棒読み)

 > aya_momo 番組内でも「相関と因果関係は違う」って言ってたけど。
 > mumero あの番組そのへん気を使ってむしろ分かりやすく端的に解釈の仕方を提供していたぐらいの印象だった。**も追ってたけどむしろ**してる側が**見てないし疑似相関の**知ってる程度で**も****だった。
 > HILOKI-T 番組中で何度も「相関であって因果ではない」って言ってたし、それに対して****が「なんだかうすっぺらい分析だわねぇ」と突っ込んでいたので安心感あったよ。
 > rohiki1 番組内でのAIは、ローポリゴンの脳CGで、ファミコンチックなフォントを使い…という***からはかけ離れた道化師ロボのイメージなんだけど…うまく演出しきれなかったようだ。

 貴方はスタア! ちゃんとスタアを獲得なさる、さすがはてなですね。

※白水社「道化と笏杖」(2016年1月18日)については[3209],[3479]を参照。

・ツイッター わかる……わかるぞお!!(ゴゴゴゴゴ。)付近
 https://twitter.com/yutaka_maruoka/status/888909742403223556
 https://twitter.com/yutaka_maruoka/status/891169581665931264

 > わかる…(確信)

 > # いいぞー、もっとやれー

 そこに半角空白、入れちゃいますか&入れちゃいますかっ。

・…東洋経済オンラインさん、安定の東洋経済オンラインなんですけど!!(2017年7月28日)
 http://toyokeizai.net/articles/-/182300

 > 筆者は国立情報学研究所(略)「東ロボくん」の取材をしたことがあるが、このプロジェクトの座長を務めていた国立情報学研究所の新井紀子博士が懸念していたのも、こうした状況だった。

 > 彼女は(略)予想していた。

 > 筆者が新井博士に話を聞いたのは、昨年末、(略)だろう。

 コレハヒドイ。「NII」とのロゴマークが淡い色調で鮮やかに刷られたお名刺のほうなどげふんされただけで、あなた、じぶんまで研究者になったかのように思っていらっしゃるでしょ。…とんでもない!(「南部氏を借りて自分も『叡ち』!」[3082]を参照。)

 その都度、NIIの新井センセイに聞きに行かずには何1つお伝えすることができない(許されていない)お立場におられるのですよ。そして、取材と報道は原則として1回限りなのですよ。ある取材で得られた発言を、まったく別の文脈で勝手に再利用してはいけないんですよ。(※しかも有料メールマガジンとして直接的に対価を得るなどもってのほか! ま、金を払えば「あのひと」に会わせてやるよ的な商売が民間にはあってもいいんですけど、そこに国立大学や国立の研究所のセンセイを巻き込まないでよね、の意。)わあぃコピーは1世代までっ! ダメよー? それ、ダメよー?([3117])…ぎゃふん。(※アクセントは関西風でオネガイシマス。)

※だからといって、本件に関してNIIの新井センセイが取材に応じることはありえませんよね(だって、『他社の案件』ですもの!)、わかりますわかります。(棒読み)同じ調子で誰もが「お答えしかねる」といって、…それを「山スカ!」などと勝手に受け止めよってからに(略)コレハヒドイ。

 > 記事が出た時点は放送前でネブラの詳細はわからないが、前述のようにニューラルネットワーク以前の単なる情報分析ツールでしかないことは明白だ。

 うそーん! ヤダー…あたしったら(※枕やヤカン、それにコードをキレイに束ねた状態のたこ焼き器のほうなどあざとく持ち出して見せるとGOOD!!)こんなもの(以下略)じゃないかっ。(棒読み)

 > 人間の知能に迫るかのような演出

 えーっ。TensorFlowが「™」なので、…なんとTensorFlowが「™」なので、わあぃ我々「お察しください!」のほうなど…ゲフンゲフン。(※あくまで推定です。)「みなさんご存知の「あの!」オープンソース!」という、たぶんそっちのための(囲碁と将棋の)映像ですよ。うん。

※ここで映った(最新の)将棋のソレがTensorFlowだったかはわからないんですけど(=オープンソースとしてのライセンスを満たして開発することと、そうして開発したプロダクトを使ってみせている場面を番組にしたり広告にしたりすることは別格との理解でございます)、じぶんではわからないけど実装しました(≒実装自体は簡単でした)みたいなことをのうのうとおしゃべりになられてましたよね。

※「NHKスペシャル」というのは、▼日ごろのニュースを(NHKでなくてもいいので=新聞でもいいので)ほぼぜんぶ(分野の偏りなく)見聞きしている、▼前回までのNHKスペシャルのうち、(囲碁や将棋など)関連する内容のものは見ているであろう(=この内容に興味があれば、前回も興味があったはずで、それなりに高い確率で前回の番組も見ているはずだ)ということを想定して制作されている番組ですよね。そういう前提に立たないと、ふだんのニュースより掘り下げる内容は“お伝え”できませんよね。んだんだ。(棒読み)放送時間が通常より長い(むしろだらだら長いので話の流れがわからなくなったひともいるのでは? …ギクッ)というところには「一定の配慮」みたいなのがにじんでいるとぼかぁ思うんだなこれがっ。(※表現は演出です。)AIとは何か、データセットは何かというのも、冒頭でしか説明されず、これをスタジオの美術で工夫することはできないのか(=長い放送時間中、どのタイミングで見始めてもデータセットがイメージできるように)、こう、「総務省 統計図書館」のイメージ映像そのものの(スタジオの)セットにするとか、使った統計のうち冊子体のものを実際に積み上げてみせて、出演者があざとく「わーいっぱい!」「これぜんぶみたんですか!?」「コンピューターのちからをかりたくもなりますよね(んだんだ)」みたいな台本とか…いえ、そこからは台本ですけど、そういう美術を前提としてですよ(略)あなたがたチームとしてまとまりを欠いているのではございませんこと? あらあら、まあまあ!(棒読み)…なんだかなぁ。

[3327]
 > > 「(略)理科や地理の教科書から例文を集めて正しく理解しているか調べる内容だ。(略)教科書がきちんと読めない子供が半分くらいいるとわかってきた。主語がわからない、指示代名詞が何を指しているのかがわからない。現場の先生は気がついており(略)」

 > NHKのニュースは複雑なことも正確に伝えてくれます。しかし、文章がかなり長くなってきていますから、ほとんどの聴取者(ただしラジオを含む)には、既に理解が及ばないソレ(まるでBGMのようなソレ=きょうもアナウンサーのお声が聴けたぞなありがたや。)になってしまっているとも危惧してみます。そして、若いひと(55歳くらいまで)の場合は、わけのわからないことをいうNHKはきらいっ! …といって「たん絡!」なさるんですよぉ。わかりますわかります。わからないということは、それ自体がストレスなんです@たぶん。誰が好き好んで、わからないニュースをわざわざ聴こうとするものですか(略)

 > 「NHK」を「数学のせんせい」に、「ニュース」を「数学の授業」に読み替えて…数学の教科書を庭で焼きたいくらい、わかりますわかります!

 たわし残念なわたし、数学の教科書を庭で焼きたいくらい「数学の授業」がわからなくて「数学のせんせい」がきらいっ! …それでも数学への興味も具体的なニーズもちゃんと(他人事でなく私自身に=切実に!)あるので、細く長〜く勉強いたしております。…先は長いなぁ。(※たわしは残念賞です。景品の色やサイズは選べませんので、あらかじめご了承ください。)

[3213]
 > マンジャーレ!「明るいところで」「のうのうと」「アンジェラ689番」

 > > ちなみにこのアンジェラは、689番
 > > 「2012年12月5日に、これこれをアンジェラ689番に言ったのに!」

・ツイッター 神谷講師の見解です(2017年7月28日)
 https://twitter.com/kmyken1/status/891111760748396544
 http://www.oit.ac.jp/ip/~kamiya/

 > この一言に尽きる。引用:「タイトルにモラルハザードが蔓延している」

 読売新聞の見出しについては[3520]を参照。

・佐原から普通! すらど(どやぁ)
 https://srad.jp/story/17/07/27/061226/

 > きちんとデータが明示されていて(略)

 …と書かれてなお、読まれない感じですね。これはすらどのUIがわるい!(どやぁ)

 > AIに学習させる情報を偏らせないことが難しい、とも言ってた。
 > NHKのバイアスがかかった情報だけ学習した可能性もあるかも。

 「《一般に》難しい」というレクチャーを受けたんですね、わかります。「《今回の》NHKの《やつ》」が「バイアスがかかった情報だけ学習」したのだろうかということが、ぜんぜんわからないとの訴えですね、わかります。その疑問を解決するために、わたしたち、何をすればいいのでしょうか。NHKが使ったといってホームページで示している統計の一覧を精査する以外には方法がないことがわかります。

 > (略)が合致するように学習させていったものなのでしょう。

 「ディープラーニング」を何にどう使ったかというのは番組内で完全に説明されていました。ただし、ものすごい勢いで流れるように説明されていたので、これ、リアルタイム視聴ですと「…は?」で終わってしまうとも思われました。

 > 冒頭に、これだけ大量のデータを使って人間が相関を調べるのは不可能と言っていた。
 > あれ見てて思ったのはAIじゃなくてビックデータだろうと。

 そこでコメントのラリーを終了しちゃいますか試合終了ですか黒たまご週末ですか&おしいっ。(違)…ビッグデータじゃないでしょ。んだんだ。

・ツイッター 当方研究者じゃなくても当世研究事情には明るくありたい付近(2017年7月28日PST)
 https://twitter.com/nHMsf34/status/890874153582026752

 > 比較的最近、技研がどう関わったのか/関わらなかったのかが気になる例がたまにあるな

 技研のひとが開発したのを本社(?)のひとがNLPな研究会で発表してたりしますよ。…それはそれで(実際の研究開発の従事者にはあまり権限がない?⇒『変なカタチ!』で業績になったりならなかったりする)なんだかなぁ。(※個人の見解です。)

・…「ディープラーニング」を無視しちゃってません?(2017年7月28日)
 http://globis.jp/article/5589

 > 今回、同番組が取り組んだような、大量のデータを集めて相互の関係性をコンピュータで計測するという試みは、既に広く行われています。初期の頃によく紹介された事例は、あるスーパーの売上を分析したところ「ビールが売れるとき、紙おむつも売れることがわかった」というものです。

 「先祖返り」しすぎ感がございます。

 > この話のポイントは、「人間がちょっと思いつかないような関係を、コンピュータなら発見できる」という点です。

 > 番組で行われた分析も、スケールは違ってもおよそこのような分析の延長上にあるものと言えそうです。

 では、具体的にどうやって実現しているのか、そこにある「新たな知見!(必ずしもオリジナルじゃないけどベストっぽいプラクティス! ひいてはじぶんにもできそう!)」をこそ読者は理解したいと思っているのですよ。…たぶん! ま、法学部ご出身のかたにとってはかなり畑違いですよね。そこは計算機の専門家を呼んできて対談なさるとか、そういう記事を読みたいかもですよ、ええ。そして、NHKの番組内で字幕もなしに「プリミティヴ(…ヴっ!)」は「あうち!」だから、平易な言葉で言い直せという意味での(進行上の)聞き返し(デスヨネ〜)が…無視されちゃってません? えーっ…。(※感想です。)

・小笠原製粉のイメージです
 http://ogasawara-seifun.jp/files/5412/9835/0988/dekirumade.gif

・木下製粉のイメージです
 http://www.flour.co.jp/news-backnumber/v151_175/img/f165_2.jpg

・コトバンクさん扱い小学館のイメージです
 https://kotobank.jp/image/dictionary/nipponica/media/81306024002703.jpg
 https://kotobank.jp/word/%E8%A3%BD%E7%B2%89-546310

・…ウィキペディアだし!「バンドワゴンの誤謬」
 https://ja.wikipedia.org/wiki/%E3%83%90%E3%83%B3%E3%83%89%E3%83%AF%E3%82%B4%E3%83%B3%E5%8A%B9%E6%9E%9C

 > ねえお父さん、スマートフォンを買ってよ、友達はみんな持ってるんだよ。

 > Brand X 掃除機はアメリカで最も売れています。あなたも Brand X 掃除機を買いましょう。

 やーい扇風機! ワレワレハー…(略)

 > 多くの評論家がエンロンは素晴らしい経営をされた優良企業だとしている。だから、その普通株は有望な投資対象である。

 やーいエンロン! …ぐふっ。

[3174]
 > もしかすると読解できなかった、それによって(それだけをもって)「(怒る理由を考える前に即時発火で)コ***ウ!」と、感情が短絡したとも

 やーいエモいって、こうですかっ(わるい意味で!)。

[3461]
 > いまは考えられないことの筆頭として、『飲酒運転しながら****GOをプレー!』…じゃなくて! 「飲酒してからBBS!」とかいう(『現代の水準!』では)とんでもない慣行がまかり通っていたのですぞ。オンラインでのトラブルの原因が飲酒にあるかどうかというのも、できることなら定量的に調べてみたいかもです。

[3297]
 > 本件武将(!)に限って「医師の見地」を導入して考察するのでなく、症状と歴史的イベントに強い関係が疑われる事案すべてに対して、もれなく「医師の見地」を導入していかなければなりません。それが「学問的エレガンス」([2992])ですよねぇ。

・コズミックフロント「謎のネブラ・スカイディスク」付近(2013年7月18日放送)
 http://www4.nhk.or.jp/program/cosmic/archives/110403_150327.pdf

 > 「世界最古の天文盤!? 謎のネブラ・スカイディスク」

・…なぜに鳥栖だし!!
 http://d.hatena.ne.jp/okikazu/20130727/p1

 > 鳥栖市の公園にレプリカ
 > 一度盗難に遭って、またドイツから送って貰ったという記事がヒットした。
 > えええ、なんで鳥栖市?!それもいつもの通勤の帰り道。これは寄らねばならんでしょう。

 ぬおー(略)。

 > 溶鉱炉があるのなら、そこは風が吹き抜けるところでないといけない。
 > この日35度の猛暑日だったが、ここにたつと寒いくらいに風がびゅーびゅー吹き抜ける。なんだか不思議。他の所はじりじり暑いのに。

 わあぃ温熱はネコに聞こう([3162])&「卓越風」([3403])も参照。(古代も)ぜんぶがぜんぶヒトの感覚なのではなくて、動物や植物をよく観察したのではないのかなぁ。

[3513]
 > > ネコが試みと仕損じを繰り返して、外見上、偶然に箱の外に出てくる経過が報告されている。これを試行錯誤学習trial and error learningという。

 > 社会調査というのは(略)ニッポニカの解説に即せば「経験の再構成」「構造転換」すなわち「経験」なんです。いくら「そりゅーしょんぬ(笑)」といっても、経験のないことにあたるにはネコのほうの「しこうさく碁!」([3282])…いえ、「試行錯誤学習」が必須であるということは明らかでございます。そこらへん、このフォーラムでは「ものづくりが高度化すれば研究能力が必須」([3476])というような表現もしてございますが、まあ、だいたいそのようなものだと思います。(※きわめて私見です。)

・鳥栖市の見解です
 https://www.city.tosu.lg.jp/926.htm
 https://goo.gl/maps/5Dgci3ZMjDM2
 https://goo.gl/maps/qbmjh6qrPss
 https://goo.gl/maps/Gn7FvDj7avS2

 あ、いや、偶然ですってば! ネブラ(のレプリカ)の近くで煙がくすぶってるですって? 気のせいですってば!!(棒読み)コズミックフロント「謎のネブラ・スカイディスク」はあらかじめ知っていて、「ネブラ」というだけで思い出しましたけど、鳥栖にレプリカがあるなんて知らなかったんですよぉ! 本当ですよぉ!!(棒読み)ましてや煙? 密林さんとも呼ばれるEC最大手の鳥栖FC? 本当に偶然なんです。(ストリートビューで)いってみたらくすぶってたんですよ! ヤマト運輸さんが「ネコロジー」で坂道チャレンジ? …鳥栖FCがあったんですよっ!!(棒読み)…ま、このくらいのことはよくありますとも。

・ヤマハ発動機の見解です
 https://www.yamaha-motor.co.jp/pas/recommend/gekizaka/index.html

・エンロンのイメージです(2009年)
 https://kaigi.org/jsai/webprogram/2009/pdf/267.pdf

 ま、「AI見てみる? COMING SOON」と大文字で書かれたソレが公開されるまでは、なんともですかねぇ。<それある〜!!

 そして、この記事を短くまとめる余力はありませんので、長いままですけど、あしからず。みなさま、よい夏休みを!(違)

・「開発」といっても「発明」とは違いまっせ★お客さーん!
・└オープンソースを使っていいんですよ&むしろ使いなさいよっ(やーい「車輪の再発明」!)

・NHKには研究所があって、(たぶん)博士もいるんですよ
・└あなたの職場に博士がいないと想像できないかもですが、博士のいる職場というのは(あなたが思う以上には)ふつうにたくさんあるのですよ(…南武線はてっくてくじゃんよ!)

・デジタルカメラの「流し撮り(コンティニュアスAF)」みたいなの!=ここが「AI」なんですよ
・├「5年移動相関」 ⇒ 一律に5年でいいのか?(ファインダー内に異なる速度で動く被写体が混ざっていたらAFが狂うでしょ&どれか1つに合焦してほかは無視することになっちゃうでしょ)
・└「47都道府県」 ⇒ 複数の都道府県にまたがった相関は分析されていない(「スポット測光」みたいなの! 隣がでっかい大きな東京都でも東京都のことはまったく知らないよ! やーい盛大な測光ミスで真っ白だっ!)

・使っているのは「ビッグデータ」じゃないですよ(なんとか白書や小売物価や国勢調査という意味での統計ですよ)
・└国や都道府県の統計でうそをつくと統計法違反になるので、うそはないはずですよ(国の統計のためのデータは強制的に集められているので漏れはないはずですよ)

・シミュレーションやデータ同化に取り組んで行くための最初のステップっぽいですよ
・└じぶんが昔ならった統計学だけで考えず、統計数理研究所の最新の研究内容をしっかり見てくださいね

 シミュレーションまでなら、既に先進的な授業を受けて、専門ではないけれども概略はわかっているよ☆(※)…という世代も、育ってきているのかもですよ。本当でしょうか。

※専門家だけがわかっておればいいんだといって見下しているのでなく、誰もが共通認識として(ある程度のことは)わかっておきたいと、こういうわけです。

・情報コミュニケーション教育研究会(ICTE)「モデル化とシミュレーション」先生のための教科情報マニュアル(2000年7月15日)
 http://www.icte.net/publication/
 http://www.icte.net/publication/pdf/chap09.pdf

 > 普通教科「情報」においては、身の回りの現象や社会現象をモデルにより分析したり、モデルを動かしてシミュレーションを行なったりすることで、問題解決を図っていることを示す。モデル化は、情報技術により実現するものも多く、このような数学的な方法や情報技術が世の中に役立っていることを認識させる。
 > また、専門教科では、やや数理的な側面を取り入れた題材を用いて、数理的な目で物事を見る面白さやその意義を理解させる。
 > このテーマは、講義のとどまらず、実験やシミュレーションを通して「わからなかったことが、モデル化とシミュレーションによって理解できた」といった経験をさせることが重要である。

 > シミュレーションは、一般的なパソコンのアプリケーションソフトウェアなどとは異なるので、専用のソフトウェアが開発されている。企業や研究機関では、大規模なシミュレーションを実行するための複雑で高価なソフトウェアから、教育用に手軽に利用できるソフトウェアまである。

 「R」も「Scilab」も、さすがに2000年にはありませんでした。

※Rについては、1996年からあるにはありましたが、「パッケージ」が爆発的に充実したのは近年のことで、優れた教科書がたくさん出そろって勉強しやすくなったのも近年のことです。2005年や2007年ごろには、まだ使いづらく(誰もが入門できるとはいいがたく)、2009年より後の話ではなかったかと記憶します。

※「複雑で高価なソフトウェア」とは、「MATLAB」を念頭にした記述だと理解されます。この「MATLAB」と同等の計算が誰でも無償でできるようにと開発されてきたのが「Scilab」ですが、開発が本格化したのが2003年、日本語に対応したのが2009年、日本語のドキュメントが充実して入門しやすくなったのは、もっと後のことです([3345],[3477])。

 > このテーマは、記憶型の授業はできないし、評価は教師泣かせである。

 評価(学校で成績をつけるソレ)なんてする必要、あるんですかねぇ、と、([3094]に続いて)再度つぶやいてみます。

[3094]
 > 算数の中に位置づけるのはかなり難しく、そして窮屈でもあり、もっとPBLっぽく(2002年にはほとんど知られていませんでした)、「計算機使用活動」(Computer-aided activity)のような何かとして、単独で取り組んだ方が楽しく、そして考え方が手(計算機)を通して体得されるという利点があるのではないかと感じます。そして成績は…つける必要、あるんですかねぇ。

 「R」も「Scilab」も、適切な教科書さえできれば「小学中級から」遊べると確信します。そして、そうして育った人たちが、仮に学部は文系だとしても、その後の実務できちんと「モデル化」して「シミュレーション」をば、していけるようになっていくのです、たぶん。

・「動体予測」ミノルタでございます
 https://kotobank.jp/word/%E5%8B%95%E4%BD%93%E4%BA%88%E6%B8%AC-177341

 > ミノルタが 1988年に発売したα-7700i に初めて搭載された。
 > 動体予測は毎秒約20回の間隔でAFを繰り返して被写体の平均速度を測定し,シャッターが切れる瞬間の被写体の位置を予測して,あらかじめその位置にピントを設定することができる。

 このレヴェルでは「AI」とは呼ばれないでしょうが、「流し撮り」まで複雑化すれば「AI」と呼びたくなりますよね&現に「AI SERVO」とか表示されちゃってますよね。…その発想はなかった!(棒読み)

・C社「AIサーボAF」のイメージです
 http://cweb.canon.jp/e-support/faq/answer/image/61276/G0096286.gif

 そのように順を追って理解を試みれば、必ずそこそこの(平均65点の)理解に到達できます&そうさせるのが教育というものです。実装の詳細は知らずとも、手続きがわかるというのが必要なんです。「NHKのソースコード!」を出せと、「見てもわからないけど出せ!」などと…とんでもない。(棒読み)

 「ソースコード」が見えても見えなくてもリバース(エンジニアリング)できる、本当にリバースエンジニアリングしてコピー品で金もうけしようというわけではないんですけど、技術の詳細がわかるというのは、リバースエンジニアリングそのものなんですよ。あくまで机上でいくらでもリバースエンジニアリングしてみせて、でも、そんなコピーはしないよ&同じオープンソースを使えば誰でも同じのがつくれるよね(本件NHKに対してソースコードの開示を求める必要なんてないよね)、と、こういうわけです。(※本件番組で《おそらく》TensorFlow™を使ったのだろうというのはかなりのもっともらしさをともなう推測ではありますがあくまで推測であり、しかし、ここで本当にTensorFlow™なのかという1点に固執するのは本質的でない、TensorFlow™じゃなかったとわかったときにわたしをもやせーもやせーなさるのは…やっ、やめてよねっ、と、こういうわけです。やーい予防線の新型車両®っ。…そんなものはないっ!!)

[3160]
 > > そんなものはない
 > > 繰り返す。 そんなものはない! ないんだ!
 > > そんなものはない
 > > そんなものはない
 > > そんなものはない
 > > そんなものはない
 > > まとめ
 > > 湾岸幕張PAに徒歩で行く方法とか、そんなものはない
 > > 選ばれし千葉県民しか食すことが出来ない幻の丼!千葉丼!

 我々「雲をつかまされたみたいな顔!」で、じゅるるー!(違)

[3461]
 > > What makes a Research Question Answerable?

 > > Instead of asking, say, what an institution's policies should be on an issue, ask how people are responding to the existing policy or ask what their attitudes are toward a proposed policy.

 > 抄訳:ポリシーはどうであるべきかという問題そのものを問うてはならない。研究では、▼人々が実際のポリシーにどう反応しているのか、または、▼実際には運用されていないが具体的なポリシーを提案してみて、それに対してどのような態度をとるのかということを問うものである。

 > > 科学技術の先端的な問題はことごとくわたしたちの生命と安全に深くかかわるものです。しかしこういった問題の理解には高度な専門的知識と対人マネジメント能力が必要となるため、市民もそして専門家もまた、それらの問題の発生する仕組みや解決の方法を単独で理解したり、構想したりすることは必ずしも容易ではありません。
 > > 科学技術政策というマクロな意思決定の場面から、医療・福祉・教育など個々のミクロで臨床的な現場での意思決定の場面まで、利害や立場の異なる当事者のあいだ、とりわけ異なる専門家のあいだ、専門家と非専門家のあいだに、双方が十分に理解しあえるための適切なインターフェイスのしくみが欠落しているという状況に対して、人と人、人とモノとのあいだのコミュニケーションをデザインするという視点から、アプローチしていきます。

[3400]
 > 工学部のほうから見ると「なんじゃそれ」という印象もありましょうが、「近年機械学習」を従来の(文系の)統計学の発想で「読み替える」ソレ

・(一財)沖縄県環境科学センター「有資格者リスト」
 http://www.okikanka.or.jp/summary1-4.html

 > 博士(医学) 1人
 > 博士(学術) 1人
 > 博士(理学) 2人
 > 博士(工学) 1人
 > 博士(農学) 1人

 職場の「産業医」までカウントするとあれですけど、明らかにそうではない博士が、ちゃんと5名くらいいるじゃないですか。うんうん。…えっ? 「環境科学センター」だからあたりまえですって? …デスヨネ〜。(棒読み)わあぃカステラは和菓子か洋菓子かっ([3485])! つまるところ、「和菓子か洋菓子か」と考える人にカステラを納得いただく、カステラという存在をお許しいただくという、そういう気苦労のようなものが、(課程)博士にはあったりなかったり、しそうですよ。本当でしょうか。

※カステラはカステラですよね。カステラだからスバラシイとかカステラだからケシカランとか、そんなことあるわけないじゃないですか。うん。

・身もフタもないですけど…ゲフンゲフン。
 https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q10103381310

 博士の人数を(ほかのあらゆる国家資格と対等に並べて=並べていいのかどうかはよくわからないんですけど=国家資格ほど厳正な認定なのかどうか…ゲフンゲフン)ばしつと公開しているのは公的機関に限られる感じで、むしろ、大学院のほうを「串刺し」で見ていくと概数が見えてくるのかなぁ。(棒読み)

 翻って、これから大学を選ぶかた、そこのふつうに立っておられる高校生のかた!(違)

[3117]
 > > で、えー、このあと、おー、ま、まもなく八木駅、に、かかるんですけども、八木駅が、ま、ちょうどこういう、区間、というような設定をしてます。

 > > …ということで、えー、ちょっと、たぶん、普通に立っておられると、危ないと思うんで、ちょっと、構えてくださいね。あの、立っておられるかた。
 > > ブレーキかかります。
 > > チーン
 > > ピーンポーンピーンポーン
 > > にょほほほっ
 > > ピーンポーンピーンポーンピーンポーン

・Google ストリートビュー 山陰本線「八木駅」(京都府南丹市)付近
 https://goo.gl/maps/Gk7ouxSgnTL2
 https://goo.gl/maps/RZ3a14zVopw

 > 0

 > 踏切
 > 30秒

※専門職大学院じゃない、一種『フル規格!』の大学院(=博士後期課程がある大学院)のある大学を選んだうえで教員の経歴を「ResearchMap」で調べて、まともな博士号を取得している教員が常勤(=客員じゃない&講師でもない)しているということをしっかり確かめて、志望大学を最終決定するのですよ、いいですね?(もっと違)じゃなくて、教員の業績一覧で論文のタイトルを眺めて、気になるキーワードがあれば線を引いて、線を引いた箇所を数え上げて、それが一番多かった教員のいる大学とか、一番多かった学科のある大学を選ぶとか、そうやって選ぶのですよ、いいですね?(…えーっ。わからない言葉はぜんぶ辞書や事典で調べるのですよ。)

・土木学会「土木学会誌2012年10月号モニター回答」(2012年10月)
 http://www.jsce.or.jp/journal/monitor/201210/koe.shtml

 > 一見土木と関係がなさそうな専門家の方による語りが特徴である「この人に聞く」は、土木関係者では思いもつかないような土木の可能性を伺うことができるので、毎号どんな人が登場するのか、どんな話が展開されるのかちょっとした楽しみになっています。
 > 所属:福島県

 「思いつく」「思いつかない」のレヴェルでものごとを眺めているひとって、いるんですね。じぶんの知らないことはじぶんで探さないと見つからないのですよ。そして、(あなたのいう)専門家は、物知りだから知っているんだと思っているんでしょ。…やだなぁ。知らないことを調べることができるのが専門家ですよね。うん。(棒読み)

 > 餅すら描けない
 > 所属:電源開発株式会社

 滑稽だわ!([3370])…若い部下が描いたポンチ絵をポンチ絵だといって無下にするひとは、じぶんでは「餅すら描けない」のよ! …なんてこったい。(※表現は演出です。)

 > 記事4 期待の鉄道建設を推し進める ─東北縦貫線整備─
 > 本工事での特筆すべき点は、高架下の店舗の移転を行わず、工事を実施されたことだと思う。
 > 所属:東京急行電鉄(株)

 ほかのひとが「ですます」で書いているのを見ていない(=誌面を読んで中身の理解をするだけで注意力を使い果たして、細かなニュアンスにまで気が回っていない=)かのように「すべき」といいながら、しかし「と思う。」とまとめちゃうひとって、いますよねぇ。しかも、それ、記事のあらましそのものじゃありませんこと? …ギクッ。「読書感想文」にあらすじだけを書くひとって、いますよねぇ。(※表現は演出です。東京急行電鉄とは無関係です。)

 > 私は、上野−御徒町間の混雑を実際に感じながら、京浜東北線南行で毎日通勤しています。東北縦貫線工事の線路改良部は日常的に車内から目にする一方で、神田駅付近の高架橋新設部は車内からはよく分かりませんでしたが、本記事では断面図が紹介されており、新幹線との重層構造であることが今回分かりました。限られたスペースの中で、工事トラブルに備えた様々な対応策の検討に感心する中、一番興味を持ったのが、騒音対策と近隣への圧迫感低減策として防音壁材料に透明のポリカーボネートの使用を計画していることです。完成イメージ図を見ると、騒音対策・圧迫感の低減といった本来機能に加え、透明資材の使用による景観性の向上が付加価値として生まれていることが非常に印象的でした。
 > 所属:(一財)日本水土総合研究所

・日本水土総合研究所(※)
 http://www.jiid.or.jp/about/ichizuke.html

※ホームページの上で所在地を見つけられませんでした。しかたなく定款のPDFを開きますと「東京都港区」としか書かれてありませんでした。

 > 3. 組織(総職員数 30 名)
 > 1)出身別技術系職員構成 産15 名、官7名、民1名、プロパー4名  計27名
 > 2)資格 博士2名、技術士2名、技術士補6名、1級土木施工管理技士11名、農業土木技術管理士3名、測量士5名、VE リーダー6名、コンクリート技士2名、その他資格多数

※財団法人や社団法人の形をとる「研究所」にあって、ほかの業界を見てもそうですが、博士が少なすぎませんか? と心配されます。(博士が少なすぎては、博士の間での競争や緊張関係が生まれません。)もっとも、こうした研究所が「自主研究」(受託でない、の意)を一種「本気で推進」してしまうと、上位の(研究所より上位だと思っていたい、の意)事業体(※単なる事業会社は、研究所より下位であるのが普通だと説明される業界もありましょう)のいろいろなものを暴いたり壊したりしてしまいかねない…といって恐れられ、一種「手綱」のようなものを「ハンドリング」されているということなのかなぁ、などと勝手に想像してコワがってみます。コワイですね。(※あくまで想像です。)

・個人のブログ「手綱なしで、キャンタ〜」(2014年2月9日)
 http://f.hatena.ne.jp/ManSteflat/20140205121208
 http://mansteflat.hatenablog.com/entry/20140209/1391981318

 > インストラクターは、Mさん。
 > 写真は、この日のペコさん。
 > なぜ、またまた、30才のペコさんにご登場いただいたのかというと、この日は、手綱を使わないでキャンターをやることになってたからです。なにしろ、ベテランのペコさんなので、キャンターもゆ〜っくりで、安定してます。

 > なぜ、手綱なしのキャンターをやるはめになったのかというと。
 > その前の週のレッスンで、ディブリーくんに乗ってキャンターをしたとき、わたしがバランスを取るために、手綱を使ってた(引っ張ってた)らしく。もちろん、例のごとく、自分では気がついてないわけですが(笑)、Mさんに指摘されました。
 > で、手綱なしでバランスを取る練習をしましょう、ということに。
 > え?!手綱なし〜!?、と言っても、Mさんがランジ(調馬策)を馬に付けて、ぐるぐる回しながら、速さもゆっくりに調節してくれるとのこと。

 たぶん「博士の『手綱』」を引っ張る側は、自分が「手綱」を引っ張っていることに気がついていないということですね。それを指摘して、「練習」のメニューを助言できる「Mさん」が、いろいろな業界で(潜在的に)必要とされている、とも読み解けそうです。(※個人の見解です。)その一翼を担うのがNHKでもあると、たぶんこういうわけです。

・我孫子乗馬会・仲馬倶楽部「ジョーバ博士」
 http://www.nakamaclub.com/hakase/hakase.html
 http://www.nakamaclub.com/annai/annai.html

 > 馬の福祉
 > 仲馬倶楽部の馬は穏やかで乗りやすいといっていただいているのが、私たちの誇りです。
 > 動物取扱業に関する表示

・北海道 日高振興局「ひだか博士の馬文化教室」
 http://www.hidaka.pref.hokkaido.lg.jp/ts/tss/umabunka/07-kyoushitsu/03-issyou/index.htm

 > 馬は3歳までの成長スピードが特に早いから、馬の1歳・2歳・3歳をそれぞれ人間の6歳・12歳・17歳とする。

 > (画像より)
 > 4歳以上の馬の年齢換算式
 > (馬の年齢−3)×3+17=人間の年齢

 …とのことで、「30歳」の『ペコ』号は、人間の年齢に換算すると、…「98歳!」。「ペコさん」などと、「さん付け」では足りないくらい、かもしれません。なお、人間でいう17歳からあとの成長がトントンだと…いえ、17歳からあとは成長しないようなものだといえば…ゲフン([3096])。

※かなり余談でした。ウマ…ではなくウシの「歩走行」(歩いているのか走っているのか⇒運動の強度)を「心拍数と血中乳酸値の関係」で判別するはなし([3403])も参照。…おお、無理にでも統計の話題にしようというコンタンですかっ。(棒読み)

・「一翼を担う」
 https://kotobank.jp/word/%E4%B8%80%E7%BF%BC%E3%82%92%E6%8B%85%E3%81%86-676724

・東京新聞「経済記事「こう読む」 シニア男女70人に解説 品川区で出前講座」(2017年6月27日)
 http://www.tokyo-np.co.jp/article/education/nib/CK2017062702000168.html
 http://www.tokyo-np.co.jp/article/feature/k_hishi/CK2016072002100031.html

 > 受講したのは同区のシニア世代向け学習講座「品川シルバー大学」のメンバー。**デスクは、最近の為替レートが円安傾向で、物価が上昇傾向にあると指摘。牛乳パックの内容量が減る一方で価格が据え置かれ、実質値上げになっている実例も新聞記事を示しながら紹介した。

 > また、今年末の景気の見通しについて、グループで話し合い考えをまとめるよう指導。参加者からは「私たち中高年の購買意欲が景気を左右する」などの意見が出た。受講した男性(74)は「皆で話し合い、お互いの考え方を知ることができたのがよかった」と感想を述べた。

 …デスク氏の年齢のほうなど書かれないんですか、そうですか。2016年11月の記事で「(48)」とのことでございます。おおー!(略)じぶんは60歳くらいだと思っている「シニア世代」のかたからみて、ちょうど1まわり若いだけの(=若すぎなくて)ちょうどよさそうな感じですよね。そういう意味では、じぶんは60歳くらいだと思っている「シニア世代」のかたからみて、リアル60歳くらいのひとがエラそーに解説するのは鼻持ちならないのではないかなぁ。(棒読み)「「読者より格下!」のマスコットキャラ」([3174])も参照。

 > 取材では「歴史のウラを取りたい」と関係者を何とか捜し出したものの、その方は既に鬼籍に…という場面が多くあった。

 何か掘り出せるかもというソレで出前するんですか、そうですか。「90歳ヒアリング」([3094],[3313])も参照。

[3456]
 > (まじめそうなかげで、どんなヘンテコなレコーディングやマスタリングをしているかもわかったものじゃない=さりげなく後述)レコードこそが正式な音程であって、もっともらしい「市販の楽譜!」なんて、まったく信用ならんといって、レコードの音をFFTするんですよ。ええ。(※あくまでイメージです。)

 > 誰ですか、「この仕事が終わったら**に行くんだっ」([3450])…じゃなくて、「豊かになったらモダン楽器を買うんだっ…いや、むしろ買いたまへしょくん(定価は高ければ高いほどいいぞ★)」などといったのはっ。社会が成熟すればこその(遡及しての知識の)体系化であると、いまなら自然にわかってくるのかもですよ。いまのわたしたち、とっても豊かな時代を生きていると実感されます。

 …コレジャナイ。

・(参考)総務省統計局「どうしても回答しなければいけないのですか?」
 http://www.stat.go.jp/data/kouri/handbook/1-04.htm

 > 小売物価統計調査は、統計法(平成19年法律第53号)に規定する「基幹統計調査」です。「基幹統計調査」については、統計法第13条の規定により、報告を求められた者に対し報告義務が課されています。また、報告をしない場合の罰則の規定もあります。

 このようにして成り立っている「公的な統計」というものを、それでもなお信用ならんといわれますと、…困っちゃうかもだなぁ。(棒読み)


●「ぐるぐる☆どっかーん!」を金沢大学「同軸噴流の軸対称とヘリカルモードの流れ構造」で読み解く(試)


(30日に追記。)

・ツイッター(2017年7月29日PST)
 https://twitter.com/sasakitoshinao/status/891434160107266049

 > ポイントはここですよね

 うそーん。現実の変量間の構造はループありの「ぐるぐる☆どっかーん!」([3089])なネットワークなのであって、それでも各々の変量には(物理的、空間的、時間的、相対的のいずれかまたはぜんぶの)制約があるので、「結果的には現実的な結果」(?)だけが『現に現れて!』くるのだろうという、そういうセカイですよね。

※身長や体重がいくらでも大きくなれるかといって、とんでもない。
※人口密度がいくらでも高くできるかといって、垂直方向を開発したとしてもなお、その他のインフラも考えて、とんでもない。
※タイムリミットのある事象とか、同時に起きることがめったになかったり、同時に起きると相殺されてしまうとか、そういうのもありそうですよね&きっとあるに違いない。

 変量間の構造が循環していれば、いずれかの変量をゼッタイの「原点」と定めるようなことはしにくく、大域的には流れのおおよその向きというものはあっても、局所的には双方向のエッジとなるペアもあれば、フィードフォワードループやフィードバックループ([3125])を形成する一群というのも見られてくるはずです。いま12分42秒くらいのところでナレーションのおかたも「うわぁ…もじゃもじゃのカタマリ。」といっておられるじゃないですか(※)。高校までの物理のイメージに即して例えれば、渦みたいなものです。そこには、そのような構造そのものにより発現される機能(や動き)というものがあると考えられるのであって(≒渦というものは、この構造あってこそ『渦らしい』動きを見せるのですよ)、これをぶったぎって因果関係だとかなんとか…なにをおっしゃる。(棒読み)むかしのひとはいいました…じゃなくて、なんでもツリーにしないと考えられない、われわれがいちばんツリーなのかもしれませんね。…われわれがいちばんツリーなのかもしれませんね&2回いいました。(棒読み)それ、(当時)計算できないからしかたなくツリーにしてきたのであって、(今後)計算できるならツリーにしなくていいのですよ。もとは計算のための工夫だったことをすっかり忘れ去って、あたかも最初からセカイはツリーであったかのような(大巾に略)コレハヒドイ&そこからですかっ!! 先が長いなぁ。(※個人の見解です。)

※グラフ構造(ネットワーク)を扱うんですから、本来はここ(「もじゃもじゃのカタマリ」=山手線内とか地下鉄網みたいなの!)がおもしろいんですけど、今回はそこまで話が進みませんよ&ごめんなさい、という、制作者のイイワケみたいなのだと思いました。うんうん。最初はそうですよ。…もしゃもしゃするっ!!(棒読み)そういう意味では卒研の着手発表みたいなもので、おお、こやつ…できるぞお!(ゴゴゴゴゴ。)…と、まずは無条件で期待をかけて我々「生温かい目!」でですね(略)。文句を言うのは、最終発表で期待が裏切られてからだッ。…えーっ。

※なお、指標間の相関関係をグラフ構造にしたという意味での(本件番組内で「可視化」されるほうの)ネットワークと、「ディープラーニング」のアルゴリズムの中で使われるほうのニューラルネットワークは、まったく別物ですので、あしからず。ニューラルネットワークのほうは、計算の途中で使うだけで、計算が終われば捨ててしまうのではないかなぁ。そうして出てきた計算結果(全5000指標の総当りペアにおける、各ペアの重みや向き)を使って、それらしく(エッジを張るか張らないかの閾値など『あしきり』などと称して恣意的に決定されながら)本件ネットワークをつくってみせているんですよね。ま、それがふつーですよね。ま、「あしきり」とかいっちゃだめですよ。少なくとも漢字で書いてはいけない気がするよ、うん。(※見解です。)

・守屋准教授の見解です
 http://tenure5.vbl.okayama-u.ac.jp/HM_blog/?s=%E3%83%8D%E3%83%83%E3%83%88%E3%83%AF%E3%83%BC%E3%82%AF
 http://rcis.vbl.okayama-u.ac.jp/RCIS/

 > 重複した遺伝子がゲノム上に保持され続けるためには、保持せざるをえない理由があるか、重複した遺伝子の機能が急速に変化する必要があると考えられています。量の効果や機能分化、新規の機能獲得などがそれに当たります。

 > この論文ではほとんど遺伝子名が出てこなくて、図の中で解析されている遺伝子が何なのかわかりません。「全体の傾向を見るのに個別の遺伝子の機能は関係ない」という姿勢なのかもしれませんが、どの遺伝子がそういう振る舞いをしているのか知りたいし、遺伝子名がわからなければ追試もできません。あまり良い姿勢ではないなと思いました。

 > また、この解析は実験系の性質上、非必須遺伝子しか取り扱えません。必須遺伝子の方が破壊のインパクトが大きいわけですし、合成致死ネットワークの解析でも必須と非必須遺伝子では見えてくるものが違っていたわけで、必須遺伝子で同じことをやると結果もまた違うのかなと思いました。

 > なお、この論文は遺伝子重複の研究の専門家である東北大学の****さんに紹介していただきました。このエントリーの執筆にあたっても議論・助言をいただきました。この場を借りてお礼申し上げます。

 真摯で建設的なレビューって、こうですね! 内容や水準に違いがあっても、わたしたち、基本的なところでこのような態度を養い、完徹していきたいと思わせられます。

・一般化「最終発表に向けて最後の追い込み」のイメージです
 http://product.kobe-du.ac.jp/2016/12/18/%E3%80%904%E5%B9%B4%E7%94%9F%E3%80%91%E5%8D%92%E7%A0%94%E6%9C%80%E7%B5%82%E3%83%97%E3%83%AC%E3%82%BC%E3%83%B3%E3%81%AB%E5%90%91%E3%81%91/

 ま、卒研の内容がソフトウェアひいては計算理論であったりすると、イメージされにくいかもですけど、気持ちや工程は、実物がある研究とまったく変わらない(…はず?)ですよね。んだんだ。

・京都大学「渦」のイメージです
 http://www.vortex.me.kyoto-u.ac.jp/scalar-dissi-A2S.jpg
 http://www.vortex.me.kyoto-u.ac.jp/sub1-2.html

 渦というものを水面の上だけで見ていては理解できないのですよ。んだんだ。

・神戸大学「渦」のイメージです
 http://coast.dce.kobe-u.ac.jp/?plugin=ref&page=Projects&src=rip3d.png
 http://coast.dce.kobe-u.ac.jp/?Projects

 同じことを(数学でいう)多次元の空間(多次元配列ひいてはネットワーク)にも適用して考えましょうよ。んだんだ。

・金沢大学「渦」のイメージです
 http://www.ms.t.kanazawa-u.ac.jp/~fluid/home/research/research_umi/funryu1/fig4.gif
 http://www.ms.t.kanazawa-u.ac.jp/~fluid/home/research/research_umi/funryu1/index.html

 わあぃ同軸噴流の軸対称とヘリカルモードの流れ構造。***同軸噴流の軸対称とヘリカルモードの流れ構造だいすき。もっかい? わあぃ同軸噴流の軸対称とヘリカルモードの流れ構造。我々「さっき「同軸噴流の軸対称とヘリカルモードの流れ構造」を読んできたばかりみたいな顔!」で同軸噴流の軸対称とヘリカルモードの流れ構造だいすき…ゲフンゲフン。たいていのものは「さっき見てきたばかり」でいいんですし、それすらしないというのはアレですよ。うん。

 折しも台風9号を台風5号が追いかけながら、その後ろ(=こういう見かたをした上での「うしろ」、の意)の三陸はるか沖で「熱帯低気圧」(きのうの予想天気図では「熱帯低気圧」だったんですけど、けさの予想天気図では緯度が上がって「低気圧」とのことですが、境目なのでびみょーっぽくないですか?)のほうなど…ギクッ。台風9号が台風10号も巻き込む感じに見えてきますよね(巻き込まれた結果、台風10号は熱帯低気圧になるという予想天気図のようですけど)。台風11号12号、もしくは13号14号くらいまで、この大きな動きが(連鎖して)続いてしまうと、たいへんなことになりませんかねぇ。…ギクッ。(※あくまで素人です。これは予報ではありません。)

 渦という物理現象には、実際の現象という「ゼッタイの正解(教師データ!)」があるのですから、観測方法の発達次第でいくらでも詳しく解明していけるとの素朴な期待がございます。ニンゲンサマはそんなにエラいのかっ…人間社会の指標の動きというのも、観測されたソレこそが正解なんですよ。うん。現に観測されているものを、よりよく説明しようということであって、(わずかばかりのシヤクシヂヤウギな定規を持ってきて、それで見える範囲だけを見て)「因果関係は不明であるッ(どやぁ)」…なんだかなぁ。

・Google ストリートビュー 「止まれ」(京都府亀岡市)付近
 https://goo.gl/maps/kJFY3see6PP2

・「もしゃもしゃするイス」(※近似値)のイメージです
 https://s-media-cache-ak0.pinimg.com/736x/d9/35/64/d935643fdd85b8b40db25db4e66806d8--living-room-redo-barrel-chair.jpg
 https://s-media-cache-ak0.pinimg.com/236x/59/64/22/596422847c77d5314cb7e1050b5967d6--ikea-armchair-green-armchair.jpg
 http://www.sema4inc.com/thumbnails/green-upholstered-chair-1-opera-green-upholstered-chair-600-x-600-small.jpg

 某やっほー之日本社とかにありそうだよね。(違)

・(参考)「Granger因果性解析」
 https://www.yodosha.co.jp/jikkenigaku/keyword/3790.html

 > ある時系列A(例えば日経平均株価)の現在の値を予測するのに,その時系列自身の過去の値を用いた場合に比べて,それと同時に記録された別の時系列B(例えばドル円為替レート)の過去の値を取り込んだ方がAの予測精度が上がれば,それはBがAに対して影響力をもつことを示唆する.

 なるほどなるほど。これを1ペアずつ手作業で…じゃなくて、「ディープラーニング」に丸投げしてごそっと一気に…できるんですかねぇ。…気になります!


この記事のURL https://neorail.jp/forum/?3514


(約53000字)

この記事を参照している記事


[3520]

【自由研究】続・いばらき「主論文・野帳・掲示物・標本」を読み解く

2017/7/27

[3521]

研究ホワイトボックス(19) ハイパー・ゼロ:質問! その前に…

2017/8/3

[3522]

【自由研究】モニターとプリンターを先に考えながら画策する「中古デスクトップPC」の安定的な調達(談)

2017/8/6

[3527]

研究ホワイトボックス(23) 自由研究総合(自由形)にクラスター分析を(詳説編)

2017/8/11

[3532]

【自由研究】ゆるシミュ(4)

2017/8/19

[3533]

【自由研究】ふわコレ(4)

2017/8/19

[3535]

『一人一研究』に「4人くらいの班」で取り組ませるという矛盾(談)

2017/8/24

[3538]

東京新聞「夏休みのラスボス」ほかを読み解く(談)

2017/8/27

[3539]

【自由研究】ゆるシミュ(5)

2017/8/31

[3540]

【自由研究】ふわコレ(5)

2017/8/31

[3542]

「AI見てみる?」(2017年8月)を見てみた(談)

2017/9/18

[3543]

実例に見る総合評価(2) A県警:交通事故当事者の誕生日の区間分割

2017/9/19

[3547]

新しい広域流動(7) 東京都台東区・荒川区

2017/9/27

[3557]

研究ホワイトボックス(25) ハイパー・ゼロ:「博物館評価」とは

2017/10/16

[3559]

【SFTGFOP】「さくらカード」(1996年6月)を「JIS II型(JIS X 6302)」からの「イオカード」(1991年3月)で読み解く【株式会社東京交通会館あり】

2017/10/27

[3563]

「都道府県別データを用いた図書館貸出冊数と書籍販売金額の相関分析」(2017年6月)ほかを「経済状況と公共図書館の利用 : 都道府県パネルデータを用いた分析」(2004年6月)ほかで読み解く(談)

2017/11/3

[3567]

いま問う「正射影ベクトル」からの「凸最適化」を『ほぼSVM』と読み解くココロ(試)

2017/11/19

[3569]

山陽新聞社・テレビせとうち「さん太ホール」とはにわが知りたい(仮)【株式会社山陽計算センターあり】

2017/11/19

[3571]

実例に見る日英対訳(17) 「ランダムフォーレスト」に野生はあふれ

2017/12/3

[3580]

いま問う「ハイフンの木」のココロ(談)

2017/12/3

[3582]

10年後に読む「よりよい環境創造のための環境心理調査手法入門」(2000年5月)

2017/12/7

[3583]

JR西日本「データ分析コンテストの開催」を遠目に眺める(談)

2017/12/7

[3585]

いま問う「一日中モーニングサービス付」のココロ(仮)

2017/12/19

[3594]

いま問う「相関係数計算機」のココロ

2018/1/1

[3601]

【カムロちゃん】『京成うすい駅』とその周辺【山の神バス停あり】

2018/2/15

[3602]

新千葉駅とその周辺【株式会社全農協同流通あり】

2018/2/15

[3617]

武蔵野市「武蔵野市地域公共交通総合連携計画」(2010年3月)を読み解く

2018/3/10

[3623]

〔フレッシュおはよう東日本〕10号:仙石線『青葉城恋唄』(1988年11月)を営団『7号ビジョン』(1991年11月)で読み解く(仮)

2018/3/24

[3633]

八街市「八街市地域公共交通網形成計画」(2016年3月)を読み解く(中編)

2018/4/5

[3640]

研究ホワイトボックス(32) 「単元」と「難易度」を示した「総合的な教材」をつくるには

2018/4/30

[3652]

【自由研究】ふわコレ(7)

2018/6/10

[3671]

「自由研究とその周辺」かく読まれず(談)

2018/8/16

[3675]

研究ホワイトボックス(34) 行列と行列の差を検定するには

2018/9/1

[3676]

【正宗の名刀で速射砲と立合をするような奇観を呈出】発生学から出立するディープラーニング(仮)【社会調査工房オンラインあり】

2018/9/13

[3707]

研究ホワイトボックス(35) 複雑なデータと「対話」するには〜郵便番号データを例に(R編)

2019/5/24

[3712]

「理由の書き方」 / 「自分の考えの書き方」 / ほか

2019/6/4

[3714]

Re:[3701] 「箱庭」とは何か / ほか

2019/6/4

[3716]

【A9・Exp.】「乗客のアルゴリズム」一計

2019/6/9

[3737]

【おふろのフタ】さまよって西鉄「ボンレット」【ポム200形あり】

2019/7/15

[3742]

研究ホワイトボックス(38) 数学の自由研究で郵便番号データを使うには

2019/8/1

[3771]

【赤田谷戸】「無名性の技術力」とは何か【臨海サービス株式会社あり】

2019/9/23

[3803]

ぎんぎらぎん(後編) 「様々なアイデアから調和のとれた形態や経験を導くことの出来る統合力」とは【ムサビの博士後期課程あり】

2019/11/1


関連する記事


[3669]

【自由研究】ゆるシミュ(9) tht - 2018/8/16

列車 車両 線路 発想 研究 道路 ゲーム 実装 仮名 ジャック


[3584]

研究ホワイトボックス(30) ハイパー・ゼロ:「主成分分析」FAQ tht - 2017/12/19

発想 研究 道路 数学 主成分分析 多変量解析 散布図 クラスタリング 相関係数 分散分析


[3639]

【自由研究】ふわコレ(6) tht - 2018/4/30

列車 車両 線路 発想 研究 道路 建物 ゲーム 実装 写真館


[3581]

実例に見る総合評価(4) T工務店:ビル外壁汚れ認知構造のモデル化 tht - 2017/12/7

発想 研究 仮名 数学 主成分分析 多変量解析 散布図 クラスタリング 相関係数 確率論


[3745]

【自由研究】ここからここまで【AIどうでしょうつき】 tht - 2019/8/13

列車 発想 研究 道路 建物 実装 仮名 数学 自由研究 実態調査


[3649]

【お知らせ】ストリートビューの表示を休止します tht - 2018/5/31

列車 車両 線路 発想 研究 建物 ゲーム 実装 仮名 決定版


[3566]

「決定木」を1度忘れて再び「ランダムフォレスト」に至る(談) tht - 2017/11/19

発想 研究 実装 数学 キロ 主成分分析 多変量解析 散布図 相関係数 計量


[3651]

【自由研究】ゆるシミュ(7) tht - 2018/6/10

列車 車両 線路 発想 研究 道路 建物 ゲーム 実装 広島電鉄



話題を見つける

●多彩な方法でフォーラム内をサーチ!
●目的に合わせて使い分けよう。


2014年度以降の主な記事(スコア順)
HITSアルゴリズムを用いたブラウジングをお試しください。【詳細】


四半期ごとの主な話題
(1999年度〜最新


最近の主な話題
(2014年度〜)


キーワード (索引)
2014年度以降のキーワードや文字数の多いキーワードなどから、記事を探せます。


リファレンス (参考文献)
リンク先のタイトルをドメイン別に一覧しながら、記事および参考文献を探せます。

【自由研究】の話題
「主論文・野帳・掲示物」とは?(PDF)
【自由研究】の記事一覧(新着順)


国土地理院の空中写真 を紹介している記事
(PCでの閲覧をおすすめします)


「多変量解析実例ハンドブック」の記事一覧(新着順)
「R with Excel」の記事一覧(新着順)
(統計解析環境「R」を電卓のように使い、データの入力とグラフの保存のため「Excel」をノートのように使います。)


画像で探す
列車 | | 植物 | | 計算機 | 掲示物 | 食べもの
この記事に関連する画像





neorail.jp/は、個人が運営する非営利のウェブサイトです。広告ではありません。 All Rights Reserved. ©1999-2019, tht.