フォーラム 個人情報保護方針 | 利用規約

「情報と鉄道」「ユニバーサルデザインと鉄道」「社会と鉄道」がテーマのフォーラムです。(16歳以上対象)

ご利用状況について
このフォーラムについて
機能の改廃等について

(※新規の掲載はお受けしていません。)

全角と半角、大文字と小文字が区別されます。

検索の代わりに:
キーワード (索引)もどうぞ。



[3579]

「ホワイトボックス」とは何か(談)

発想 主成分分析 多変量解析 変量 主成分 多変量データ 音場 DSP 応募者


 [3575]の続きです。

・NHK「人工知能で社員データ分析 最適人事で人手不足に対応」(2017年11月26日)
 http://www3.nhk.or.jp/news/html/20171126/k10011236281000.html

 > 国内や海外にいる全社員、およそ1万2000人の経歴や語学力などをデータ化したうえで、人工知能を活用して分析するシステム
 > アメリカ企業が開発し、ほかの日本企業でも導入されている

 > アメリカ企業の担当者
 > 国内での導入拡大にあたっては、データに表れない業務をどう評価するかやシステムの分析結果と人が行った評価とをどう組み合わせて、新たな制度を作るかなどが課題になるということです。

 「アメリカ」かどうかはどうでもいいので(=いまつくれば、どこでつくってもだいたい同じようなシステムができましょう※)、どんなデータを入れるのかをもう少し詳しく報じていただけないですかねぇ。(※感想です。)そして「データに表れない業務」というのは…うそーん。必ず何らかのデータに表れるはずですよ。本当でしょうか。

※そして、どのようなデータと分析方法を使うのか(使ってよいのか⇔それ以外は使ってはならないという強制力とともに)はJISであらかじめ定めてほしいなどと(略)。

[3534]
 > JISやISOにするのでもない限りは、お好きにノートをおつけになれば、それでいいのですよ&あるひとの方法とよく似たつけかたをしたとしても、それは偶然なのですよ。むしろ、簡便でありながら優れた方法があるならJISにすべきなんですよ。…その発想はなかった!(棒読み)「JIS規格」の履歴書って、あるじゃないですかぁ&そこからですかっ!! 規格がありながら規格を無視するようなカイシャは、しょせん、規格というものへの認識がその程度なんですよ。ええ。

・日本経済新聞さん通し日経産業新聞「社員の4つの資質」のイメージです(2017年11月22日)
 https://www.nikkei.com/article/DGXMZO23763060R21C17A1XXA000/

 > 「(略)役割に合った能力があるか。認知能力や知識があるか。謙虚さがあるか。また好奇心があって楽しさを感じられるか。(略)」

 このうちの2つ(※本質的な変量として2つ)しか入力しないようではだめっぽいかなぁ。(※感想です。)

 > 「**は10年ほどかけて(略)面接官は面接が4件を超えないようにしている。5件以上になると正しく評価できないことがわかった。(略)」

 ほぉお! …疲れるってことですね。しかし1件や2件ではだめだというほうにも根拠って、あるんです?(※感想です。)

 > 「(略)利用者の男女比は半々だ。だが**の社員の女性比率は3割程度でバランスがまだ取れていない。教育システムが理由の一つだと思う。(略)日本でも4000人の高校生の女子にプログラムを提供した」

 実は面接などいろいろな場面で「3件くらい見ればわかったつもりになれる」とか「3者から1者を選べばオッケーでぇす」みたいなことを重ねてきた結果が「3割程度」という比率として出てくるのではないかなぁ。…その発想はなかった!(※まったくの憶測です。)

[3450]
 > 乗車人員の合計に占める「定期」の客の割合なんて、ほとんど差がないだろうと思ったら、結構、差があるんですね。しかし、一種『肌の感覚!』として「4人に3人は定期」「3人に2人は定期」というような、つまりは千葉や千葉、主に千葉に住んでいそうな「有業者の夫と専業主婦の妻、子ども2人」などとされる『標準世帯』([2965],[3061])において、定期券のユーザーが何名いるかといって(=かなりランボウな前提ではございますが)、そういう、ミクロには整数なセカイに要因のある事象だと考えれば、マクロ的にも、そういうキリのいい割合に収れんしていくはずだと仮定するところであります。

・日経電子版「科学記者の目」(2017年11月26日)
 https://www.nikkei.com/article/DGXMZO23614550X11C17A1000000/

 > 20世紀前半はカビから抗生物質を見つけたように試行錯誤を通じてイノベーションが起きた。しかし現在は容易に発見されることはすでに発見し尽くされ、科学の深い理解なくしてイノベーションは起こせない。そこで大学の役割が重要になっている

 デスヨネ〜。(※見解です。)

 > 現代の創薬は薬学の専門家だけが担ってはいない。計算機科学の専門家など3つか4つの異なる分野の専門家が同じ部屋で働いている。研究開発をビジネスにつなげられるチームが重要なのだ

 > 理工系の学生が経営を学べるようにした

 この順番で学ばないといけないということですね。実際、その逆はかなりむずかしいですよね。うん。

 > メンター(指導者)が足りない

 メンターだけを務めるようなひとの採用のしかたとかって、何か特別なノウハウがあるんですかねぇ。(※感想です。)

 > 教授は80年代に日本の技術経営を教えて支持を集めた。90年代に入ると、日本に関するテーマが人気を失ったため、米国のソフトウエア・IT産業に注目して経営戦略を調査して人気講座とし、調査で得た成果を出版した。そんな話を聞くと「大学側も起業家精神を」と強調する意味合いが見えてくる。

 ページ(記事)の最後にやっと(読者が期待する)「科学記者の目」が出てきます。…なんだかなぁ。

・「米調査に見るAI人事選考の危険性」(2017年11月22日)
 http://diamond.jp/articles/-/150433?page=3

 > 驚くべきことに、実はこの○○(※システム名)へのインプットデータには、**は含まれていないのだ。だが、*A、*B、*C等、**と相関の高い属性がセットとなって、**を特定したのと同じ結果を出していた。

 > AIの中はブラックボックスだ。数理モデルや統計手法では記述できないようなものを学習するのがAIなので、その内側は開発者にもわからない。ましてや因果関係の特定など無理だ。

 うそーん。ニューラルネットなどの方法で記述して導き出して…いるんですよね。因果関係(の向き)というのはデータしだい(調査や実験の設定しだい)であって(そこを明らかにするのは別のタスクや研究分野であって)、「ましてや」との接続詞で続けて述べることがらではないような気がするよ。(棒読み)

・(再掲)後ろから読む日経リサーチ「多変量解析」
 https://www.nikkei-r.co.jp/glossary/id=1643

 > 多変量解析のテキストでは、しばしば外的基準(目的変数)の有無で多変量解析の手法を分類している。この分類法は数理的な観点である。上記では利用目的から分類したので因子分析と主成分分析は要約(次元縮小)の手法として同類としているが、因子分析は外的基準「有」で、主成分分析は「無」である。

 > 多変量解析は統計学の分野の用語であり、AIや機械学習などをはじめ、同じ手法が異なる名称で呼ばれている分野もある。

 > ビッグデータ解析で利用される機械学習あるいはディープラーニングや人工知能(AI)という用語も、内部でNNが使われている場合が多い。

 > ビッグデータ解析でも単純な段階から始めて、次第に複雑な構造の解明へと進むことが原則である。

 > 多数の変量を同時に解析する手法という意味である。

 うーん。後ろから読むと見えてくるんですけど、最初から最後まで多変量らしく扱われていないと完遂できないのが多変量解析ですよね。手順でいえば、主成分分析にかけたりディープラーニングにかけたりするときは、むやみに変数を選択せず、なるべく網羅的に用意した(※さまざまな分布の変数を含む=きっと観測対象が持つ異なる側面がそれぞれ見えている変数だから分布が異なっているのだろう)変数群からなる「じゅうぶんに多変量な多変量データ」をどかんとほうり込むべしと、こういうわけですよね。そこはむしろブラックボックスであることが「居住まいを正して札勘!」([3528])的な意味で清く正しいことなんですよね。(※現時点での私見です。)

 主成分分析に即していえば、▼同じ側面を見ていて分布も似ている(重複した)変数がたくさんあることはまったく問題でなく(「要約」されるので『変なインパクト!』が出ることもありません)、かえって▼まったく見ていない側面がある(ある側面を見ることのできる変数が1つも入っていない)ということが、きわめて致命的であると、こういうことですよね。(※見解です。)

 本当になんでも「ホワイトボックス」にしさえすればいいのかというのは、ちょっとわからなくなってきます。…えーっ!!

 従業員の採用で「子ども時代によく遊んだおもちゃを挙げてください」などと問う(その回答を採否に短絡させる)ことは、親の所得や学歴を聞くに等しいのできわめて差別的であります。しかし、採用後の職務に照らしてやっぱり聞きたいのはそこだっ(※あたへたもうっ!「器用さ」「集中力」「美的センス」「想像力」「スタミナ」など、それなりに互いに直交と思えるスキルの傾斜配分みたいなの)…というとき、間に「ブラックボックス」みたいな変数を介して間接的に聞こうなどと…うーん。(※きわめてメッソウではございます。)

・あたへたもうっ「二物」は珍しいのですよ
 https://thesaurus.weblio.jp/content/%E5%A4%A9%E3%81%8C%E4%BA%8C%E7%89%A9%E3%82%92%E4%B8%8E%E3%81%88%E3%81%9F%E3%82%82%E3%81%86%E3%81%9F

[3337]
 > > 各反射音の到来方向、時刻、強さが求まれば、到来方向は再生スピーカへの分配、時刻は遅延、強さはレベルとして DSPによる信号処理によって音場を合成することが可能となります。
 > > 再生スピーカのレイアウトや音場のシミュレーション方法(代替手段)、合成の具体的な信号処理方法などは、AVメーカー各社のノウハウとなっています。

 ま、ナニがアレかね(略)『逆算的に!』主成分分析にかけたときに所望の変数が主成分として『析出!』するように、「なんでこれを聞くのかぜんぜんわからん」みたいな変数群(逆合成みたいなの)を面接で問うて応募者を困惑させることしきり…いいのかなぁ。…いいのかなぁ!!(※見解です。)


この記事のURL https://neorail.jp/forum/?3579


(約4000字)

この記事を参照している記事


[3575]

研究ホワイトボックス(29) 多変量データの全域を考察するには〜駅弁の商品構成を例に(後編)

2017/12/3

[3637]

幕張新都心拡大地区(豊砂地区)「新駅設置」へ

2018/4/20

[3666]

【サラダ工場】「JR東海パック」(2015年12月)を「マウント富士」(1979年)ほかで読み解く(仮)【中津川温泉あり】

2018/7/28

[3687]

【三日月島】いま問う「ビュアーソフトについて」のココロ(試)【ポイント1個あり】

2019/1/1

[3707]

研究ホワイトボックス(35) 複雑なデータと「対話」するには〜郵便番号データを例に(R編)

2019/5/24


関連する記事


[3640]

研究ホワイトボックス(32) 「単元」と「難易度」を示した「総合的な教材」をつくるには tht - 2018/4/30

列車 車両 線路 発想 研究 道路 建物 国鉄 実装 観念


[3584]

研究ホワイトボックス(30) ハイパー・ゼロ:「主成分分析」FAQ tht - 2017/12/19

発想 研究 道路 国鉄 数学 主成分分析 多変量解析 散布図 クラスタリング 分散分析


[3649]

【お知らせ】ストリートビューの表示を休止します tht - 2018/5/31

列車 車両 線路 発想 研究 建物 実装 ゲーム 仮名 決定版


[3639]

【自由研究】ふわコレ(6) tht - 2018/4/30

列車 車両 線路 発想 研究 道路 建物 国鉄 実装 写真館


[3636]

Re:[3583] 或るナポリタンと停電のハフソク(則) tht - 2018/4/10

発想 研究 建物 実装 仮名 数学 キロ 主成分分析 多変量解析 岡山県


[3566]

「決定木」を1度忘れて再び「ランダムフォレスト」に至る(談) tht - 2017/11/19

発想 研究 実装 数学 キロ 主成分分析 多変量解析 散布図 相関係数 解析法


[3587]

研究ホワイトボックス(31) ハイパー・ゼロ:「主成分分析」FAQ(補遺編)〜ふれねる「スクリープロット」の崖<がい> tht - 2017/12/19

発想 研究 主成分分析 多変量解析 相関係数 変量 主成分 回帰分析 多変量データ Data


[3669]

【自由研究】ゆるシミュ(9) tht - 2018/8/16

列車 車両 線路 発想 研究 道路 実装 ゲーム ATC ジャック



話題を見つける

●多彩な方法でフォーラム内をサーチ!
●目的に合わせて使い分けよう。


2014年度以降の主な記事(スコア順)
HITSアルゴリズムを用いたブラウジングをお試しください。【詳細】


四半期ごとの主な話題
(1999年度〜最新


最近の主な話題
(2014年度〜)


キーワード (索引)
2014年度以降のキーワードや文字数の多いキーワードなどから、記事を探せます。


リファレンス (参考文献)
リンク先のタイトルをドメイン別に一覧しながら、記事および参考文献を探せます。

【自由研究】の話題
「主論文・野帳・掲示物」とは?(PDF)
【自由研究】の記事一覧(新着順)


国土地理院の空中写真 を紹介している記事
(PCでの閲覧をおすすめします)


「多変量解析実例ハンドブック」の記事一覧(新着順)
「R with Excel」の記事一覧(新着順)
(統計解析環境「R」を電卓のように使い、データの入力とグラフの保存のため「Excel」をノートのように使います。)


画像で探す
列車 | | 植物 | | 計算機 | 掲示物 | 食べもの
この記事に関連する画像





neorail.jp/は、個人が運営する非営利のウェブサイトです。広告ではありません。 All Rights Reserved. ©1999-2019, tht.