フォーラム - neorail.jp R16
発行:2019/12/1
更新:2022/5/26

[3845]

【鉄道と情報】

Re:[3583] 「動く現物」の“魔力”


試しに「ベンダーの提案すら理解できない素人だった」を斬ってみる(仮)
「左折レーン」から「くずし字」まで(談)
「ある程度は考えられる人たち」ふたたび(再)
ノエルがいっぱい(2019年版)

(約22000字)

 よくわからないかたちで続報が出ていますです。([3583],[3636]の続きです。)


 前回のおさらいです。

[3583]
 > 「データ分析コンテスト」の目的は、応募要項のあちこちに断片的に書かれている通り、「再現性」「汎用性」のある方法を(模擬)提案してほしい(=そういう提案ができるような人材が育ってほしい)ということにある…と読めました。今回のデータでたまたま評価関数がわずかによかったといって、この(評価関数でいう)1位のかたのような方法を(応募者に対する総合評価として)1位とみなしてしまうことは、きわめてアレだと…思うんですよ。(※思うだけです&恐縮です。1位そのものはおめでとうございますです。ええ。)

 > 翻って、▼「評価関数」を絶対視する(リニアに応募者の評価とする)のはアレだと、▼「評価関数」のランク分けみたいなの(「不合格」とする線引きなど=ベースラインそのものでない)をしたうえで、▼「くふう」をきちんと採点していただきたいのだと、たぶんこういうわけです。いわば、ほぼ明治大学「5つの評価項目」([3564])みたいなのそのまま、「小論文」が「データ分析」に代わっても同じように「採点」してほしいと、そういうわけです。

 > 「Cross-validation」って、(この並びでいう)「解析手法!」なんですかっ!!(棒読み)ふーん。ほー。へー…
 > 「Cross-validation」って、(この並びでいう)「解析手法!」なんですかっ!!(棒読み)ふーん。ほー。へー…

 > > 本研究では,着雪量を精度よく予測するために

 > じゃあ「精度」の定義が出てくるかといって…ギクッ。

 > > 二乗平均誤差が小さい方が予測精度は高いため

 > うーん。(明示的に)クロスバリデーションはしていない(※)ということです。「精度」というからには、着雪量の推定値はしかじか、そこを「雪落とし作業」が「必要」「不要」の「2水準!」みたいにして、そのあたりはずれで「TP」「FP」「TN」「FN」を見ていくんだというイメージが浮かびますけど、そうではなくて「比例関係」で「相関係数」だということなんですよ。ふーん。ほー。へー…

 そういう見かたをしていました。(※過去形)

 見て思ったことを隠さずに列挙して、あとから「そういうことではないな」「このときはあれが見えていなかったからそう見えたんだな」みたいに『吟味!』できればと思いますが、たぶん書いたきりほったらかしになるだろうということをあらかじめご了承ください。このフォーラムに何か書いてあっても何も気にする必要はないということです。


★試しに「ベンダーの提案すら理解できない素人だった」を斬ってみる(仮)


・「JR西日本「ベンダーの提案すら理解できない素人だった」新幹線の“着雪量予測”データサイエンスコンペ開催までの「奮闘」」(2019年11月28日)
 https://ledge.ai/jr-west-data-science-competition/

 ほぅ。このフォーラムで鉄道工学を教養として学ぼうというときにリファレンスとしている「図説 鉄道工学」の天野センセイのほうなど思い浮かべながら(大巾に中略)なんとなく京都のほうで土木システム工学の(略)じぶんを「素人」と言い切ってみせるのはとんでもない態度だ。そんなレヴェルでは入れない大学の研究室にいたと思しき人が何をおっしゃる。いえね、標準語と方言のハザマで何か誤訳が起きているんですよ。あなたのいう「素人」に、東京の人が受け取るニュアンスはないのでしょう。本当でしょうか。

※そういう研究室なのでゼネラリストを養成しているんですよ。じぶんはスペシャリストじゃないし、ましてやエンジニアじゃないから、いきなりAIの実装のキーテクノロジーみたいなのをぽんぽん出されても興味ない…いえ、ゼネラリストとして判断する材料がほしいのだが…(てんてんてん)見たいのはそこ(AIにまつわるきらきらエトセトラのフレンズ!)じゃない、つまり話が通じない(使っている言葉が違う!)、というきわめて実務的なことだけを言いたかったのだろうと推定。

 > 「前部署に在籍していたときから車両の着雪量を調べたりしていたため、AIプロジェクトを開始するために必要なデータがあるのは分かっていました。コンペが開催できるギリギリのデータ量でしたね」

※学位が不明で、鉄道総研に行ってから戻ってきたとかそういうことも記事中で明らかでない。なんともいえない。

 データの質は考えていないと公言したことになる(=入試でいえば「正解がない」という出題ミスをしていないかをチェックしていない(するわけないじゃん、めんどくさい)と開き直るような、ありえない態度である=)けれど、そういうことでよかったのでしょうか。(※見解です。)まさか本気でそのまま現場で使うつもりのものをコンペで出題していたとは思わなかった。あんなのは例題で、例題としてもできのわるいものだと思っていた。わるぎはなかった。(※恐縮です。)▼全国大学入学者選抜研究連絡協議会ほか「合否入替り率」については[3542]を参照。

 > 「ベンダーの提案すら理解できない素人だった」

 コンペで出題する立場になるには博士号が必須だと理解しています。大学入試でもTOEIC®でも当然の態勢です。▼「各テストに数人のPh.Dが専属」については[3345]、それに▼「ビデオリサーチ@東芝さん納めの電子計算機」については[3395]、▼「東芝の事実上のAI」については[3676]を参照。

 > そもそもデータ戦略・CBM専任グループ発足時、グループ内にデータサイエンス分野の知見・経験はまったくなかった。そのため、ブレーンとしての社外の分析ベンダーの選定を開始した**さん。
 > しかし、ベンダー各社のプレゼンを聞いただけでは、選定が難しかったという。

 「AI」とは言っていなくても東芝なら大丈夫。「AI」と呼ぶことにこだわると変なベンダーがわいてくる。これだね。昔から冷蔵庫か住宅をつくっていて結露に詳しいメーカーをグループに持つベンダーがいい。プラントに詳しいベンダーでもいい。そして、ある程度の範囲ならどのベンダーでもいい。「いちばんいいのをたのむ(きらっ」みたいな恥ずかしいことは言わないに限る。…なるほどねぇ。(※見解です。)▼「茨城県に立地しさえすれば井戸水くみホーダイ」については[3224]を参照。

 > そのほか、共同研究という名目で大学教授などにアプローチするも、スピード感が折り合わなかった。

 > **さんの大学時代の研究室の同級生が

 うわぁエンタープライズ検索とも呼ばれる事実上の人見知り。例えば統数研に「助言をもらう」というかたちで情報収集することもできるところ(※統数研ではそういうのを受け付けています&鉄道総研も統数研から助言を受けています)、統数研かどうかはわかりませんけれどどこかアカデミックなところでいきなり共同研究を持ちかけて警戒された(それ、警戒されてるんですよ)こともわからず「相手のスピード感が足りない」とけなしてみせる。…なんだかなぁ。

 > 「ベンダーには、匿名アカウントを作ってもらいコンペに参加してもらいました。社内にも参加募集の告知を行い、結果的に社内外含め400人ほどが参加してくれましたね」

 そういうことになっていたんですね。(棒読み)

 > コンペに参加したベンダーはモデルの精度が低かったわけではなく、実際に上位入賞もしていた。

 コンペがちゃんとできていたかどうか(参加者の能力を測る能力)をじぶんたちではまったく疑っていないところが落とし穴なんですよ。そのうち落ちますよ。(※個人の感想です。)

 https://signate.jp/competitions/58/leaderboard

 「確定順位」が出ているけれど、スコアだけ見れば2位だったひとは何らかの不備で失格にされておられる。しかし、そのような不備のあるような参加者ですら(スコアでは)2位になれてしまうスコアは、スコアとしていかがなものかね。ほとんど“占い”のレヴェルではないのかね。…ギクッ。

 https://s3-ap-northeast-1.amazonaws.com/ledge-assets/media/wp-content/uploads/2019/11/26123413/image12.jpg

 そういうフォーマットを埋めてみせるだけではいけない。▼「フォーマットを埋めればよいと、かえって考えなくなってしまう」については[3125]を参照。どんなにスピード感が違うと感じても、大学の教員や鉄道総研の人や博士号を持つ人を監督役に据える(誰が監督役なのか常に明示する)ことなく勝手なことをしてはいけません。監督役が同席せず1人でインタビューに応じてはなりません。…JRなんですから!

※スピード感が違うのは、見ているスパンが違うからで、あなたがたとは違うものを見ているということです。それが教員や上司というものです。


★「左折レーン」から「くずし字」まで(談)


[3399]
 > 「ちょっと左折レーンを増やしてみよっか」
 > 「ちょっと左折レーンを増やしてみよっか」

 秋山センセイとも金八先生ともつかない風貌でオネガイシマス。(違)

[3583]
 > たとえば、きみが北陸先端大へ行くとする。いろんな乗りものや道すじがある。

 > 偏見かもですけど、北陸先端大で3年目くらいのひとみたいなひとに「地の利!」みたいなのがありそうな分析課題に思えてきそうです。さあさあ金沢駅にマイカーを乗り付けて入場券を2時間おきに1枚お求めになって&駅員さん駅員さんいぶかしげ! 上から下までジロリ(中略)実物を1度も見ずに予測モデルだけいじるというのも、なんだかなぁ。

 https://www.jaist.ac.jp/areas/ee/

 北陸先端大だけ名指し…げふ! 開催地が大阪でもテーマは金沢にあるんですから名指しするなら北陸先端大をおいてほかにないと思った。わるぎはなかった。(※見解です。)そこらの大学をじぶんたちより『