フォーラム - neorail.jp R16

いま問うA9のココロ
信号機のG現示の色がこんなにメロンソーダなわけがない
ATC・ATSの「Aの字」も出さずに効果音と動作を実装するには
「場内信号機 作り方」「信号機に名前をつける機能」とは


発行:2017/12/3
更新:2018/5/22

[3571]

【実例に見る日英対訳】

実例に見る日英対訳(17) 「ランダムフォーレスト」に野生はあふれ


うしろから読む「ティップスせんせい」
※「シルエット」はフランス語です
よくわかる現代「統計B」への射程(仮)
【ごはんの隣にフルーツ】キッコーマン「テリヤキ」ほかを読み解く(談)【いわゆるひとつのバリアシオン】
【船橋】いま問う「「累積ハザード紙」を『買物カゴへ』」のココロ(談)【東広島】
【計算機統計学】「データ要約」とは何か【DBSCAN】
「レベル集合ツリー」から「ランダムフォーレスト」まで

(約45000字)

 つっ、ついにこのボタンを([3106])…じゃなくて、およそ1年11か月ぶりに「英語で数学」([3152])ですよ。万博記念公園「やったねの木」については[3566]を参照。(※本文とは無関係です。)「実例に見る日英対訳」と題した一連の記事は「ビバ! クールなジャパンの「お・も・て・な・し」(Omotenashi)。日本語とニッポンのフシギを堪能します。」とのことで、▼全体としては「統計B(応用統計)」のような内容を英語で(も)読みながら、▼なぜか太宰府天満宮の茶店のおしながきのほうなど眺めます。…わけがわからないよとはこのことだよ。(※ほとんどの表現は演出であり、すべての演出は表現です。)

[3106]
 > ぬおー、はかせー! (悪役の)はかせー! 「つっ、ついに『このカギ』を使うときが来たようだなっ! ごっこ」ができそうです。(感想は個人です。)

[3152]
 > 「数学版 これを英語で言えますか?―Let's speak mathematics! (ブルーバックス)」
 > 「うだつにあがって逃げきる」(make it through the last day of the year)

・はいふれっ! …ヤマハ発動機です
 https://www.yamaha-motor.co.jp/marine/history/boat/index.html

 > ハイフレックス船型の出発点は、「乗って楽しいフィーリング」であった。海でボートに乗る楽しさを引き出すために、FRPシェル構造のメリットを十分に活かし、船底の断面形状を滑らかで美しい曲面とした。また全幅を1.5mに抑えてトレーラー対応としながらも、走行性能は群を抜いて高く、そのシャープな動きを目にした川上社長がハイフレキシビリティの意味を込め「ハイフレックス」と命名。

 …コレジャナイ。いまひらがなで「のってたのしい」などと(略)FRPではあるけどね。

・「あふれ領域」はあふれ
 https://www.weblio.jp/content/%E3%81%82%E3%81%B5%E3%82%8C%E9%A0%98%E5%9F%9F

 > あふれ領域をあらかじめ作成しておくことで、ファイルが満杯になってもシステムが停止してしまうようなトラブルを防ぐことができる。

 はあふれっ…これでもないような気がするよ。(※演出は表現です。)

・アメリカ版「キッズコーナー」とはにわ!!
 https://sendai-eigo.com/nagamachi-eikaiwa/3127-2/

 > 下の図を見て下さい。

 https://sendai-eigo.com/nagamachi-eikaiwa/wp-content/uploads/2016/03/shape.jpg

 わあぃ…ざっくりざっくり!

・なんとタイヤ館「レストコーナー」のイメージです
 https://www.taiyakan.co.jp/shop/kawanishi/diary/435191/

 (大昔の)例規集みたいなのに「コーナー」と書いてあると(例規集みたいなのが改訂されるまでは)「コーナー」としか書けないお役所みたいなの(中略)お役所と同じく「コーナー」と呼びさえすればいいなどと…なんだかなぁ。「センター」については[2959]を参照。なぜ「コーナー」と(新しい施設でも)命名され続けるのかというところをですね(略)…なんだかなぁ!


★うしろから読む「ティップスせんせい」


 食べる前に飲む! 本は後ろから読む!([3199])…わあぃターャジス。この記事も例外ではなく「『ランダムフォーレスト』ってなによ@何なのよっ!!」というときは後ろから読む! これだね。

※現在、一部のブラウザ(くぁんたむなどと称するキツネ)で、シフトJISの文字列を含むページ内アンカーが機能しない不具合があるようです。57.0.1でも直ってません…なんだかなぁ。翻って、そこまで基本的な(すでに「よく枯れて」いるはずの)機能で新しく不具合が出るくらい、全面的に刷新されたのだということはよくわかりました。(棒読み)

※2018年2月4日に追記:58.0.1で直りました。

[3435]
 > 枝幸町(合併前の歌登町)「なーるほど歌登」より「おいしいロール牧草の作り方」をご覧いただきます

 > > サイレージは、空気を嫌う乳酸発酵によって作るため、含水率や空気の遮断に注意しなければなりません。一方、乾牧草に比べてタンパク質などの栄養価が高く、牛も喜んで食べるというメリットがあります。ラッピング後最短1ヶ月ほどで乳酸発酵が完了し食べさせることができるようになり、おいしい牛乳の基となります。

[3403]
 > 農業・食品産業技術総合研究機構「歩走行」(2004年)から富士通「とりあえず再起動する」を経て角川つばさ文庫「いみちぇん!」に至るルート

 > いつかどこかで関連が出てくるのではないかといって、統計っぽい話題を集めておきました! いまは脈絡がないように思えても、そのうち関連が浮かび上がってくるかもですよ。本当でしょうか。
 > じぶんが統計をきちんと読めているのだろうかと確かめたければ、じぶんが専門ではない分野の統計やデータや図表を眺めるのが好適であろうと、こういうわけでウシです。

・おしえて! ティップスせんせい(※実際のサイト名とは異なります)
 http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html

 > 入門篇 第01〜11節
 > ベクトル篇 第12〜18節
 > 行列・配列・リスト篇 第19〜26節
 > 関数とプログラミング篇 第27〜36節
 > 数値計算篇 第37・38節
 > データフレーム篇 第39〜46節
 > グラフィックス篇 第47〜58節
 > 統計解析篇 第59〜74節

 > 第74節 その他の分析方法の紹介

 ティップスせんせいが誇る『74分の74』(※最終の節)にして「因子分析」「正準相関分析」「判別分析」「主成分分析」「クラスター分析」「回帰ツリー」「時系列解析」「生存時間解析」「ノンパラメトリック回帰」を大急ぎで俯瞰してからの「別稿に譲る」状態となっています。(連続量[3399]でないという意味で)量的でない変数(しかしカテゴリカルなままでは扱いにくいので何らかの数量化[3500]を経た「量的な質的変数」みたいなの)にかこまれて(大巾に中略)主成分分析(とも呼ばれる行列の固有値分解[3566])を使わねば何も考察できまいてみたいな状況下から勉強を開始せざるを得ない現代のわたしたち、第01節から第73節までの『積み上げの上!』に第74節があるのではなくて、最初から第74節を勉強しないといけないのですよ。

・本来の「ティップス先生」はこちらです(2001年4月)
 http://www.tamagawa-up.jp/book/b27767.html

・別稿ございます付近
 http://cse.naro.affrc.go.jp/takezawa/index2.html

 こう、クラスタリングにはあまりアレかと…いえいえいえ、ありますよ。クラスタリング。

 > 2012年 12月
 > Effective FCM noise clustering algorithms in medical images. Computers in Biology and Medicine

 http://www.sciencedirect.com/science/article/pii/S0010482512001667

 > Keywords
 >  Noise clustering
 >  Entropy FCM
 >  Medical images
 >  Segmentation

 > Abstract

 > The main motivation of this paper is to introduce a class of robust non-Euclidean distance measures for the original data space to derive new objective function and thus clustering the non-Euclidean structures in data to enhance the robustness of the original clustering algorithms to reduce noise and outliers.

 ええーっ!!(棒読み)『出だしの冒頭!』から『1文が長い』みたいな『イントロと呼ばれる導入部』みたいなのキターっ。

※(英語で書く)論文の「イントロのうまいへた」については[3102]を参照。

 > The new objective functions of proposed algorithms are realized by incorporating the noise clustering concept into the entropy based fuzzy C-means algorithm with suitable noise distance which is employed to take the information about noisy data in the clustering process.

 つまり、ファジィC-meansなんですね、わかります。

 > This paper presents initial cluster prototypes using prototype initialization method, so that this work tries to obtain the final result with less number of iterations.

 「いわゆる初期値問題」を解いてみせるぜ★やあやあ的な、いつかどこかでk-meansの「(自称)改良型!」みたいなのが乱立したみたいなのを、いまファジィC-meansでやろうと、たぶんこういうわけです。(※いえ、それが大事なんですよ。)

 > Gaussian noise
 > the proposed algorithms perform significantly better than the standard existing algorithms.

 比べる相手が素朴すぎるとかって、よくありますよね。…ギクッ。

 > The accurate classification percentage of the proposed fuzzy C-means segmentation method is obtained using silhouette validity index.

※silhouette:シルエット。なぜにフランス語だし。…なぜにフランス語だし!

 なるほどさすがに2012年にもなって、クラスタリングをやるんだというおかたがおみえになれば(あるいはテーマが持ち込まれれば)センセイ、指導(や共著)なさるけれども、ごじぶんではクラスタリングは…本当でしょうか。(※一般的な推察のほうになります!)


★※「シルエット」はフランス語です


・Wikipedia「Silhouette (clustering)」のイメージです
 https://en.wikipedia.org/wiki/Silhouette_(clustering)
 https://upload.wikimedia.org/wikipedia/commons/f/fd/Silhouette-plot-orange.png

※mammal:哺にゅう類。porpoise:ネズミイルカ(港のイルカ)。

 > The silhouette value is a measure of how similar an object is to its own cluster (cohesion) compared to other clusters (separation). The silhouette ranges from −1 to +1, where a high value indicates that the object is well matched to its own cluster and poorly matched to neighboring clusters.

・まるっと「ネズミイルカ」のシルエットです
 https://upload.wikimedia.org/wikipedia/commons/b/bd/Harbour_porpoise_size.svg

 われわれはさっそく材木座(中略)実在したっ!! …じゃなくて、我々にむかって直進してくる「あのシルエット!」におびえながら…よかったネズミイルカですかい。(※シルエットのイメージをストレートに表現しています。)

・「ネズミイルカ」とはにわが知りたい
 https://kotobank.jp/word/%E3%83%8D%E3%82%BA%E3%83%9F%E3%82%A4%E3%83%AB%E3%82%AB-111278

 > 背部および体側は藍ねずみ色
 > 胸部はややねずみ色
 > 胸鰭上面は藍ねずみ色で,口角に向って同色の細い帯が伸びる。

 > なだらかな細長い楕円形
 > なだらかな細長い楕円形

 > 分類上、ネズミイルカ科(ネズミイルカ属、イシイルカ属、スナメリ属の3属を含む)を科として独立させず、マイルカ科に含める場合もある。

・Google ストリートビュー 鎌倉市材木座付近(※本文とは無関係です)
 https://goo.gl/maps/aDYa7vHMAMK2
 https://goo.gl/maps/obsV9BtP4vD2
 https://goo.gl/maps/h1DWysnzF2P2
 https://goo.gl/maps/FzDd46UtGUx
 https://goo.gl/maps/SZXnGm7XaD92
 https://goo.gl/maps/ifJ7bPzfziG2
 https://goo.gl/maps/H3fQyUQLh4w
 https://goo.gl/maps/E7BZTZ54qgP2
 https://goo.gl/maps/eHbyBhPUgZE2

 ここで思い出したように英語の話題のほうなど(前略)81っ! 最近のコズミックフロントの吹き替え(81っ!)でジョージ博士「(吹き替え&字幕)ここが農業センターね」といいながら運転するクルマで我々「農業センター」(アリゾナ大学)を訪れて(「(英語)…a lot of sheep... umm,」)「(吹き替え&字幕)たくさんの羊がいる」「(同)私が思っていたのとは/ちょっと違うんだけど」といいながら構内の一角に止めたクルマを降り、さっそくウシを引いた人とすれ違いながら「(英語)はろぅ!!」そして「(吹き替え&字幕)西部開拓地へようこそ!」に答えていわく「(英語)わあぃワイルドがいっぱい!」(※あくまで雰囲気です)との発話を「(吹き替え&字幕)野生があふれてて すばらしいわ!」などと…えーっ。圃場みたいなのを思い浮かべていたらヒツジやウシなどの家畜が(手が届くくらい近いところに)たくさんいたので(=においもするので)「動物もいるのね!(あなたかわいいわ)」みたいな(略)ですよね。「千葉市乳牛育成牧場」については[3548] を参照。…なんだかなぁ。『「実は具体的な予想などしていなかった」のに「札幌の時計台よりがっかり」』みたいなのについては[3403]を参照。ひいては(中略)宇宙飛行士の模擬面接みたいなの! 「ここ(履歴書)には書いてないけど小規模な○○の体験もあるわ!」…アピールいただいてアリガトウ。もういいわ。(※感想には個人差がございます!)

・「wild」とはにわが知りたい
 https://ejje.weblio.jp/content/wild

 > 〈鳥獣・草木など〉野生の,野育ちの
 > 〈獣・鳥など〉人慣れしない,暴れる.
 > 彼女はひどく彼に会いたがっている.
 > 《口語》 楽しい,愉快な,すてきな.

 うーん…「ひどく」は書き言葉であって、しかも大昔の「いかにもな翻訳調」([3393],[3403])ではあるのですけれど、いやいやいや。むしろ上述の発話のニュアンスにいちばん近いのはこれかもですぞ。現代の水準で新規わたしたち、仮には「実際、彼はひどくうまくやっていた。その時までは。(傍点訳者)」…じゃなくて、「彼に会いたいという気持ちを、彼女はまったく隠そうとはしなかった。」などと訳してみようではありませんか。うん、それを仮訳というのですよ。(棒読み)

・Google ストリートビュー 「わあぃワイルドがいっぱい!」付近
 https://goo.gl/maps/rm5XqxBR4bt
 https://goo.gl/maps/QWmhrboQVFu

 「農業センター」で飼われているおとなしいヒツジやウシなどの家畜を指して「(英語)わあぃワイルドがいっぱい!」などと(気持ちを何も隠さずに)発話しちゃうジョージ博士もたいがいなんですけど(大巾に中略)辞書を引きさえすれば吹き替えできるなどと…たぶんとんでもない。「(英語)わあぃワイルドがいっぱい!」との発話にあって、しかし「ここには『愉快なひとたち』(※家畜です)がいるのね!」などと吹き替えれば嫌味に聞こえてくるなどの…むずかしいことよのう。

[3403]
 > ピジン言語のよくわからない感じを日本語で無理に表現すれば「それが言語だというのですね。」くらいかなぁとの想像にございます。日本語で「それが言語だというのですね。」といわれましてもですね(略)まったく意味やニュアンスがわからないことがわかります。「教科書がきちんと読めない」⇒『書いてあることは読めるけれども意味がわからない』([3327])って、こうですか? わかりませーん。

 > 「お伽小説 悪戯な小兎」は日本語の質が高そうだと思うのですが、その後の『各種「ピーターうさぎ」ございます!(※定本と呼ばれるには至らなかった)』にあって、オトナが小手先で試行錯誤するような、こんなの(※)、どう訳せばいいんじゃい、というあたり、翻訳者が『いかにもな翻訳調!』という一種「ピジン言語的なもの」の「母語話者」になっていなかった時代なんだとわかります。その後の世代の翻訳者は、じぶんが子どものうちに翻訳文学に親しんで育ったのですから、これはもう比べようがないほど豊かに、母語として「翻訳調!」を使いこなせるというわけです。(※やーい独自研究@誰によって?)

・「傍点訳者」を辞書で引く時代が来るとは思ってもみなかったよ付近(※キャプションは演出です)
 https://ejje.weblio.jp/content/%E5%82%8D%E7%82%B9%E8%A8%B3%E8%80%85

[3540] 船橋市からのお願いです
 > > ビャクシン類も緑には違いなく、しかも常緑樹で公害に強い木として庭木やかき根として好まれています。
 > > ビャクシン類の抜き取り、別の種類との植え替え、さらにビャクシン類を植えないよう市民の皆さんのご協力をお願いします。

 > わたしも素人ですけど、(いまの)わたしから見ても、『昔の素人!』が何をどう考えちゃって(=いわゆる「素人理論と呼ばれるセオリーみたいなの」をこしらえちゃって)『公害に強い木!』などと(略)…理解に苦しむなぁ。(棒読み)

 > 船橋市内の大きな道路や工場の近く、それに東京湾のほうなど間近に眺めながら我々『このへんは公害がひどくって』との決まり文句をあいさつ代わりにしながら『公害に強い木!』を植えさえすれば公害というものを乗り越えたかのような錯覚のほうなど…昔の人って、やあねぇ。(棒読み)

 > 「原形質膜の機能からみた植物のアルミニウム障害及び耐性機構に関する研究」(1993〜1994年度)のセンセイが回答されています。メカニズムも考えずにpHの値だけ見て酸性だのと…がびーん。(※がびーんはイメージです。)

[3350]
 > 日本語でもできていないことが外国語でできるわけがない([3048])とは、このことです。仮に「CEFR」の枠組み([3061])で言語運用能力を評価する「セカイ観」が日本にも導入されたとしますと、日本語の母語話者がじぶんの言語運用能力を過大評価している(これまで合理的な方法で評価したことがなかった※)、もっともらしく日本語を並べてはいるが、まったく体系的な言語運用能力には至っていない人(議論できない、意見をいえないなど含む[3132])が、驚くほど多いかもしれない(「考えない人」[3125]が大多数である)ということが一種『再発見』されていくのだろうと予想します。(あくまで予想ですが見解です。)

 「これは私の意見なんですが」などと(略)それを意見というんですよ。かといって「私見」だとことわりさえすれば何をいってもいいなどということもまたあるわけないのですよ。

[3126]
 > > ドーロムービー
 > > まわり道どころじゃないぞ!

[3350]
 > > ロードムービー(road movie)は、映画のジャンルである。(略)ストーリーの結末は曖昧な作品も多い。
 > > 1960年代から1970年代にかけて、数多くのロードムービーが制作されている。

 > ロードムービーを観て自動車が欲しくなる、既に持っていれば旅に出たくなるといって、うーん。映画が不満だらけであればあるほど、何かが「じゃっ起」されるんではないですかねぇ。

 > 意図的にアレなつくりをしていたロードムービー(初代)を見て、「こんなの、じぶんだってつくれるもん☆」といいながらつくってみて、「素」でもっとアレになったのがロードムービー(2代)でしょ、などと、後年、ロードムービーと呼ばれたジャンルが確立していった過程を想像しながらのうのうと(もっと略)。それをぜんぶわかってなお「わあぃロードムービー!(わあぃお約束キター!)」といって楽しむのが3代目ですよぉ。「BBCプロムス」([3312])も参照。15年以上あれば、3代目まで進みますってば。

 (質的な意味での)『3代目』でだいたい終わる(※廃れるということでなく、それ以上の変化が起きない『さい終けい態!』[3401]、の意)のは、3代目の行動の特徴がまったくスクリプトじみていて(仮にドーロムービーでいえば、その内容にはまったく無関心で、ドーロムービーとカテゴライズされた映画を遠い目で見るニヒルなじぶんかっけー…げふ)、そこから新しい楽しみかたなどを見出していけなくなるからですよ。(※『私見』です! …こういうのを「私見」というのですよ、の意。)


★よくわかる現代「統計B」への射程(仮)


・(再掲)日経リサーチ「主成分分析」
 https://www.nikkei-r.co.jp/glossary/id=1632

 > 線形代数における固有値問題は高校数学では学ばない。大学においても理科系では1年生で学ぶが、文科系では数学を使う分野(計量経済学など)を除いて学ぶ機会がない。そのため主成分分析を固有値問題として説明されると、理解が困難な人が多い。

 > しかし、主成分分析を理解し、データ分析で利用するためには、必ずしも固有値問題を数学的に理解していなくてもよい。

 それは「理解」したうちに入るのかどうか疑問ですぞ。厳密に「数学で理解」(※いつでも自力で所定の式を導出してみせることができるレヴェル!)しないのを「数学的」(※「的」に傍点)にのみ理解する(※数学的操作の手順とその目的のみ承知している)というのですよ。…その発想はなかった!(いえ、ありますってば。)少なくとも「数学的」(※「的」に傍点)には「(行列の固有値分解という数学上の操作を)理解」しないと始まりませんですとも。ええ。(※個人のお客さまの感想です。)

 > また、固有値問題を知って