フォーラム - neorail.jp R16

「A列車 色がおかしい」を越えて進もう


2020年5月の話題
更新:2020/9/6

[4080]

【A9R:データで遊ぶA列車】

「照焼大橋」不滅なれ(かりかり編)


「R with Excel」(たぷりす)
「R with Excel」(たぷりすがいっぱい)

(約9000字)

 …足りん! なにかが足りんっ!!(※表現は演出です。)

[3988]
 > いでよ! テリヤキサーモンスシボウル!! 217およよ。

[4074]
 > バナナピーマンがたおせない。

 https://tomi.co.nz/wp-content/uploads/Teriyaki-Chciken-Don-IMG_3724.jpg

 テリヤキチキンライスボウル。3724およよ。

 https://tomi.co.nz/wp-content/uploads/Crumbed-Chicken-_-Prawn-Set-DSC_0190-grey.jpg

 チキン海老定食。190およよ。…なにこのテリヤキサーモンスシボウルよりよわっちいの。

 https://img04.ti-da.net/usr/u/r/o/urotanke0214/20181026sk5k.JPG
 https://img04.ti-da.net/usr/u/r/o/urotanke0214/20181110sk3k.JPG

 じゃがりこ。4901330576592…測定不能およよ!!(違)

 https://www.kyounoryouri.jp/recipe/10242_%E7%85%A7%E3%82%8A%E7%84%BC%E3%81%8D%E3%83%81%E3%82%AD%E3%83%B3%E3%83%A9%E3%82%A4%E3%82%B9%E5%BC%81%E5%BD%93.html

 > 照り焼きチキンライス弁当

 すんません、もっかいプリーズっす。

 > 鶏肉に甘辛いあじをつけた和風のチキンライス。

 へー…

 https://blogimg.goo.ne.jp/user_image/5c/c2/f28471a7de6834214816b6e07203eb46.jpg

 チキンライスと照り焼きハンバーグ。…テリヤキハンバーグ・オン・ザ・チキンライス???(※平板読みで1単語ずつ疑問形で!)

 http://www.gs.niigata-u.ac.jp/~kimlab/hobby/conv-dechex.html

 「f28471a7de6834214816b6e07203eb46」は…「3.2236086337749626e+38」およよ!

 https://ja.wikipedia.org/wiki/%E6%BE%97

 「およそ322澗およよ」ですな。本当ですな。(※白目)

 > インターネットで用いられる次世代の規格のIPv6では、IPアドレスの数は約340澗個ある。
 > MD5のハッシュキーの長さは、2128(340澗)である。

 テリヤキハンバーグ・オン・ザ・チキンライス(???)の画像1枚で「およそ322澗およよ」もあったとは知る由もなかった。(棒読み)

 > %f2%84%71%a7%de%68%34%21%48%16%b6%e0%72%03%eb%46

 文字コードがわからん。(※ソウジャナイ。)このあと「チキン酢豚」と「肉なし酢豚」のバーコードを読み取らせて大げさに驚いてみせる遊びにつきあってあげてください。(棒読み)

※表現は演出です。


 [4069],[4071],[4072],[4073],[4074],[4075],[4077],[4078],[4079]の続きです。

[3539]
 > 名前をつけてかわいがり…すべてのキホンだよね。

[3540]
 > 橋りょうに名前をつけてかわいがり…じゃなくて、「シャソウ!」モードで「○○橋りょう」とかいう表示を紀行番組みたいに出して見せる、そのくらいはユーザーに手間をかけさせず、ゲームの機能だけでできてもいいのかもですよ。

[3652]
 > …名前をつけてかわいがるとは、おぬしかわいいところがあるのう([3544])。

[3636]
 > MDSみたいなので散布図を1枚だけ眺めて「印象を述べ」るだけで何か的な結論しちゃってた残念な上の世代を“白い目”で見上げながら(…そういうのを「ジト目」というんですけど)だまって散布図行列にしてみせる(※あたしのほうがおねーさんなのよ)

[3581]
 > 「印象とはにわ!!(※意訳:印象の定義を教えてくださるかしら)」

 https://news.1242.com/wp-content/uploads/2017/11/Periodo_kofun_haniwa_figure_danzanti_VI_sec1.jpg

 何か言いたそうに口を半開きにして右手と左手をちぐはぐにひらひらしてみせるようす。うつりこむ非常口。ぼくらは常に非常口を求めていた。これがのちに七日間なんとかと呼ばれることになる一連の×争の始まりである。(違)

※余計なことを言ったばかりに7日分の仕事が増えちゃったよみたいな顔で! …なんかうれしそーなんですけど。

 https://sakitama-muse.spec.ed.jp/wysiwyg/image/download/1/200/big

 …わたしのほーからせつめーはいじょーですー(なにかー&はいそこー)みたいな顔!(※恐縮です。)

 > > 評価に影響すると思われる要因の抽出
 > > 刺激と各要因のカテゴリーとの対応づけは,スタッフ4人が個別に視感でおこなった結果を調整して決めた(表2).

 > うーん。…うーん! あえていおう(略)この「表2」がくせものですぜ@であえであえーっ。

 「視感」でとらえた「印象」とやらを「言葉で述べる」だけではいけない。

・(1)そのクラスターの重心には橋を架けるべきか
・(2)その橋は「架空のなんとか大橋」と位置づけるべき橋か

 V4にクラスター番号をつけてsubsetしてから要約統計量を出すということで…どですか?(にやり

[3716]
 > > ダイヤアルゴリズム。

 > もはや「アルゴリズム!(しゃきーん」みたいな決め台詞である。体言止めである。ニュース7でありクローズアップ現代である。

 > > 乗客のアルゴリズムを修正して目的を持って乗降するようにするなどしてくれた方が良かった。

 > いきなり「トリップの目的を持って移動!」という最難関コース(メモリの無駄遣い!)を期待しちゃう
 > トリップの目的が云々というのは(現実の)調査で使う考えかたであって、ゲーム内で模擬するのは(目的が見えない)トリップのほうだけでいいんですよ。
 > 本件ゲームでいう「産業構成比」(や、それに対応する建物の種類ごとの「時間帯別乗客発生率」)が「目的」ではあるけれど…(てんてんてん)。

 > TTDとも呼ばれる某ゲームの乗客が「目的地(着駅)」をもってトリップすることを念頭にしているかたも多いとは思いますが、しかし、日本語で「目的地」と「目的」が1字違いだからといってこの2つ(デスティネーションとパーパス! うわぁカタカナでしつれいしましたっ)を混同するのはとんでもないことですぞ。TTDとも呼ばれる某ゲームの乗客は「トリップの目的」(通勤とか通学とか買い物とか)はもっていないんですよ。人口だけ見て多いところには人が集まるはずだみたいな確率を与えているんでしょ。ソースコードは見ていないけどきっとそうに違いない!(棒読み)

 もういちどいいましょうか。

 > 日本語で「目的地」と「目的」が1字違いだからといってこの2つ(デスティネーションとパーパス! うわぁカタカナでしつれいしましたっ)を混同するのはとんでもない
 > 日本語で「目的地」と「目的」が1字違いだからといってこの2つ(デスティネーションとパーパス! うわぁカタカナでしつれいしましたっ)を混同するのはとんでもない

・「※空港・滑走路での撮影は特別に許可を得て撮影をしております。」とのこと
 https://youtu.be/zGQ8x13QPSk?t=17




 「※空港・滑走路での撮影は特別に許可を得て撮影をしております。」に2回出てくる「撮影」は英語では別の単語ではあるまいか。…ギクッ。

・「R with Excel」(考え中)

4列目にクラスター番号を追加したデータフレームを作成myakari3dn0clust <- cbind(myakari3dn0, mykmakari9n0c3$cluster)
colnames(myakari3dn0clust) <- c("V1", "V2", "V3", "V4")
# 4列目の列名を「V4」にしておく
クラスター番号ごとに要約統計量を表示# ???


 http://gabdro.com/images/story/011/p_005.jpg

 なにがかなしくて「R」で「GROUP BY」みたいなことをしないといけないのか。…まあまあ。(※あきらめたような顔で!)

・…せんせー!
 http://cse.naro.affrc.go.jp/takezawa/r-tips/r/24.html

 > 関数 apply() ファミリーには apply(), mapply(), lapply(), sapply(), tapply() が用意されている.一つの関数を複数のオブジェクトに適用して得られた結果をベクトルや行列,リストとして一括で返す.例えば m × n 行列 X の全ての要素に 1 を足す場合,R では繰り返し文 (for や while) を使わなくても X <- X+1 で手軽かつ高速に実現できるが,この apply() ファミリーに属する関数の機能もこれに似ている.すなわち,C や JAVA ならば複数オブジェクトを個別に与えて繰り返し文で回さなければいけないような場面でも,apply() ファミリーの関数を使えば簡潔な記述で高速に計算できる場面が出てくるということである.

 「R」を『らしく』使おう。ANA。(違)

※われわれ575の国から(げふ)どんな句にも「ANA。」とつければ締まる!(ぐぇ)「村田製作所。」(※巻き舌)でもいいぞ。

 > グループ化されたデータの処理でよく使う関数が tapply() である.最初はとっつきにくいが,カテゴリカルデータを扱うは結構役に立つ.

 https://stackoverflow.com/questions/9847054/how-to-get-summary-statistics-by-group

 > tapply(df$dt, df$group, summary)

 たぷりす殿! 最初はとっつきにくいが扱いやすくて役に立つ。(違)

■「R with Excel」(たぷりす)

クラスター番号ごとにV1の要約統計量を表示tapply(myakari3dn0$V1, mykmakari9n0c3$cluster, summary)
クラスター番号ごとにV2の要約統計量を表示tapply(myakari3dn0$V2, mykmakari9n0c3$cluster, summary)
クラスター番号ごとにV3の要約統計量を表示tapply(myakari3dn0$V3, mykmakari9n0c3$cluster, summary)


 あらかじめcbindしてからsubsetしようみたいなSQLちっくな発想でもできるけれど、このほうが断然『らしい』といえる。たぷりす殿が勝った瞬間である。…たぷりす殿に何かを!!(※表現は演出です。)

※「tapply()」を3回に分けて実行しないといけなかったことを指して複数形(?)で「たぷりす」と呼ぶ。(※「す」に傍点。)

※「AにBを!!」:ひいきのスポーツチームが勝ったのを祝うようなノリで!、の意か。

 ここでは「summary()」に投げるだけなので、要約統計量が「表示」されるだけで、データとして格納されて後から使えるということではないことにも留意。「対話的に使おう」と題したコーナーですので「表示」を人の目で読み取ってノートにきれいに書き写せば“御の字”だよ。わあぃ7日分の仕事を7日目にやる人っ!(※恐縮です。)

・「tapply(myakari3dn0$V1, mykmakari9n0c3$cluster, summary)」

$`1`
Min. 1st Qu. Median Mean 3rd Qu. Max.
163 209 228 224 242 255
$`2`
Min. 1st Qu. Median Mean 3rd Qu. Max.
123.0 167.0 188.0 188.6 210.0 255.0


 こんな調子で「9」まで出てくる。

 https://quote.nomura.co.jp/nomura/cgi-bin/chart21.exe?template=chart/Jchart_kabu&mode=D&basequote=2206/T
 https://prtimes.jp/i/13408/2/resize/d13408-2-693565-8.jpg

 歌島4もしくは武蔵野2の江崎グリコ2206である。…2206!!(※恐縮です。)

 https://www.glico.com/assets/images/large/_%E3%83%81%E3%82%AD%E3%83%B3%E3%83%A9%E3%82%A4%E3%82%B9__2.png

 その江崎グリコ2206が全力で放つ「チキンライス」がこれだ!(ばーん

 https://www.glico.com/assets/images/large/__4.jpg

 さらに倍!!(げふ)

・V3の平均:「海のクラスター」なのか「山のクラスター」なのか
・V1とV2の最小と最大で面積(対角線)

 うーん。

・「region2」
 https://neorail.jp/forum/uploads/r_region2_n0_cmp3_km9_ext_centers.png?ref=4080

https://neorail.jp/forum/uploads/r_region2_n0_cmp3_km9_ext_centers.png?ref=4080


 「1」「5」「7」が「海」で、「4」は「湿地」で、「9」は「温泉」だといいました。

・…せんせー!!
 http://cse.naro.affrc.go.jp/takezawa/r-tips/r/59.html

 > 4分位偏差 IQR() : 第3四分位から第1四分位を引いた値

 算用数字と漢数字を併用できる文化圏に暮らしていてよかったと実感する瞬間である。長閑な時代であった。(違)

・「tapply(myakari3dn0$V3, mykmakari9n0c3$cluster, mean)」
・「tapply(myakari3dn0$V3, mykmakari9n0c3$cluster, median)」
・「tapply(myakari3dn0$V3, mykmakari9n0c3$cluster, IQR)」
・「tapply(myakari3dn0$V3, mykmakari9n0c3$cluster, max)」

V3の平均V3の中央値V3のIQRV3の最大
-56.438087-6040-3…うみー!
40.0047434060160…やまー!
97.2093029050230…やまー!
3.945757-32060
-66.728068-8020-10…うみー!
81.7934787050230…やみー!
-57.775082-7040-3…うみー!
31.2434663063160…うまー!
4.850425-32360


※データは「region2」です。

 ポヤンと「summary()」するのでなく、何をしたいのか決めれば、そういうふうにあとから使いやすいかたちで出せる。ありがとうございました。

 しかし「4」と「9」の見分けはV3だけではまったくつかないといいました。な・・・なんだってー!!(※表現は演出です。)

■「R with Excel」(たぷりすがいっぱい)

cbind(tapply(myakari3dn0$V1, mykmakari9n0c3$cluster, min), tapply(myakari3dn0$V2, mykmakari9n0c3$cluster, min), tapply(myakari3dn0$V1, mykmakari9n0c3$cluster, max), tapply(myakari3dn0$V2, mykmakari9n0c3$cluster, max))


x1y1x2y2
163-162255-36
123-832550
0-255142-180
0-1441770
0-93900
0-18981-91
72-255222-110
131-255255-152
0-255147-123


 えー…(てんてんてん)。せっかく点群というデータになってるのに矩形の領域で何かしようとしちゃう。な・・・なんだってー!!

[3527]
 > 「ss:sum of squares(二乗の総和)」

 > ここに出てくる「88.5%」という数字は、「mykm3$betweenss」(between_SS:187.155)の値を「mykm3$totss」(total_SS:211.5083)の値で割ったもので、「(クラスターの重心間の距離の二乗の和)/(すべての点の間の距離の二乗の総和)」を示しています。これは「クラスターの分かれ度合い」を意味しています。

 > なお、「totss」などの表記は、パッケージの作者がてきとーにつけたものですから、あくまでそういうものだと思って、論文などにそのまま「totss」などと書いてはいけませんよ。

・「mykmakari9n0c3$totss」

119043


・「mykmakari9n0c3$betweenss」

99852.69


・「mykmakari9n0c3$withinss」

2064.071
2740.405
2140.524
2195.099
1244.744
1700.321
2667.712
2077.675
2359.760


 https://neorail.jp/forum/uploads/r_region2_n0_cmp3_km9_hist_withinss.png

https://neorail.jp/forum/uploads/r_region2_n0_cmp3_km9_hist_withinss.png


 そもそも「kmeans()」によって「totss」「betweenss」「withinss」が得られている。…使うしか!!(キリッ

 https://previews.123rf.com/images/yupiramos/yupiramos1902/yupiramos190207781/125257470-giraffe-and-deer-wild-animals-with-trees-vector-illustration.jpg

 「5」や「6」は(点のない空間も含めて)狭い範囲(≒面積)に収まったクラスターであり、「2」や「7」は広い範囲(≒面積)に広がったクラスターである。…『広い範囲に広がる』!!(※ジト目)

※われわれは日本語なので(ぐぇ)『広い範囲に広がる』みたいな字面になっちゃってしつれいあそばせ、の意。

 https://t.pimg.jp/042/939/284/1/42939284.jpg

 点群というデータなので、外接円だとか、ましてや点群の形状を無視してx軸とy軸の上でかくかくした矩形の領域で囲もうとか、そういう不格好なことはしないでですね(しばらくお待ちください)あるクラスターに属する点群がある、その各々の2点間を線で結んで、その線ぜんぶの長さの合計みたいなものを「面積」と同等の指標として使おうということである。ある意味では「スポンジの重さ」である。…『スポンジの重さ』!!(※恐縮です。)

 https://toyokeizai.net/articles/-/77742?page=3
 https://www.ykkap.co.jp/feature/001/img/sec1_img_point_01.png

 ここでは平面で着目するので「面積」というふいんきをまんてんにしたけれど、その実、「withinss」という指標には「密度」に相当する情報も“おりこみ済み!”なんだなこれが!


 [4081]に続きます。


この記事のURL https://neorail.jp/forum/?4080


この記事を参照している記事


[4081]

「照焼大橋」不滅なれ(クラスト編)

2020/5/21

[4082]

「照焼大橋」不滅なれ(高速旅情編)

2020/5/21

[4148]

かくも雲雀丘花屋敷なのか(後編)

2020/8/1

[4157]

ふれねるVR霧吹きの塊(補遺編)

2020/8/1

[4208]

3桁のオーダー / ウエストサイドソフトハウス / ほか

2020/9/16


関連する記事


[3658]

【自由研究】ゆるシミュ(8) tht - 2018/7/9


[3707]

研究ホワイトボックス(35) 複雑なデータと「対話」するには〜郵便番号データを例に(R編) tht - 2019/5/24


[3653]

【北見北上】「もんじゃストリート」は続くよ(網走編)【網走アポロ石油あり】 tht - 2018/6/10


[3559]

【SFTGFOP】「さくらカード」(1996年6月)を「JIS II型(JIS X 6302)」からの「イオカード」(1991年3月)で読み解く【株式会社東京交通会館あり】 tht - 2017/10/27


[3676]

【正宗の名刀で速射砲と立合をするような奇観を呈出】発生学から出立するディープラーニング(仮)【社会調査工房オンラインあり】 tht - 2018/9/13


[3640]

研究ホワイトボックス(32) 「単元」と「難易度」を示した「総合的な教材」をつくるには tht - 2018/4/30


[3649]

【お知らせ】ストリートビューの表示を休止します tht - 2018/5/31


[3685]

【DE10】「A列車 色がたりない」【レッドトレインなし】 tht - 2019/1/1






neorail.jp/は、個人が運営する非営利のウェブサイトです。広告ではありません。 All Rights Reserved. ©1999-2020, tht.