・「R with Excel」 ・「R with Excel」(続き) ・「R with Excel」(続き)
(約15000字)
「A列車で行こう9 マップ ダウンロード」などの検索でお越しのかた! 「ダウンロード」はないですけど、「地形の自動生成」でこんなのがつくれますよ。…なにそれなにそれ!! ▼「地形の自動生成」の詳しい使いかたについては[3770]を参照してください。
「仕込編」([3882])からの続きです。
多少の見直しをしながら、地形データ(いわゆるハイトマップ)をクラスタリングするための9つの変量が見えてきました。
・V1:「「平地」の輪郭のピクセル数」/「「平地」のピクセル数」
・V2:「「-10m」以下のピクセル数」/65536
・V3:「「山」のピクセルの「高さ」の「中央値」より大きい値の「平均値」/230
・V4:「山の体積」/(256×256×230)
・V5:「全周(1020ピクセル)における「平地」のピクセル数」/1020
・V6:「全周(1020ピクセル)における「水面」のピクセル数」/1020
・V7:「「全「水面」の重心」の「マップの中心」からの距離」/(128×√2)
・V8:「「全「山」の重心」の「マップの中心」からの距離」/(128×√2)
・V9:「「全「水面」の重心」と「全「山」の重心」の距離」/(256×√2)
ニューゲーム(シナリオマップ)がどうのこうのという前に、「地形の自動生成」で得た地形の特徴をあまさず表現できているか確かめておこうではありませんか。
・(再掲)「ぎおんのじょん」1号から9号まで
https://neorail.jp/forum/uploads/map_region1-9.png?ref=3883
https://upload.wikimedia.org/wikipedia/commons/2/27/Shin-Kobe01s5s3200.jpg
https://www.jr-odekake.net/eki/img/photo/size_l/0610156_l.jpg
https://cdn.jalan.jp/jalan/img/2/kuchikomi/3802/KL/97615_0003802893_1.JPG
※画像はイメージです。
・[3875]
> 左上から横に1,2,3、縦に1,4,7「…の順で、」です。各駅停車電車は当駅には停車いたしません。いちばん右下は何番ですか。…はひ!?
いちばんしたは、ひだりから7,8,9…です。新神戸には停まりますか。な・・・なんだってー!!
> 「region7」は『これはこれ。(…ゴクリ)』的な地形なのでとりあえず赤いボタンをクリック!
> チャレンジのつもりで水面の多い地形をだなぁ(略)「region8」は水面が湾なのか川なのかというニュアンスがはっきりしないし水面が多い割にあまりチャレンジングな感じがしないからなんか気に入らないけれど「region9」は気に入った
このひとたちにごとーじょーねがおうではないかッ!! …『このひとたち』!!(違)
https://youtu.be/LqtRwjcVjnI?t=72
https://ja.wikipedia.org/wiki/%E6%96%B0%E7%A5%9E%E6%88%B8
> 新神戸駅北側の森林地区は布引と呼ばれ、当地域には含まない。
わかりました。(キリッ
・今回のTSVデータはこちらになります
https://neorail.jp/forum/uploads/region1_xyz.tsv
https://neorail.jp/forum/uploads/region1_256x256.tsv
https://neorail.jp/forum/uploads/region2_xyz.tsv
https://neorail.jp/forum/uploads/region2_256x256.tsv
https://neorail.jp/forum/uploads/region3_xyz.tsv
https://neorail.jp/forum/uploads/region3_256x256.tsv
https://neorail.jp/forum/uploads/region4_xyz.tsv
https://neorail.jp/forum/uploads/region4_256x256.tsv
https://neorail.jp/forum/uploads/region5_xyz.tsv
https://neorail.jp/forum/uploads/region5_256x256.tsv
https://neorail.jp/forum/uploads/region6_xyz.tsv
https://neorail.jp/forum/uploads/region6_256x256.tsv
https://neorail.jp/forum/uploads/region7_xyz.tsv
https://neorail.jp/forum/uploads/region7_256x256.tsv
https://neorail.jp/forum/uploads/region8_xyz.tsv
https://neorail.jp/forum/uploads/region8_256x256.tsv
https://neorail.jp/forum/uploads/region9_xyz.tsv
https://neorail.jp/forum/uploads/region9_256x256.tsv
…どーん!(ばばばばば
もちろん、そういうファイルを同じディレクトリに入れておいてRからファイルを読み込んでほいさっさ(略)するのがスジではございますが、なにぶんWindowsでして(げふ)この子がね(違)WindowsでRを使う限りは「R with Excel」を貫徹して、すなわちファイルの読み込みや過度な自動化をしようとしないで、1つ1つ間違いのないようによく確かめながら実行すべきだと思うの(げふ)ありがとうございました。
ワークスペース(作業スペース)も保存しないで終了して、寝ぐせばっちり(略)毎回「まっさら!」なRがむっくりと起きてきてくれるといいわ!(※表現は演出です。)どうしてもというときはRを複数起動していいのよ? それがWindows®もとい「GUI(笑)」で「対話的」ということなのよ。もちろんそれは知ってた。アリガトウ。(※見解です。)
・[3882]
> 「なんでコピペ決定なの?」と不満げに問い返します。どんなコピペが好き?(以下略)
> これでrbindするなりクリップボードにコピーして『エクセル野帳!』に貼り付けるなりなんでもござれ。
その結果がこれだ!(すたぱーん
| V1 | V2 | V3 | V4 | V5 | V6 | V7 | V8 | V9 | region1 | 0.244231901 | 0.262512207 | 0.264061438 | 0.032548324 | 0.283333333 | 0.275490196 | 0.213776984 | 0.172750235 | 0.190059366 | region2 | 0.146957899 | 0.278274536 | 0.438797801 | 0.069395646 | 0.193137255 | 0.328431373 | 0.133151671 | 0.159992445 | 0.146029949 | region3 | 0.158658086 | 0.379058838 | 0.316336445 | 0.030743143 | 0.248039216 | 0.529411765 | 0.067631811 | 0.079467771 | 0.061336855 | region4 | 0.09373868 | 0.259963989 | 0.427710673 | 0.052143926 | 0.202941176 | 0.271568627 | 0.469020138 | 0.355118549 | 0.412063417 | region5 | 0.295269894 | 0.179412842 | 0.459486225 | 0.160304194 | 0.189215686 | 0.270588235 | 0.282264636 | 0.097926611 | 0.184602188 | region6 | 0.155291436 | 0.280822754 | 0.335667169 | 0.051277492 | 0.254901961 | 0.197058824 | 0.053682521 | 0.068181905 | 0.054025214 | region7 | 0.120582177 | 0.268692017 | 0.318402291 | 0.031550532 | 0.507843137 | 0.216666667 | 0.39587707 | 0.302713996 | 0.336555978 | region8 | 0.054367799 | 0.388290405 | 0.573383273 | 0.031537263 | 0.556862745 | 0.359803922 | 0.167414699 | 0.469205006 | 0.311952482 | region9 | 0.068974418 | 0.413848877 | 0.429951691 | 0.014787093 | 0.497058824 | 0.429411765 | 0.182619694 | 0.238145907 | 0.198423588 |
ぼふっ。かろうじて「横長ではない」行列になっているから、たいていの多変量解析に載せられると思うわ&アリガトウ。
■「R with Excel」ヘッダーつきで読み込む | myindex9=read.table("clipboard",h=1) | 散布図行列を描く | plot(myindex9) |
上の「ぼふっ。」という、列名と行名も含んで10×10のやつ全体をコピー!
https://neorail.jp/forum/uploads/r_index9_plot.png
がふっ。…なんかすかすかである。やだなぁ、これから培養するんですよぅ! …『培養』!!(違)散布図行列をパッと見て目が留まるのは、まんなかにあるV4あたり。そしてV7とV9、V8とV9は、そういう変量なので直線状に点が並びます。これを多重共線性というんでしたっけせんせー。…どこのせんせーですかっ!?(※表現は演出です。)V7とV8のプロットでは、▼ともに小さい(0付近)、▼V7だけ大きい、▼V8だけ大きい、という感じにイチョウの葉のように広がっていきます。
https://www.yomeishu.co.jp/genkigenki/crudem/171027/index.html
> 「鴨脚」「鴨脚子」は、葉の形が鴨の掌に似ていることに由来し、
> ダーウィンは、イチョウを「生きた化石」と呼んでいました。地球上で植物が繁茂したのがジュラ紀(約1億5千万年前)で、そのころの植物でイチョウだけが現存し、ほかの植物はすべて化石となっているからです。
へー…
| V1 | V2 | V3 | V4 | V5 | V6 | V7 | V8 | V9 | | | | | | | | | | | region1 | 0.244231901 | 0.262512207 | 0.264061438 | 0.032548324 | 0.283333333 | 0.275490196 | 0.213776984 | 0.172750235 | 0.190059366 | region2 | 0.146957899 | 0.278274536 | 0.438797801 | 0.069395646 | 0.193137255 | 0.328431373 | 0.133151671 | 0.159992445 | 0.146029949 | region3 | 0.158658086 | 0.379058838 | 0.316336445 | 0.030743143 | 0.248039216 | 0.529411765 | 0.067631811 | 0.079467771 | 0.061336855 |
---|
region4 | 0.09373868 | 0.259963989 | 0.427710673 | 0.052143926 | 0.202941176 | 0.271568627 | 0.469020138 | 0.355118549 | 0.412063417 | region5 | 0.295269894 | 0.179412842 | 0.459486225 | 0.160304194 | 0.189215686 | 0.270588235 | 0.282264636 | 0.097926611 | 0.184602188 |
---|
region6 | 0.155291436 | 0.280822754 | 0.335667169 | 0.051277492 | 0.254901961 | 0.197058824 | 0.053682521 | 0.068181905 | 0.054025214 | region7 | 0.120582177 | 0.268692017 | 0.318402291 | 0.031550532 | 0.507843137 | 0.216666667 | 0.39587707 | 0.302713996 | 0.336555978 |
---|
region8 | 0.054367799 | 0.388290405 | 0.573383273 | 0.031537263 | 0.556862745 | 0.359803922 | 0.167414699 | 0.469205006 | 0.311952482 |
---|
region9 | 0.068974418 | 0.413848877 | 0.429951691 | 0.014787093 | 0.497058824 | 0.429411765 | 0.182619694 | 0.238145907 | 0.198423588 |
---|
| | | | | | | | | | 『平均値で!』 | 0.148674699 | 0.301208496 | 0.395977445 | 0.052698624 | 0.325925926 | 0.319825708 | 0.218382136 | 0.215944714 | 0.210561004 |
ちょっと他と違う値が出ていて特徴かなぁと思うところを太字に!(棒読み)「region5」こと「ぎおんのじょん5号」の他とは違うということが数字で表現できました。それに対して「region1」こと「ぎおんのじょん1号」の『平均値で!』って言ったみたいなソレよ。(※詠嘆)V1だけ平均値を超えちゃいますが、V2からV9までは狙いすましたように平均ちょい低めをキープ。…なにそれあざとい。『平均値で!』を狙いすぎるとかえって目立つとか役に立たないとか(げふ)あくまでゲームです。(棒読み)
・(再掲)湾いろいろ。
https://neorail.jp/forum/uploads/map_bay1-3.png?ref=3883
・(再掲)いかにも『新作ニューゲーム!』(※意訳)にありそうな地形ございます。
https://neorail.jp/forum/uploads/map_new1-2.png?ref=3883
・(再掲)粘ればこのくらいのが出てきますから粘ってください!(ばーん
https://neorail.jp/forum/uploads/map_river1-2.png?ref=3883
・(再掲)3連単どーん!(※演出は表現です)
https://neorail.jp/forum/uploads/map_gen_metropolitan8_a1-3.png?ref=3883
・(再掲)こんな感じだと思いますよ。みんなやってるんじゃないですか。(※音声を変えています)
https://neorail.jp/forum/uploads/map_tem3gak_a1.png?ref=3883
お次はこのひとたちだーっ。…『だーっ』!!(…たぶんそこじゃない。)
・追加のTSVデータはこちらになりますね?(※ひきつった笑顔で!)
https://neorail.jp/forum/uploads/bay1_xyz.tsv
https://neorail.jp/forum/uploads/bay1_256x256.tsv
https://neorail.jp/forum/uploads/bay2_xyz.tsv
https://neorail.jp/forum/uploads/bay2_256x256.tsv
https://neorail.jp/forum/uploads/bay3_xyz.tsv
https://neorail.jp/forum/uploads/bay3_256x256.tsv
https://neorail.jp/forum/uploads/new1_xyz.tsv
https://neorail.jp/forum/uploads/new1_256x256.tsv
https://neorail.jp/forum/uploads/new2_xyz.tsv
https://neorail.jp/forum/uploads/new2_256x256.tsv
https://neorail.jp/forum/uploads/river1_xyz.tsv
https://neorail.jp/forum/uploads/river1_256x256.tsv
https://neorail.jp/forum/uploads/river2_xyz.tsv
https://neorail.jp/forum/uploads/river2_256x256.tsv
https://neorail.jp/forum/uploads/metropolitan8_a1_xyz.tsv
https://neorail.jp/forum/uploads/metropolitan8_a1_256x256.tsv
https://neorail.jp/forum/uploads/metropolitan8_a2_xyz.tsv
https://neorail.jp/forum/uploads/metropolitan8_a2_256x256.tsv
https://neorail.jp/forum/uploads/metropolitan8_a3_xyz.tsv
https://neorail.jp/forum/uploads/metropolitan8_a3_256x256.tsv
https://neorail.jp/forum/uploads/tem3gak_a1_xyz.tsv
https://neorail.jp/forum/uploads/tem3gak_a1_256x256.tsv
だば〜。(※謎の擬音を発しながら座りなおします。)
| V1 | V2 | V3 | V4 | V5 | V6 | V7 | V8 | V9 | | | | | | | | | | | bay1 | 0.045061626 | 0.18649292 | 0.307285041 | 0.015036541 | 0.8 | 0.105882353 | 0.330437411 | 0.594700983 | 0.388575539 |
---|
bay2 | 0.215495266 | 0.264205933 | 0.290915471 | 0.04093336 | 0.295098039 | 0.211764706 | 0.295421796 | 0.409792979 | 0.334899293 | bay3 | 0.075354732 | 0.312927246 | 0.479254658 | 0.038472715 | 0.46372549 | 0.429411765 | 0.337564604 | 0.349002635 | 0.320188803 |
---|
| | | | | | | | | | new1 | 0.139033299 | 0.260818481 | 0.316035204 | 0.030356366 | 0.288235294 | 0.38627451 | 0.223388674 | 0.370643309 | 0.283142393 |
---|
new2 | 0.111863851 | 0.185058594 | 0.484446437 | 0.076810754 | 0.390196078 | 0.266666667 | 0.341708876 | 0.113602356 | 0.224093199 |
---|
| | | | | | | | | | river1 | 0.068637438 | 0.165557861 | 0.283241045 | 0.014798372 | 0.691176471 | 0.200980392 | 0.129259559 | 0.331635911 | 0.206502238 |
---|
river2 | 0.098515924 | 0.179916382 | 0.270036123 | 0.025591643 | 0.500980392 | 0.196078431 | 0.251371847 | 0.195824227 | 0.223384949 |
---|
| | | | | | | | | | metropolitan8_a1 | 0.123897363 | 0.060516357 | 0.492566514 | 0.075656393 | 0.395098039 | 0.210784314 | 0.363200789 | 0.353260273 | 0.240564179 |
---|
metropolitan8_a2 | 0.17395717 | 0.141586304 | 0.482161663 | 0.074338167 | 0.36372549 | 0.144117647 | 0.349951917 | 0.456766217 | 0.397900171 |
---|
metropolitan8_a3 | 0.117651844 | 0.173156738 | 0.524144528 | 0.081180738 | 0.254901961 | 0.228431373 | 0.509875804 | 0.269811745 | 0.379638206 |
---|
| | | | | | | | | | tem3gak_a1 | 0.301649625 | 0.090087891 | 0.164343687 | 0.03729049 | 0.366666667 | 0.12745098 | 0.059611425 | 0.08702704 | 0.072417552 |
---|
| | | | | | | | | | 『平均値で!』 | 0.133738013 | 0.183665882 | 0.372220943 | 0.046405958 | 0.437254902 | 0.22798574 | 0.290162973 | 0.321097061 | 0.279209684 |
ぱらりら。ファミレスのあかりをにらみつけながらコンビニの駐車場でおでん。なぜか鍋持参。(違)
https://www.asahi.com/articles/ASMDC53GZMDCIIPE00R.html
https://www.asahicom.jp/articles/images/AS20191211002944_comm.jpg
> 客が持参した鍋にカレーを入れて渡すスタッフ。「持ち帰り容器は、お金もかかるしゴミになる。それに、鍋で買うと、明日も食べられる」とお客さん=2019年11月12日、北海道帯広市
https://www3.nhk.or.jp/news/html/20200114/k10012244561000.html
> おでん専用の鍋にあらかじめ売れる数を予想して具材を仕込んでいましたが、数時間たつと売れ残りとして廃棄に回されていました。
> 注文を受けてから温めるパック詰めの具材を導入することで、売れ残りや廃棄を減らすことができるほか、仕込みなどの作業も減るため、従業員の負担軽減にもつながるということです。
保健所の許可を得ておくことが「主」(の目的)で、実際に何かを(保健所の許可が必要な態様で)売ることは「従」ではないのですか。おにぎりや惣菜パンを店で製造して売るデイリーヤマザキ「デイリーホット店」にはかないません。(棒読み)
http://www.daily-yamazaki.jp/jn/merit.html
> 焼きたてパンや作りたてのお弁当は、すべて店内で調理。手作りだから、新鮮でおいしい。しかも安全・安心。
(半分できてるのを冷凍で運んでくるんでしょ=)カーボンフットプリントはバクハツするけれど保存料も使わず廃棄も最低限にできる。カーボンフットプリントが(げふ)しつれいしました。ビルの2階でパンの生地をこねるところからぜんぶやってパンを焼いて売るマロンドにはかないません。材料の備蓄があって、道路など寸断されてもパンが焼けて近くの避難所に届けることができる…はず。メニューを減らせばものすごい数のパンをすごい勢いで焼ける…はず。そういう観点ではパン屋にはNTPのstratumみたいな階層構造がある。たぶんですけどね。
> 2000年、店内調理のデイリーホットを開始。
> 多くのお客様のご支持をいただき、現在では店内調理機能店は800店舗を超え、多くのFCオーナー様にご好評いただいています。
> 「食のコンビニ」デイリーヤマザキにしかない大きな強みで、皆さんの店舗経営を強く支援します。
> 焼きたてパンは2週間に1度、5〜10種類の新製品を投入。季節商品など「食べておいしく」「より利益率の高い」商品を開発し、店舗を支援します。
それをぜんぶじぶんでするパン屋なんてゾッとするけれどパン屋したい!(子どものとき書いた「夢」なの!)…に応えるデイリーヤマザキでしたー。
> その強みが最大限に発揮できることを何よりも大切に考え、エリアや周辺環境、将来性まで見通した上で本当に納得がいく物件だけを開発しています。
無理なことはしてませんという説明でしたー。
・「bay」らしさ:V2とV6が『平均値で!』より高め
・「new1」と「new2」の違い:▼V2とV6が高めの「new1」と、▼V8だけ特に低め(※山の重心がマップの中心に近くて、山が主題のマップらしいということ=わるいという意味ではない)の「new2」
・「river」らしさ:V5が『平均値で!』より高め(⇔水面が多いが、外とつながる湾ではないし、閉じた湖でもない、の意)
・:⇔V5が大きいと初心者ちっく(※個人の感想です)
・『3連単』の3者3様よ:▼V2が特に低め、▼V1あげてV6あげないで、▼V7大盛りで!(げふ)
・なさけない音で「てむさんがく」と呼びつけたテンプレート「山岳地帯」を代替してやる(その椅子に座るのはおれさまだ!)と鼻息も荒い「tem3gak_a1」:そのココロはV7、V8、V9というかたちでしかと受け取ったぞよ!!(棒読み)
うーん。
https://neorail.jp/forum/uploads/r_index9_plot20.png
…うーん! おでん専用の鍋にあらかじめ売れる数を予想して具材を仕込んで…じゃなくて、培養を始めてから何分後ですか(それも違)V4(「山の体積」)が突出していたらそれだけで別府ですね(ほかの変量は見なくていいですね)みたいな決定木みたいなのが見えてくるようだとはまさにこのことだよ。具材のようすを見れば仕込んでからの時間がわかるといいました。…いいません!!(※予想です。)
| V1 | V2 | V3 | V4 | V5 | V6 | V7 | V8 | V9 | | | | | | | | | | | 『平均値で!』 | 0.140459521 | 0.236560059 | 0.382911369 | 0.049237658 | 0.387156863 | 0.269313725 | 0.257861596 | 0.273778505 | 0.248317778 | 『分散で!』 | 0.005528117 | 0.008950382 | 0.011839589 | 0.001152416 | 0.028016138 | 0.012277474 | 0.017561441 | 0.022490855 | 0.012573167 |
---|
うーん。分散が最大となっている変量はV5(「全周における平地の比率」)ですが、…それは当然だからV5は除くとV8(「山の重心とマップの中心の距離」)で、分散が最小なのはV4ということでございます。
・「山の体積」(V4):突出して多くして別府するとき以外は、ま、ふつーにゲームがプレーできるように一定以下のところに収まっているので分散は小さい(別府は外れ値!)
https://previews.123rf.com/images/sepavo/sepavo1604/sepavo160400002/57129791-%E6%B8%A9%E6%B3%89%E3%81%A8%E5%88%A5%E5%BA%9C%E5%B8%82%E9%83%BD%E5%B8%82%E6%99%AF%E8%A6%B3%E5%AE%B6%E8%92%B8%E6%B0%97%E3%81%8C%E4%B8%8A%E6%98%87%E3%80%82.jpg
別府(げふ)がサ変・THE『別府〔スル〕』になっちゃいました&だまされたとおもって(違)しつれいしました。(※巻き舌)なお、ここで別府(げふ)別府と言っているのは「湾」のほうではなく『地獄!』のほうです。マップ内に「湾」は描かず、全域を使って思う存分・ザ・サ変『地獄〔スル〕』みたいなマップをイメージしてください。…ぞっ、ぞんぶんざさへーん! これはゾッとしない。(違)
■「R with Excel」(続き)相関行列をつくる | round(cor(myindex9),3) # 正しくできたことを確かめます | RからExcelに 相関行列の表をコピーする | write.table(round(cor(myindex9),3), file="clipboard", sep="\t") |
| V1 | V2 | V3 | V4 | V5 | V6 | V7 | V8 | V9 | V1 | 1 | | | | | | | | | V2 | -0.312 | 1 | | | | | | | | V3 | -0.367 | 0.149 | 1 | | | | | | | V4 | 0.485 | -0.369 | 0.485 | 1 | | | | | | V5 | -0.603 | -0.054 | -0.127 | -0.566 | 1 | | | | |
---|
V6 | -0.191 | 0.769 | 0.277 | -0.113 | -0.263 | 1 | | | |
---|
V7 | -0.246 | -0.285 | 0.456 | 0.302 | -0.006 | -0.235 | 1 | | |
---|
V8 | -0.522 | -0.027 | 0.226 | -0.31 | 0.554 | -0.216 | 0.454 | 1 | | V9 | -0.425 | -0.089 | 0.392 | -0.018 | 0.267 | -0.228 | 0.836 | 0.824 | 1 |
---|
| | | | | | | | | | 『相関係数の分散で!』 | 0.0200 | 0.0589 | 0.0185 | 0.0358 | 0.0580 | 0.0405 | 0.0582 | 0.0617 | 0.0941 |
---|
うーん。ほかの変量との相関係数がいちばんぼやっとしているのはV3ですが、それはまあ当然(げふ)その次にぼやっとしているのはV1ということですから、V1(≒「地形の複雑度」)を基本の変量だと思ってよいのではありませんか。思いたいですよね。(違)
■「R with Excel」(続き)ライブラリを読み込みます | library(rpart) library(rpart.plot) | rpartを実行する | myrpart901 <- rpart(V1~., myindex9, minsplit = 3) # データフレーム「myindex9」のうち、 # V1を目的変数(従属変数)、 # それ以外を説明変数とする回帰です # 変数名を定義していない(ヘッダーがない)場合です | rpartの実行結果を rpart.plotでプロットする | rpart.plot(myrpart901, type = 2, uniform = TRUE, extra = 1, under = 1, faclen = 0) # プロットされた図を右クリックしてコピーや保存をします | RからExcelに rpartによる分割結果の表をコピーする | write.table(myrpart901$where, file="clipboard", sep="\t") | rpartによる分割結果で色分けした 多変量相関図(散布図行列)を描く | library(mclust) clPairs(myindex9, cl=myrpart901$where) |
…予想と違った。(※恐縮です。)
https://neorail.jp/forum/uploads/r_index9_rpart_plot.png
https://neorail.jp/forum/uploads/r_index9_rpart.png
https://neorail.jp/forum/uploads/r_map_index9_rpart.png
n=5 | n=1 | n=1 | n=5 | n=2 | n=3 | n=1 | n=2 | | | | | | | | | region8 region9 bay1 bay3 river1 | river2 | region7 | region4 new1 new2 metropolitan8_a1 metropolitan8_a3 | bay2 metropolitan8_a2 | region2 region3 region6 | region1 | region5 tem3gak_a1 |
・[3575]
> 「rpart」はあくまで「recursive partitioning and regression trees」なんです。好き勝手に「決定木」などと決めつけて『呼びくだし!』たりしないことです。
> CART(Classification and Regression Trees):分類と回帰の木。
> > 交差検証法を使用するCARTは小さなデータセットでも、2進木分析を行うことができるのです。
> > CARTは全 (学習用) データを使って最大樹木を成長させます。次に、このツリーを剪定します。
> > CARTとステップワイズ・ロジスティック回帰分析あるいは判別分析を比べたとき、学習用サンプルに関してはCARTは遙かによい結論を導き出してくれます。
> > CARTは十分に強力です。CARTはたった1日、2日で、専門家が何日もかかって構築したモデルの若干予測精度の劣る程度のモデルを、自動的に作り上げてくれるのですから。
> > CARTは、すべての変数に関して可能な分岐をすべてチェックします。たとえば19の変数をもった215サンプルのデータセットで考えてみましょう。CARTは、最大で19変数×215サンプル=4085回の分岐を試みます。
「CART」は「®」なので、オープンソースコミュニティに属する「R」な界隈としては「rpart」とのみ呼びませう。しかし頭の中では「CART」と読んでいるかもしれない。わるぎはなかった。(※音声を変えています。)
> rpart(recursive partitioning and regression trees):再帰的な分割と回帰の木。以下、そのまま「rpart」と呼んでいきます。
V1からV9までの9つの変量をそのまま(生で)使って「rpart」([3575])したところ、そのような分割結果になりました。
・V9すなわち『風光明媚度の逆数!』が0.19以上「じゃない!!」:つまり0.19という閾値より小さければたぶん風光明媚ですね、それが最初の分かれ目ですね、ということにされました(…わるくないね)
…出ました『わるくないね』みたいに言うロンドンっ子!!(違)
・V8を使って分けているところでは、▼山が主題っぽい(中心にある、またはいろいろな位置にいくつもある)か、▼ある方角にべたっと遠景のようにはりついている山しかないか、を0.39という閾値で切っているのですが、「metropolitan8_a1」のようなマップはなんともいえない
・同じパーティションに入れられた「region3」とそれ以外:見た目では『スケールが違う!』と思う(「region3」だけは非常に広いと感じる⇔ほかの2つは広いと思えば広いし狭いと思えば狭くも見える)けれど、そういうことは評価できていない感じ
・湾だの川だのとはおっしゃいますが(げふ)区別されないじゃないですか:…V6は使ってくれてないじゃないですか!(V6より先に見るべき変量があってじゅうぶんに分割しきったからV6の出番はなかった、の意)
うーん。V6に特に着目して、つまり「川らしい」かどうかを気にして選択しようというのは、ほかのすべてのこととは直交してるとかいうことじゃないんですか。本当でしょうか。(棒読み)いえいえいえ、「川らしい」つまりV6によって特徴づけられるサンプルが少ないからそうなるんですよ。もっと本当でしょうか。(もっと棒読み)
「評価編」([3884])に続きます。
|