フォーラム - neorail.jp R16

【自由研究】の話題

 → 茨城県内で必要な「主論文・野帳・掲示物」とは? 【詳細】(2017/10/19) NEW!
 → 【自由研究】の記事一覧(新着順)


【研究ホワイトボックス】

研究を楽しく「追体験」! 真っ白のキャンバスに虹色の未来を描く方法、教えます。
R with Excel prcomp | kmeans・hclust | rpart | ggvoronoi | spantree | lm NEW!


2023年1月の話題
更新:2023/12/31

[4969]

【研究ホワイトボックス】

研究ホワイトボックス(49) とにかく「主成分分析つき回帰木」するには


「人口集中率」と「人口密度」
「人口集中地区人口」と「社会経済分類別15歳以上人口」
「R with Excel」(※Excelでの操作については省略)
「R with Excel」(続き)
「R with Excel」(続き)

(約34000字)

 [4968]からのありあまる余波で「R」でございます。


[4968]
 > 電子音楽(や楽器)をおもしろがっていながら、技術にも技術史にも話はあまり広がらない。技術というものの前に『壁』をつくって「あちら側」みたいな顔をしてしまうのが、いかにも古い時代の文系の人らしい。

 > 「現代音楽」というテーマには「内省的」というイメージもあるので、その「現代音楽」を語るあなたはどこで何を食べるのか(※哲学的な問い)ということである。

[3401]
 > > GPLVMってぐぐってみると... なるほど、わからん\(o)/
 > > 一体、何をしているのかくらいは理解したい
 > > PCA(主成分分析)のド発展版に相当する
 > > PCAのお化けのような手法とでもいえばよいのでしょうか。

 > > PCA
 > > Dual PCA
 > > Kernel PCA
 > > Probabilistic PCA このままでは解けない
 > > Probabilistic Dual PCA → GPLVM

 > どこで薄氷を踏み抜いたのか…じゃなくて、さえてる「ガラスのてんじょう」のやぶりかた…でもなくて、どのように化けていったのか丹念に追って『さい終けい態!』のほうなど鮮やかにですね(略)おおー、ここでBGMが変わるぞう。わあぃ『第6章!』ではGPLVMが仲間になりたそうに(もっと略)。

・(再掲)筑摩書房「ちくま」9月号で上野センセイいわく(※リンク先は目次です)
 http://www.chikumashobo.co.jp/blog/pr_chikuma/entry/1373/

 > 「同じか違うか」はYes/Noの二つの値しかとりません。これを二値論理といいます。
 > AI(人工知能)とはこの大脳シナプス連結を模倣したものにほかなりません。どんなに複雑なAIでも、基本は二値論理の膨大な集積回路から成っています。

 現代っ子としてはかなり面食らう物言いなのであるが、これが「重回帰分析」をけちょんけちょんに言うものであったら、まったくその通りだと。つまり上野センセイは「AI(人工知能)」というものを「しょせん重回帰分析のお化けでしょ?」という見方をしたわけだ。…うーん! 主成分分析や確率論的アプローチと呼ばれるようなものを(耳学問でなく)自分で納得できるまで使ってみる体験があれば、「AI(人工知能)」について「重回帰分析」みたいな言いかたで言えるなんて、思わなくなるでしょ。(※見解です。)

 こういう感じのことでいう「耳学問でなく自分で納得できるまで使ってみる」という感覚が、「哲学的な問い」じみた言いかたでいえば「あなたは何を食べるのか」(※直訳)になるんですね。(ねちねち)

[3885]
 > 電気としてもケミカルとしてもスレッショルドというものがあってだなぁ(げふ)どちらともつかない領域を挟んでるとかいうことを概念的でいいから学びませんか。そうですか。(※すごく残念そうな顔で!)

 > 上野センセイの(頭の中の)辞書にも「ファジィ」は載ってなかろう。その時代にそんなことを勉強する余裕があったとは思えない。本当でしょうか。余裕があれば勉強したとでもいうんでしょうか。…ギクッ。

 多変量解析は別のセンセイの仕事で、上野センセイの仕事は仮説を思いつくことと考察をモーレツにねちねちこね上げるところにあるといえば、それまでではある。ちゃんとチームで仕事している限りはまったく問題ない。(棒読み)

[4014]
 > 「興味がない」ということの、底なしに危ういことよ。

[4641]
 > ユーザーの「属性」として「都道府県」という47通りの値に着目するということは、47つある都道府県から1名ずつのユーザーが訪れたとき『47人47様!』であると仮定することになる。しかし、そこまでユーザーはばらばらだろうか。

[3538]
 > 都心からびみょーに離れた(お手ごろながら広くて快適な)家でなんでも済ませようというのが「埼玉・兵庫・岡山タイプ!(通勤快速&家庭でお好み焼きっ!)」

[4630]
 > 岡山だからしかたない。

[4968]
 > だから佐賀県で「トムとジェリー」というわけでもないだろうが…(てんてんてん)。

・総務省統計局「都道府県別人口集中地区人口,面積及び人口密度(エクセル:34KB)」「社会経済分類別15歳以上人口(エクセル:40KB)」
 https://www.stat.go.jp/data/nenkan/back63/02.html
 https://www.stat.go.jp/data/nenkan/back63/zuhyou/y0205000.xls
 https://www.stat.go.jp/data/nenkan/back63/zuhyou/y0211000.xls

■「人口集中率」と「人口密度」

都道府県人口集中地区
人口(率)
全域
人口密度
人口集中地区
人口密度
北海道74.0665101
青森46.01423950
岩手29.6874679
宮城59.93225793
秋田34.2934256
山形42.41254308
福島40.01474406
茨城37.34864570
栃木44.23134691
群馬39.93163997
埼玉79.618958340
千葉72.912047145
東京98.2601412022
神奈川94.237458979
新潟48.11884894
富山37.12573864
石川50.12795478
福井41.81934308
山梨32.61934668
長野34.81594244
岐阜38.91954523
静岡59.64835267
愛知76.814356179
三重42.23204200
滋賀46.73516120
京都83.05718300
大阪95.846699366
兵庫76.66667415
奈良64.83806340
和歌山39.52134347
鳥取35.31694304
島根25.01074174
岡山45.62734368
広島63.63385983
山口48.22373317
徳島31.71904708
香川32.85294178
愛媛52.42524872
高知42.81075871
福岡70.910196351
佐賀29.83474662
長崎47.13475574
熊本46.62455440
大分45.21894713
宮崎45.91464573
鹿児島39.91855364
沖縄66.86127109


■「人口集中地区人口」と「社会経済分類別15歳以上人口」

北海道40774150352731391711012416469335486276275833.22948351012
青森6328.710125.58.37.836294.04.0109731456565221.775183283
岩手3941111105.66.87.939284.85.11117216455629.82.271174251
宮城14077.619151114176842118.621415724891105232.0145330387
秋田3714.18.39.15.45.96.530223.73.0925713547539.32.154166227
山形4953.211106.37.57.033224.23.91016616544549.32.961140226
福島8115.9161413131259397.86.11681082798089143.5108253377
茨城11071121192020299253127.5266156393119124273.6162400479
栃木8885.3151315141664388.75.51781112878195143.2107251322
群馬8025.6161417131364389.15.71831112787795124.6105267326
埼玉57305.45535504550240114491978850477833131064124011029940