|
・「neorail.jp」ご利用状況 ・「駅名ランダマイザー(Z47T-DFK)」ご利用状況 ・「R with Excel」 ・「R with Excel」(続き)
(約16000字)
[4492]の続きです。うちのサイト「neorail.jp」「arx.neorail.jp」の現在のようすを伝えてもらいます。およそ半年ごとにアップツーデートにお伝えしてきております。なるべく同じ方法でと思いますが、なにぶん半年ごとにしか見ないものですから、ツールの使い方を忘れていて困ります。(※恐縮です。)
★「neorail.jp」ご利用状況
・[4226]
> [4213]の補足です。うちのサイト「neorail.jp」「arx.neorail.jp」の現在のようすを伝えてもらいます。(棒読み)
そのときと同じ集計方法で。このフォーラム「秋の夜長に」という“枕詞”を通年で多用していますけれども、実際のところ「秋の夜長に」の時期のほうが多く読まれるような“しっとり”したコンテンツが多いことを反映しているのかな、つまりこれは『季節性!』かな、と、たぶんこういうわけです。半年ごとに期間を分けて比べると、前年同期よりは減りました。ただ、Googleがアクセス元を「Japan」と特定できないアクセス(※その大半はクローラーとみられ=クッキーはおきらいですか=1アクセス1ユーザーとカウントされる)も同じように減っているので、何か曜日の並びですとか、よほど(世界的に)不景気ですとか、何か大きな通信障害があったのかとか恒常的に回線の混雑でクローラーが頻度を下げているとか、そういう(きわめて大域的な)外部要因での変動であって、こちらのコンテンツの多少の何かなどほとんど影響していない(だいたい同じ)と思いたいでした。(※過去形)ありがとうございました。
・2020年4月1日〜9月30日(※Google調べ)
| ユーザー | ページ/セッション | 平均セッション時間 | | | | | Japan | 36,528 | 4.48 | 00:03:40 | (不明) | 14,178 | 1.00 | <00:00:01 | その他 | 781 | | |
・2020年10月1日〜2021年3月31日(※Google調べ)
| ユーザー | ページ/セッション | 平均セッション時間 | | | | | Japan | 50,875 | 3.71 | 00:03:18 | (不明) | 12,721 | 1.01 | <00:00:01 | その他 | 1,195 | | |
・2021年4月1日〜9月30日(※Google調べ)
| ユーザー | ページ/セッション | 平均セッション時間 | | | | | Japan | 34,084 | 3.64 | 00:03:09 | (不明) | 12,564 | 1.00 | <00:00:01 | その他 | 1,436 | | |
この「(不明)」のところの件数が宇宙マイクロ背景放射のようなものだという感覚なんですね。
https://www.nhk.jp/p/cosmic/ts/WXVJVPGLNZ/episode/te/1663Z59LV8/
https://www.nhk-ondemand.jp/material/opus/N201909697700000/img/N201909697700000_x.jpg
にゃ・・・にゃんだってー!!(※変なTシャツのノリで)
・(参考)「宇宙マイクロ背景放射」とは
https://www.s.u-tokyo.ac.jp/ja/story/newsletter/keywords/02/01.html
> 神は初めに「光あれ」とのたもうたらしい(神様が何語でしゃべったのか不明なのでどうでもいいことではあるが,英語では“let there be light”と訳され,カリフォルニア大学バークレー校のロゴになっていたりする)。
まさに何語をしゃべるのかわからないクローラーが(表舞台のもの、ウラのものコミコミで)まんべんなく満ち溢れていてね。…うれしくないやい。(※ソコジャナイ。)
・[3747]
> 不都合な果実の皮©
https://userdisk.webry.biglobe.ne.jp/012/982/08/N000/000/001/124798973339916314037.jpg
…続きまして(※無言の間)、日本男児とも九州男児とも年長男児ともいわないけれど、ゲーム機からこそこそとネットにつないでマニアックなコンテンツをすごくありがたそうにすごい時間かけて見ていくというアクセスが(※今回の集計の期間だけでなく長年、だいたいそんな感じで=)ありました。何か状況に変化はございますでしょうか。(※敬語)
・2020年4月1日〜9月30日(※Google調べ)
ブラウザ | ユーザー | ページ/セッション | 平均セッション時間 | | | | | Playstation 4 | 37 | 1.52 | 110.21 | Playstation Vita Browser | 15 | 2.63 | 78.05 | Nintendo Browser | 11 | 7.84 | 482.00 | Nintendo 3DS Browser | 1 | 1.00 | 0.00 |
・2020年10月1日〜2021年3月31日(※Google調べ)
ブラウザ | ユーザー | ページ/セッション | 平均セッション時間 | | | | | Playstation Vita Browser | 21 | 4.68 | 00:07:18 | Nintendo Browser | 13 | 11.47 | 00:09:02 | Playstation 4 | 5 | 2.50 | 00:01:16 | Nintendo 3DS Browser | 3 | 1.00 | 00:00:00 |
・2021年4月1日〜9月30日(※Google調べ)
ブラウザ | ユーザー | ページ/セッション | 平均セッション時間 | | | | | Playstation Vita Browser | 11 | 1.42 | 00:00:53 | Nintendo Browser | 8 | 9.46 | 00:22:27 |
うーん。…うーん! そこに出てきていたような世代のゲーム機はだいたい陳腐化して、その世代のユーザーもスマホやPCを際限なく…じゃなくて、制限なく使える年齢にお育ちになった(※敬語)ので、もう件数は減っていくんだと、たぶんこういうわけです。それより新しい世代のゲーム機(のユーザー)では、わざわざゲーム機でこそこそとネットにつなぐ(ウェブをブラウズする)という利用はなくて、もっと堂々と何らかのタブレット端末からウェブを“見放題!”なんじゃ、ないんですかね。(ぶつぶつ)
・2020年4月1日〜2021年3月31日(※Google調べ)
オペレーティング システム | ユーザー | ページ/セッション | 平均セッション時間 | | | | | iOS | 32,983 | 1.58 | 00:01:14 | Windows | 26,854 | 8.09 | 00:07:06 | Android | 23,917 | 2.25 | 00:01:54 | Macintosh | 5,167 | 1.84 | 00:01:23 | Playstation 4 | 80 | 1.67 | 00:01:59 | Playstation Vita | 36 | 3.85 | 00:04:52 | Nintendo 3DS | 15 | 13.37 | 00:11:11 | Nintendo WiiU | 12 | 1.56 | 00:01:47 |
・2021年4月1日〜9月30日(※Google調べ)
オペレーティング システム | ユーザー | ページ/セッション | 平均セッション時間 | | | | | iOS | 12,071 | 1.74 | 00:01:22 | Windows | 9,908 | 6.81 | 00:06:06 | Android | 8,857 | 2.37 | 00:02:00 | Macintosh | 2,153 | 2.20 | 00:01:40 | Chrome OS | 188 | 2.43 | 00:01:09 | Linux | 100 | 1.96 | 00:01:16 | Playstation 4 | 27 | 2.53 | 00:05:43 | Playstation Vita | 11 | 1.42 | 00:00:53 | Nintendo 3DS | 4 | 12.44 | 00:31:24 | Nintendo WiiU | 3 | 3.33 | 00:03:05 |
こっちのがいいや。(※恐縮です。)
・2021年4月1日〜9月30日(※Google調べ)
大都市圏 | ユーザー | ページ/セッション | 平均セッション時間 | | | | | JP_KANTO | 20,963 | 4.42 | 00:03:50 | JP_KINKI | 5,770 | 2.30 | 00:01:58 | JP_OTHER | 5,012 | 2.42 | 00:02:07 | JP_CHUKYO | 2,415 | 2.41 | 00:02:13 | (不明) | 454 | 2.53 | 00:01:41 |
さらに倍。(違)「A列車で行こう9」というPCゲームはWindowsで動き関東の車両がいっぱい出てくるということ。(※体言止め)
★「駅名ランダマイザー(Z47T-DFK)」ご利用状況
・[4369]
> > 駅名ランダマイザー(Z47T-DFK)
> > 2019年10月1日から1年間に637人が使用
そちらのようすを伝えてください。(棒読み)下の表を見ていただいて&わたしのほうから(違)同じ言いかたをすれば「2019年10月1日から2年間に2757人が使用」なんですけれど、そこまで期間が長くなると、ユーザーの数えかた(の重複)が厳密(*)ではなくなる(どのくらいでクッキーを忘れて生まれ変わったような顔してアクセスしてくるかは端末やユーザーにより異なる=期間が長いほどばらけると思われる=比ゆ的にいえば輪郭がぼやける!)から、そんな言いかたしなくても、と、こういうわけです。「637人」「2757人」という数字をことさらにとらえて何か言うのでなく、「2757人」もあって、最少の「Tottori」でも「3人」あるのだから、都道府県ごとの傾向を見ていこうということがかろうじて可能になってきます。四国のセブンイレブンとはいわないけれど、最少の県からも「3人」のアクセスをいただくまでに2年かかったという言いかたができましょう。(※恐縮です。)
*もともと厳密ではないけれど、期間が長くなればどんどん「…無視できないレヴェル。」(※ジト目)になっていく、の意。
・(♪〜)
https://image.jimcdn.com/app/cms/image/transf/none/path/sd0d18b9e6e0c7c85/image/i107449efaa784afd/version/1358898491/image.jpg
http://www.shikoku-np.co.jp/img_news.aspx?id=20150306000271&no=1
https://pbs.twimg.com/media/CiRM976UkAAG4de.png
会話を聞いて正しいものをすべて選べ。…おっと、これはちょっと手ごわいぞ。(※真顔)
・2019年10月1日〜2021年9月30日(※Google調べ)
地域 | ユーザー | ページ/セッション | 平均セッション時間 | | | | | Yamanashi | 6 | 44.00 | 367.00 | Yamagata | 5 | 37.25 | 463.75 | Kochi | 4 | 33.00 | 150.00 | Wakayama | 13 | 31.00 | 181.80 | Toyama | 11 | 26.86 | 405.86 | Tochigi | 37 | 25.53 | 374.91 | Tokushima | 7 | 21.60 | 354.40 | Kyoto | 60 | 20.77 | 330.07 | Kagoshima | 6 | 20.25 | 683.25 | Oita | 6 | 20.00 | 81.00 | Tokyo | 665 | 17.85 | 583.20 | Ehime | 10 | 17.71 | 330.57 | Yamaguchi | 10 | 17.11 | 160.33 | Nagasaki | 10 | 16.86 | 360.00 | Gifu | 26 | 16.59 | 282.29 | Nagano | 22 | 16.47 | 683.80 | Hyogo | 83 | 16.13 | 532.75 | Okinawa | 7 | 16.00 | 651.50 | Nara | 25 | 15.79 | 387.00 | Mie | 30 | 15.69 | 499.38 | Kanagawa | 458 | 15.04 | 342.89 | Gunma | 18 | 13.13 | 29.63 | Ibaraki | 43 | 13.00 | 239.48 | Aichi | 137 | 11.58 | 342.38 | Chiba | 166 | 10.84 | 256.10 | Fukuoka | 64 | 10.69 | 284.38 | Hokkaido | 68 | 10.68 | 232.75 | Shizuoka | 42 | 10.47 | 374.03 | Saitama | 175 | 10.24 | 299.06 | Shimane | 10 | 10.00 | 23.67 | Niigata | 24 | 9.90 | 158.05 | Okayama | 16 | 9.77 | 310.23 | Miyazaki | 11 | 9.17 | 75.00 | Osaka | 311 | 8.63 | 263.45 | Fukushima | 13 | 8.59 | 82.59 | Kagawa | 10 | 8.57 | 81.14 | Akita | 8 | 8.13 | 165.97 | Aomori | 8 | 7.40 | 33.80 | Kumamoto | 8 | 7.00 | 62.60 | Fukui | 10 | 6.06 | 438.59 | Hiroshima | 22 | 5.41 | 155.24 | Tottori | 3 | 5.00 | 18.00 | Miyagi | 29 | 4.73 | 6.27 | Saga | 4 | 4.50 | 26.00 | Shiga | 33 | 2.97 | 263.24 | Iwate | 6 | 2.47 | 244.60 | Ishikawa | 16 | 2.04 | 28.85 | (not set) | 1 | 1.00 | 0.00 | | | | | | 2757 | 13.76 | 381.23 |
1回60分の「新日本風土記」みたいなのを47回分まとめて見るような気分。…もうおなかいっぱいっぱい!(※個人の感想です。)
・[3460]
> うみべのプリン([3329])
プリンは別腹です。…じゃなくて、哲学的でポエムな響き「うみべのプリン」。(※体言止め)
・…これが拙作「駅名ランダマイザー(Z47T-DFK)」のイメージですよ(※ため息)
https://www.tht-software.net/images/ban_Z47T-DFK.png
いいですか。「駅名ランダマイザー(Z47T-DFK)」は「堅さが特徴のお菓子です」([4170])…じゃなくて、リロード(再読込)してなんぼのツールです。(※表現は演出です。)
https://shop.r10s.jp/n-yakuhin/cabinet/syouhin1/4901330574352-1.jpg
それをなんですか。ほんのわずかの「ページ/セッション」で帰っちゃうということは、よくわからなかったか、興味がなかったということ。「ユーザー」が多い「Tokyo」が標準的なところだとして、それより「ページ/セッション」が多ければ、ああ、興味を持って何度もリロードして遊んでいってくれたんですねと。▼山梨、▼山形、▼高知、▼和歌山、▼富山、▼栃木、▼徳島、▼京都、▼鹿児島、それに▼大分のみなさーん!(※なぜかジョギングみたいなかっこうで)ありがとうございました。(※表現は演出です。)
・[3747]
> 巻き舌で「さいたまこーそくてつどーせんちょくつーうらわみそのゆきです」と一続きにまくしたててください。
・[3318]
> わあぃ高速さいたま高速さいたま(略)!
http://cdn.amanaimages.com/cen3tzG4fTr7Gtw1PoeRer/25977002843.jpg
・[3468]
> 高速鳥取でございます。
キツツキみたいな顔と速度で「高速鳥取」って10回いってみそ。(違)
・…トーキョー。…トーキョー。(※ウグイスみたいな声で!!)
https://www.atpress.ne.jp/news/71545
https://www.atpress.ne.jp/releases/71545/img_71545_4.jpg
https://youtu.be/Tn0VJvhe_Ho
> (♪JR-SH2〜)
> ゐちばんすぇんからぁ、…ぁ「逗子行き」はっしゃどぅえーす。(※まったり)
・[3661]
> > 35年間調律していないピアノで****を弾くとこうなる
https://www.youtube.com/watch?v=F5UjS8AzF78
> ぬふっ!! えいんしゃんとだよっ。古楽の楽しみだよっ。
> 簡保とか損保とか住宅ローンとかのCMにありそうだよね。
・[4372]
> …うかうかしておられませんな!(※ジョギングについていこうとする犬の気持ちで!!)
・[3590]
> > …出れる準備が整いましたら、え、わたしのほうからご案内(を)させていただきたいと、考えておりますので、えー、よろしくお願いイタシマス☆。えー、その間(かん)は、え、室内で写真撮影等(とう)、え、撮っていただければと思いますので、よろしくお願いイタシマス☆。以上でございます。
https://livedoor.blogimg.jp/silence1207-ukifusvw/imgs/9/3/931609b0.jpg
> > ♪チンっ
・(10月11日)
https://www.asahi.com/articles/ASPBC6VX8PBCUJHB014.html
> 前年に7年連続最下位を脱出して42位に上がり、再び最下位に戻ったことについては「(調査会社が)そういうシナリオを描いてくると思っていた。一番面白いから」と推測した。
> 「最下位は我々にとって痛くもかゆくもない」とも語った。
・[4639]
> ほとんど差がない(どの都道府県も同じくらいよくやっている)ことを意図的に無視して、無理やりな方法で「ランキング」してみせる(そこに「最下位」というものが無意味なかたちで発生する)ことは(統計の扱いとして)暴力的である。行政が目指すのは「ふつう」である。都道府県によって格差がついてはいけない。「ランキング」という(統計の処理上の)形式に固執することは、格差をなくす努力を否定するものである。
・[4466]
> このときちょうど、『市川市しんま』なるものをお探しの検索でこのフォーラムに来られた方がおいででした。ええ。『市川市しんま』。
https://pbs.twimg.com/media/E1B5HPSXMAQKu6U.png
> 『市川市しんま』。「真間」のことだとわかるのに5秒くらいかかりましたと申し添えます。メンマはアルデンテでお願いします。(※本文とは無関係です。)
・[4620]
> 深川のお参りでお供えはライフの「生芋こんにゃく」でいいんだという耳寄り情報。…耳じゃないけど。
・[3678]
> > ♪お・だ・きゅ・うー、♪おー・だー・きゅー
> > ♪お・だ・きゅ・うー、♪おー・だー・きゅー
> 丹沢山地にむかって「♪お・だ・きゅ・うー」って叫んでみそ。(…『みそ』!!)「♪おー・だー・きゅー」って返ってくるよ。…なにそれなにそれ!! たーのしー。(棒読み)
https://wikiwiki.jp/dqdic3rd/%E3%80%90%E3%82%84%E3%81%BE%E3%81%B3%E3%81%93%E3%81%AE%E3%81%B5%E3%81%88%E3%80%91
http://sonicrailgarden.sakura.ne.jp/seat_200/buffet/11.jpg
http://sonicrailgarden.sakura.ne.jp/seat_200/004.jpg
https://userdisk.webry.biglobe.ne.jp/000/670/69/N000/000/000/PICT0002_20081110132337.JPG
https://www.hitachi-systems-fs.co.jp/column/images/column46_03.gif
https://www.hitachi-systems-fs.co.jp/column/46.html
> 沖縄から札幌の遠距離通話でも、最大28msだから通話には支障がないんだよ。
・(公財)日本電信電話ユーザ協会「ウェブサイトの“○秒ルール”と“ユーザビリティ評価テスト”」
https://www.jtua.or.jp/ict/column/analysis/201606_01/
> SmartBear Software社が2012年に調査したデータです。
かしこい くまさん やわらかい。(※ひらがな)2012年のデータを紹介した2016年の記事をいま参照していてよいのか。えー…(てんてんてん)。
> この調査によると、3秒を過ぎると57%のユーザーが訪問を諦めるという結論になっています。
うーん。…うーん!
https://www.jtua.or.jp/wp/wp-content/uploads/2019/03/1.png
> ヒューリスティックとは「経験則」という意味です。ユーザビリティ専門のエンジニアやユーザーインタフェースに関わってきたデザイナーが、既知の経験則に照らし合わせてインタフェースを評価し、ユーザビリティ問題を明らかにする評価手法です。
> そのため、ヒューリスティック調査にあたる専門家は、ユーザーがどのような点でどう間違ったり迷ったりするかを経験的に知っている必要があります。そのため、少なくとも2、3年程度の経験者が担当することになります。
・(2020年1月14日)
https://president.jp/articles/-/31891?page=1
> 日本で最もカレールウの購入金額と購入数量が多いのは鳥取市だ。
https://pbs.twimg.com/media/Em4k70KUYAAN4wc.png
https://www.nikkan-gendai.com/articles/view/life/183398
> 「ヨーロッパでは、スプーンはスープに使うものとされ、肉や野菜などにはフォークを使います。コメは“野菜”に分類されるため、カレーライスもフォークを使うのが正式なヨーロッパ式。当店は、そんな先代の考えから、カレーライスにはフォークを添えてお出ししています」
> 「金沢カレーは、ルーの粘度が高くこってりしているのが特徴で、フォークでも容易にすくうことができます。また、千切りキャベツやカツがのっている場合が多い。それをうまく食べやすいように、金沢カレー系の店ではフォークを出すところが多いですね」
・[4532]
> > 最近、レストランでは肉や魚の付け合せにアレンジした米料理が出ることが多いですが、あくまでも、米=野菜の1種、という考え方なので、パンは必ず別添えされます。
> > 白いご飯は見たことがありませんね。
> > 白いご飯は見たことがありませんね。
> ▼「サフランライス・オン・ザ・白いお皿・ういず・エビふりゃー・トリニータ!!」については[4522]を参照。パン以外に白い食べもの&パンより白い食べものはゆるさん。本当でしょうか。▼「ブロッコリーの白いの」については[3714]を参照。
・「財」とは何だろう
https://kotobank.jp/word/%E8%B2%A1-67682
https://pbs.twimg.com/media/EukrsWtVEAEgRjS.png
> 経済学で、人間の欲望を満たし、人間が支配・処分することのできるもの。有り余るほどあって売買の対象とならないものを自由財、欲望に比して希少性をもち、その獲得になんらかの努力を必要とし、売買の対象となるものを経済財という。
※画像はイメージです。本文とは無関係です。
・[3615]
> 約12キロの新宿高速鉄道(※仮名)、駅間距離は3キロを標準とするとあらば、『高速永福!』と『高速吉祥寺!』の中間に1駅の設置が可能な距離にはなってまいるわけでございます。『高速杉並宮前(こーそくすぎなみみやまえ)!』『高速南荻窪(こーそくみなみおぎくぼ)!』『高速新久我山(こーそくしんくがやま)!』から…選べ! うーん、迷っちゃう♡(違)同様にいたしまして、ハルナヨコハマさん並び南台交差点を挟んでの立体横断施設を兼ねた駅部のようなものといたしましては、まさにそのような位置への設置が駅間距離だけでいえば可能ではないかと、たぶんこういうわけです。『高速榛名横浜!』『高速新南台!』『高速やよい百度石!』から選びたまへよしょくん(以下略)
> 大昔の計画では「三鷹」「新浜田山」「弥生町」「新宿」
・毎日新聞「福井駅に自動改札 「空白県」解消」(2018年9月9日)
https://mainichi.jp/articles/20180909/ddl/k18/020/133000c
> JR西日本の管内2府16県で唯一だった自動改札機「空白県」から抜け出した。
・[4367]
> 2秒で答えが出ないと「やめだやめだ!」がさくれつする。
・[4028]
> 5秒である。…実に、5秒である。動画本体はこれでいいんである。それを意味のある並べかたで並べてみせて意味というものをつむぐサイト(ページ)こそが重要なんである。○か×か。…『意味のある並べかたで並べてみせて意味というものをつむぐ』!!
Googleでいう「平均セッション時間」の「平均」というのが、さっぱりである。いちばん下の欄で「381.23」(秒)だいたい6分強ということであるけれど、2分も見ない多くの人と30分以上も見続ける人、それに、Googleがセッションをどうとらえるのか知らないけれど、その上限ぎりぎりみたいな間隔を置いて「あとで見る」した人など、混ざっているのである。これは個人のありようだから、きっと都道府県とは関係がない。ただ、都道府県ごとにある程度のユーザーがいれば、あるいはいないことによって、個人のありようが「平均」という1つの値にどう出てくるかというのは、数字としては無意味とまではいえないので(≒ほかに目ぼしい指標があるでもないので)、それなりに使おうと、こういうわけなんですね。(ねちねち)
※ユーザーごとの「リピート」いわゆる複数回のセッションのセッション時間が合計されているんですよね。集計の期間が長ければ「リピート」の回数も差が大きい。短い期間ごとの「移動平均」しないと。えー…(てんてんてん)。そういう面倒なことは忘れて、あくまで「平均セッション時間」として表示された数字をそのまま使う。ご了承ください。
・[4626]
> 教科「情報」でプログラミングを習うけれど、(大学院を目指して)データサイエンスに進むという方向性を持つ限り、最終的にはじぶんでは生のコードを極力、書かないのが正しい態度ということになる。
▼「PEAQ客観音質測定法」については[3471]を参照。
■「R with Excel」myz47t=read.table("clipboard",h=0,row.names=1) | par(cex=0.8) # 文字を小さく plot(myz47t[2:3], type="n") text(myz47t[2:3], label=row.names(myz47t)) | mycmpz47t <- prcomp(myz47t, scale=TRUE) biplot(mycmpz47t) # プロットされた図を右クリックしてコピーや保存をします | mykmcmpz47t <- kmeans(mycmpz47t$x, 5, nstart=50) write.table(mykmcmpz47t$cluster, file="clipboard", sep="\t") library(mclust) clPairs(myz47t[2:3], cl=mykmcmpz47t$cluster) # プロットされた図を右クリックしてコピーや保存をします |
上の表から47行を選択してコピーし、TSVとしてインポートするデスよ。
https://neorail.jp/forum/uploads/plot_z47t-dfk_20211001.png
https://neorail.jp/forum/uploads/biplot_z47t-dfk_20211001.png
https://neorail.jp/forum/uploads/plot_z47t-dfk_20211001_cmp_k5.png
> (between_SS / total_SS = 79.3 %)
だいたいそんなものと決めつけてクラスター数を「5」にする。いえね、主成分分析してからのPC1とPC2の平面でのバイプロット(…それをバイプロットというよ?)を見ながら、この出っ張りは1つのクラスターにしたいぞみたいに、あくまで見た目で5つに分けられるかなと“あたり”をつけて「エイヤ!」で「k=5」のk-meansを実行して、念のため「BCSS / TSS」の値([3527])を確かめたら「79.3%」だから、これでいいかな、と。(※恐縮です。)
・[3636]
> クラスター数は、「BCSS / TSS」の値([3527])が0.85程度になるよう決定しています。
・「どうしたらこの発想が出てくるのか。」(10月2日)
https://nlab.itmedia.co.jp/nl/articles/2110/02/news045.html
https://image.itmedia.co.jp/nl/articles/2110/02/kikka_202101002htd005.jpg
※画像はイメージです。
・[3527]
> 「BCSS / TSS」というのは、偏差平方和どうしの割り算ですね。
> > クラスタの二乗和の間(BCSS)−この値は、クラスタ間の分離を測定します。クラスタがひとつだけの場合、この値はゼロです。
> > 総二乗和(TSS)−BCSSとすべてのWCSSの合計に等しい値です。
> > BCSS/TSS比−クラスター内の結合度とクラスター分離度が高いほど、この値は1に近くなります。
> 「重なり」が『15%くらい』([3483])が、最も複雑なデータであるというような、そういうところに着目する指標って、ないんでしょうか。翻って、「『複雑さを最も温存』したクラスタリングができた」というのを「『よく』クラスタリングできた」とみなしたい、ということです。「BCSS / TSS」が単に大きければ大きいほどいいというものではないことは、明らかではございます。(ほとんど)ぜんぶバラバラにしてしまっては、「クラスター(房)」じゃないですよね。
ユーザーの「属性」として「都道府県」という47通りの値に着目するということは、47つある都道府県から1名ずつのユーザーが訪れたとき『47人47様!』であると仮定することになる。しかし、そこまでユーザーはばらばらだろうか。ここで、あくまで拙作「駅名ランダマイザー(Z47T-DFK)」にアクセスしたユーザーという集合に限ってのことではあるけれど、もう少し大ざっぱな分けかたに留めたい(分断し過ぎたくない)という想いが、出てくるんですね。(※無駄にとつとつと語ってください!)
・[3538]
> 都心からびみょーに離れた(お手ごろながら広くて快適な)家でなんでも済ませようというのが「埼玉・兵庫・岡山タイプ!(通勤快速&家庭でお好み焼きっ!)」
・[4630]
> 岡山だからしかたない。
・[3742]
> 変なところで唐突にあらわになる岡山や埼玉のひとっぽさ。お気をつけあーれ〜。(違)
・「mykmcmpz47t$cluster」deほい!
都道府県 | クラスター番号 | | | Yamanashi | 2 | Yamagata | 2 | Kochi | 2 | Wakayama | 2 | Toyama | 2 | Tochigi | 2 | Tokushima | 3 | Kyoto | 3 | Kagoshima | 4 | Oita | 1 | Tokyo | 5 | Ehime | 3 | Yamaguchi | 3 | Nagasaki | 3 | Gifu | 3 | Nagano | 4 | Hyogo | 4 | Okinawa | 4 | Nara | 3 | Mie | 4 | Kanagawa | 5 | Gunma | 1 | Ibaraki | 3 | Aichi | 3 | Chiba | 3 | Fukuoka | 3 | Hokkaido | 3 | Shizuoka | 3 | Saitama | 3 | Shimane | 1 | Niigata | 1 | Okayama | 3 | Miyazaki | 1 | Osaka | 5 | Fukushima | 1 | Kagawa | 1 | Akita | 1 | Aomori | 1 | Kumamoto | 1 | Fukui | 3 | Hiroshima | 1 | Tottori | 1 | Miyagi | 1 | Saga | 1 | Shiga | 1 | Iwate | 1 | Ishikawa | 1 |
…つまり?
クラスター1 | クラスター2 | クラスター3 | クラスター4 | クラスター5 | | | | | | Oita Gunma Shimane Niigata Miyazaki Fukushima Kagawa Akita Aomori Kumamoto Hiroshima Tottori Miyagi Saga Shiga Iwate Ishikawa | Yamanashi Yamagata Kochi Wakayama Toyama Tochigi | Tokushima Kyoto Ehime Yamaguchi Nagasaki Gifu Nara Ibaraki Aichi Chiba Fukuoka Hokkaido Shizuoka Saitama Okayama Fukui | Kagoshima Nagano Hyogo Okinawa Mie | Tokyo Kanagawa Osaka |
まさに「Saitama」と「Okayama」が同じクラスターに。なんかありがとうございました。
※「なんか」に傍点。えー…(てんてんてん)。
■「R with Excel」(続き)myhccmpz47t <- hclust(dist(mycmpz47t$x),method="ward.D2") plot(myhccmpz47t, cex=1) rect.hclust(myhccmpz47t, k=5, border="red") mycut5 <- cutree(myhccmpz47t, k=5) write.table(mycut5, file="clipboard", sep="\t", row.names=FALSE) |
https://neorail.jp/forum/uploads/hclust_z47t-dfk_20211001_cmp_k5.png
・[3302]
> 「分倍河原古戦場碑(BUBAIGAWARA BATTLE GROUND MONUMENT)」
・[4623]
> 「恐竜王国福井(DINOSAUR KINGDOM FUKUI)」とどっこいどっこい(違)
https://twitter.com/ik2kmc/status/1140481046707707905
> ビッグフラーイ!
> オオタニサーン!
> 毎回停める駐車場番号は55番。停める度に「ヒデキ マツーイ」のコールが毎回頭の中で流れて一人で面白がっていた。
(もったいぶった“溜め”で)…うるとら、…すーぱー? …ふくーい!!(※白目)
https://www.fukui-heizai.co.jp/
> 福井県並行在来線準備株式会社
えっ…(てんてんてん)。
> 福井県並行在来線準備株式会社
・[4110]
> 「なになにの松」といえば立派な感じで、それほどじゃないと言いたいときに『なになにの小松』(※「小」に傍点)と茶化す表現があった。
小松だけどマツーイは『ビック』あるよ?(※真顔)
http://gaf-anime.jp/img/story/story_sub08-5.jpg
https://animetourism88.com/application/files/3615/8501/7419/komatsushi_0312-2.jpg
・[3653]
> 『パンダワールド和歌山』とはここかとたずねたい。
・[3714]
> いずれも快速「みすず」「あいづライナー」「エアポート」それに「スーパーおれんじ」のイメージです
・[4514]
> 自販機のほうのダイドー!
・[4424]
> イオンネクスト準備(千葉市)
> イオンネクスト準備(千葉市)
・[3983]
> …ソースがないとカツカレーが食べられない子もいるんですよ!!(違)やーい金沢県人。…金沢って、県なんですか。
> > 富山は商人、金沢は職人の街です
> ソースあります! …ソースはあるんです!! だから落とせます!(キリッ
[3884]に倣って階層的クラスタリング(ウォード法)をば。k-meansとはびみょーに違う分割になるけれど、大勢は迷わない感じ。点がぐちゃっと重なってしまうバイプロットではお住まいの都道府県がよく見えないお客さまにおすすめです。…最初からMDS([4548])すればといった話。(※恐縮です。)
| |