フォーラム - neorail.jp R16
発行:2018/4/9
更新:2021/11/3

[3635]

【縦書きディープなラーニング(※表示は横書きです。)】

『ぎょうざパーティー効果』を読み解く


堺市は何市中の3位になったのか
堺市の「ぎょうざ」は何が3位なのか
堺市の「ぎょうざ」に何が起きたのか(あるいは起きていないのか)
「家計調査」とは
「POSデータ」とは
「ぎょうざパーティー」で「バンドワゴン効果」「スノッブ効果」「ヴェブレン効果」が同時に起きる?
「R with Excel」
『エクセルぎょうざ』

(約22000字)

 …ぎょうざ! ぎょうざ!

[3440]
 > さあさあタコパ([3438])…いえ、すき焼き([3420])…いえ、座面の高いイスの上に***立ちしながら小さなお子さまに大好評「ぎょうざパーティー」にあっては「※お肉屋さんの挽肉を使用しています。」との表示のほうなど…ぎゃふん。つごう([3403])2回ほど「ぎょうざっ、ぎょうざっ!」といって、その実、座面の高いイスの上に***立ちしてお手伝いできるよろこび…ひいては『本件イス』を指して「ぎょうざ!」といってよろこんでいるのかもですぞ。本当でしょうか。

 がびーん。(※表現は演出です。)

・(再掲)「理系の矜持」のイメージです
 https://next.rikunabi.com/tech/docs/ct_s03600.jsp?p=002415
 https://next.rikunabi.com/tech/contents/ts_report/img/201511/002415/tech-362_03.gif

[3552]
 https://goo.gl/maps/ZRnrNaWQXdH2

 > > DVDレコーダーでタイトルに餃子といれたかったのですが漢字変換してもでてこなくて・・・結局、きょうでもこうでぎょうでも出てきませんでした!

 > …もう『鮫子パーティー』でいいよっ。

 つくらないで焼くだけの「ぎょうざパーティー」もあるんですね。鮫子びっくりだよ。(棒読み)


●堺市は何市中の3位になったのか


 8日、読売新聞が報じました。

・読売新聞(2018年4月8日)
 http://www.yomiuri.co.jp/economy/20180408-OYT1T50052.html

 > 全国の県庁所在地と政令市で、ギョーザの購入額日本一の座を巡り、宇都宮市と静岡県浜松市が激しく競り合う中、堺市が昨年、初めて3位に食い込み、地元で話題を呼んでいる。

 もとの統計を直接、参照しましょう。

・総務省統計局「家計調査(二人以上の世帯) 品目別都道府県庁所在市及び政令指定都市ランキング(平成27年(2015年)〜29年(2017年)平均)」
 http://www.stat.go.jp/data/kakei/5.html

・総務省「市町村数の変遷と明治・昭和の大合併の特徴」
 http://www.soumu.go.jp/gapei/gapei2.html

 全国には1,718の市町村があり、市に限っても790あります。そのうちの52の市に着目するのが「都道府県庁所在市及び政令指定都市」です。全国の市町村から、大きな市を選んだサンプルであり、おおまかには「全国平均」に対して「全国の都市部」ではどのような傾向(全国平均からの乖離)があるか(ないか)ということを見るための調査です。この52の市の中で「順位」に着目することは、ほとんど意味を持たないことを理解しなければなりません。


●堺市の「ぎょうざ」は何が3位なのか


 総務省統計局のExcelファイルを参照します。

 http://www.stat.go.jp/data/kakei/zuhyou/rank10.xls
 https://www.e-stat.go.jp/stat-search/file-download?statInfId=000031674338&fileKind=0

※ファイルはExcelです。

 「ぎょうざ」の「全国平均」は、「購入頻度(100世帯あたり)」が684、「支出金額」が2,161、「購入世帯数(10,000分 比)」が3,746とされています。このうち、今回のニュースで「3位」といって注目されているのは「支出金額」です。

・外食(店内で食べるもの)と冷凍食品を除くということで、外食のチェーン店の看板を掲げた売店で購入したものは含まれるはずです
・「ぎょうざ」をまったく購入しない世帯も含め、1世帯あたり、年間に6.84回、「ぎょうざ」を購入しているという調査結果です
・「家計調査」では「家計簿」をつけるという体裁でデータを集めます。1回の買い物ごとに記入するということです。ここから「ぎょうざ」1回の購入額がわかるとして、その1回は必ず家庭で食べるもので、その量は1世帯分であると仮定していることになるでしょうか(冷凍食品は含まないので「まとめ買い」はないと考えられるでしょうか)
・そのようにして集計された(単身世帯を除く)1世帯あたりの「支出金額」が、全国平均では2,161円、堺市では3,092円になったということです

※「家計調査」そのものは単身世帯も対象にしていますが、かなり性格が異なるので集計は分かれています。このニュースでいう「支出金額」に、単身世帯は含まれません。

・(参考)島根県 政策企画局 統計調査課「しまね統計情報データベース」の「統計用語集」より「分布・平均・分散」
 http://pref.shimane-toukei.jp/index.php?view=15601
 http://pref.shimane-toukei.jp/index.php?view=15564

 > あらゆる自然・社会現象の背後に母集団分布と呼ばれる確率分布が存在すると仮定する。取りうる値が確率的に決まるような変数のことを確率変数と呼び、確率変数と変数がその値を取る確率との対応を示したものを確率分布という。確率分布は確率(密度)関数によって表され、2項分布など種々の分布の種類がある。正規分布は釣鐘型の左右対称な曲線で示される。

 「ぎょうざ」の「支出金額」を全国の1,718の市町村ごとに集計したとき、「支出金額」がある金額になった市町村はいくつあるのか(ヒストグラムを描くためにとった区間に入る市町村の数)という頻度の分布は、正規分布に従うと仮定できるでしょう。

・正規分布に従うと仮定して全国1,718市町村「支出金額」を推定した例(※Rの「rnorm関数」を使用)
 https://neorail.jp/forum/uploads/probabilistic_gyoza_rank.png

https://neorail.jp/forum/uploads/probabilistic_gyoza_rank.png


■「R with Excel」

正規分布に従う乱数を
1718個つくる
x <- rnorm(1718)
プロットして確かめるplot(x)
hist(x)
つくった乱数を
TSVファイルに書き出す
write.table(x, file="x.tsv", sep="\t")
(「x.tsv」をExcelで開きます)


 https://neorail.jp/forum/uploads/probabilistic_gyoza_rank_x.tsv

・Excelに2列×1719行のデータが読み込まれました
・まず、A列とB列を選択し、B列の値の降順でソートします
・これとは別に、総務省統計局「rank10.xls」から「全国平均 2,162」「1位 4,348」の数字を読み取り、引き算して「2,186」という数字を得ておきます

※この「全国平均」は、「全国から選んだ52市での平均」ではなく、「全国1,718市町村(のうち、家計調査の対象となる市町村)の平均」であるという理解です。

■『エクセルぎょうざ』

ABCD
1x=2186/B2
25983.214126386=B2*D$1+2162
37443.072895079=B3*D$1+2162
412272.958563052=B4*D$1+2162
517082.840199711=B5*D$1+2162
(中略)
17191258-3.100030372=B1719*D$1+2162


・セル「D1」と「C2」を上記の通り入力し、「C2」をコピーして「C3」から「C1719」までに貼り付けます
・C列を選択して「縦棒グラフ」を描けば完成です。おいしくいただきましょう