|
・Read Wikipedia in English
(約5000字)
「ふわコレ」については[3473]をあらかじめ参照のこと。
・[3473]
> ・「ふわコレ」:収集したモノやデータを集計、分析して、因果関係などの仮説を導き出す自由研究。
> > 魚河岸あげ®を「8」とした場合の比較
> > はんぺん ふわふわ度6.7
> > 食パン ふわふわ度6.5
> > シフォンケーキ ふわふわ度5.6
収集すること(collection)の「コレ」でありつつ、データを検定すること(error check and correct)の「コレ」でもあって、まあ、ふわふわしたソレですのう。(恐縮です。)
・「correct」
http://ejje.weblio.jp/content/correct
> correct は規準に合って間違いのない,または一般的に認められた慣習に合った; accurate は注意・努力を払った結果として正確である; exact は事実・真理・規準に完全に合致している; precise は細かい点に至るまで正確である
ふわふわ度をcorrectするんです。すなわち、正確なふわふわ度が得られたと確かめられるまでサンプルを増やしていくんです。
・ウィキペディア「エラー検出訂正」
https://ja.wikipedia.org/wiki/%E8%AA%A4%E3%82%8A%E6%A4%9C%E5%87%BA%E8%A8%82%E6%AD%A3
改ざんの検出と、ノイズの除去(ノイズのため値がおかしくなっているようだと推定すること)というのは、おおらかな気持ち的には同じような発想で実装されていましょう。
わたしたち、つまるところ、やっぱり、ウィキペディアを引いてみてから本を探したりするんです。ウィキペディアがしっかりしていれば安心なんですけど、どうでしょうかねぇ。
・ウィキペディア「t検定」
https://ja.wikipedia.org/wiki/T%E6%A4%9C%E5%AE%9A
> スチューデントのt検定(Student's t-test)とも呼ばれるが、これは統計学者のウィリアム・ゴセットが雇用者であるギネスビール社に本名使用を許されずStudentというペンネームで最初の論文を発表した(1908年)ためである。
…ゲフンゲフン。とほほさん([3354])みたいですよね、わかります。
> 回帰直線の勾配が0と有意に異なるかどうかの検定。
> 母集団が正規分布に従っていない場合は、標本平均はt値からは多かれ少なかれ乖離する。実務的に標本から母集団が正規分布をしているかどうかという事を判断する事は、色々な検定方法があるとは言うものの、非常に困難である。ただし、中心極限定理によると、母集団の分布が正規分布に従わない標本でさえも、サンプル数が多くなればなるほど、標本平均は正規分布に近似していく。
そういう自信のなさそうな記述でなく、仮には「〜ことは〇〇定理から明らかである。」式の記述がなされたいかもですよ。本当でしょうか。
> 大学の初等の統計の教科書などではn>30などと載っている場合があるが、勿論多ければ多いほど良い
> t検定やZ検定が母集団の平均値に注目して仮説を立てるのに対して、ノンパラメトリック検定ではランキング、中央値や分布などに注目して仮説を立てることに注意が必要。
いや〜、それをノンパラメトリックというんではなかったでしょうか。本当でしょうか。
> 西岡康夫 『数学チュートリアル やさしく語る 確率統計』 オーム社、2013年。
「単位を取れる確率アップ! まずはこの1冊をやっ統計!」からの「実際の講義を聴いているような語りかけ口調」については[3401]を参照。
・(新刊)「ノンパラメトリックベイズ 点過程と統計的機械学習の数理」(2017年5月12日)
https://honto.jp/ebook/pd_28461945.html
> カテゴリ:大学生・院生
なるほど、もはや「大学生・院生と呼ばれるカテゴリ」なんですね!(違)16歳の人が「先取り」で眺めてみて、10年後までの展望を描こうというようなニーズも潜在的にはあろうかと思いました。逃げちゃだめだ…じゃなくて、笑えば…でもなくて、せんせいに聞きながら読めばいいと思うよ。さあさあ高校のせんせいは逃げちゃだめだ逃げちゃだめだっ! …そっちですかっ。(※演出です。)
> さぁ、無限次元の扉を開こう!確率分布の基礎から時系列データやスパースモデリングへの応用までを明快に説く。理論的な背景である測度論も基礎から丁寧に解説する親切設計。新進気鋭のエース研究者が、満を持して執筆した。全ベイジアン必携!
> ※この商品は紙の書籍のページを画像にした電子書籍です。文字だけを拡大することはできませんので、タブレットサイズの端末での閲読を推奨します。また、文字列のハイライトや検索、辞書の参照、引用などの機能も使用できません。
しかし、うーん。Web上で、動的に操作させながら理解を促すような教材にできないんでしょうかねぇ&それじゃ『マネタイズできへん』などとのうのうとですね(諸事情により略)…なんだかなぁ。
★Read Wikipedia in English
・Wikipedia「Statistics」
https://en.wikipedia.org/wiki/Statistics
> Statistics is a branch of mathematics dealing with the collection, analysis, interpretation, presentation, and organization of data.
おおー。(略)あとは目次だけ読めば完ぺきです!(えーっ)
> 1 Scope
> 2 Overview
> 3 Data collection
> 3.1 Sampling
> 3.2 Experimental and observational studies
> 4 Types of data
> 5 Terminology and theory of inferential statistics
> 6 Misuse
> 6.1 Misinterpretation: correlation
> 7 History of statistical science
> 8 Applications
> 8.1 Applied statistics, theoretical statistics and mathematical statistics
> 8.2 Machine learning and data mining
> 8.3 Statistics in society
> 8.4 Statistical computing
> 8.5 Statistics applied to mathematics or the arts
> 9 Specialized disciplines
3つ目の「コレ」として「correlation(相関)」があったです! いよいよもって、ふわふわしてきますねぇ。わかりますわかります。
・ふわcollection:データの収集
・ふわcorrection:データの検定
・ふわcorrelation:データ間の相関を分析
相関係数って、たったそれだけのものですので、相関係数を求めることだけをもって『相関分析!』などと呼びつけていただいては困るなぁ。うん。(見解です。)「多変量連関図」([3403])を参照いただきつつ、そのような多くのデータ(変量・変数)の間の複雑な関係を読み解くところまで取り組んで、やっと何かを分析している気がしてくるというものです。…たぶん!
・「correlation」
http://ejje.weblio.jp/content/correlation
印欧語根のほうなどポヤンと眺めますと、2つ目が見つかってから初めて、1つ目に遡って「この2つはつながりがあるのだろうか」といって云々するというような意味の語であると、そこまで分解して理解しなければいけないと思いました。(感想です。)魚へんの漢字など部首に分解して理解したり覚えたりするのと同じですよね。…その発想はなかった!(棒読み)
再びWikipediaです。
> Experiments
> Planning the research, including finding the number of replicates of the study, using the following information: preliminary estimates regarding the size of treatment effects, alternative hypotheses, and the estimated experimental variability.
とのことで、「treatment effects(⇒平均処置効果)」「Alternative hypothesis(対立仮説)」「experimental variability⇒Observational error(測定誤差)」を参照するよう指示(※)されてございます。
※これ、「参照してもしなくてもいい」ということでなく、「もし知らなければ、必ず参照するのですよ」という意味ですからね、の意。
> Statisticians recommend that experiments compare (at least) one new treatment with a standard treatment or control, to allow an unbiased estimate of the difference in treatment effects.
※unbiased estimate:不偏推定値。
・「不偏推定量」と「不偏推定値」
https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q10142338250
> ある推定量の期待値が母集団分布における対応する量と一致するとき、その推定量を不偏推定量といいます。標本平均Tが不偏推定量で、今たくさん得られたTの値ひとつひとつが不偏推定値というわけです。
デスヨネ〜…。日本語のウィキペディア「偏り」の記述は、どうにも不安になりますのう。(「値」と「量」をあまり意識せずに書かれているやのような印象がございます。)
・「星野「調査観察データの統計科学」第3章」読書会のスライドだということです付近
https://www.slideshare.net/shuyo/observational-study-causality-52737410
これ、買ったまま読んでないやつ! うわぁ…すみませんすみません**が**で本当にスミマセンっ!(本当です。買ったのに読んでないんです!)
英語の「treatment effects」のまま述べれば、(統計を使う)どんな分野から見てもあまり違和感がないだろうと思うんですけど(⇒「実験者による介入効果(干渉・影響)」とでもいうような感じで)、日本語で「処置効果」といってしまうと、医学・薬学・疫学の専門用語になってしまって、…なんだかなぁ。
| |