統計学といくつかのよしなしごと

つれづれなるままに、日くらし統計学にむかひて、心にうつりゆくよしなし事を、そこはかとなく書きつくれば、あやしうこそものぐるほしけれ。

モンティ・ホール問題とその派生形による意思決定のシミュレーション

めっちゃ有名なあれ モンティ・ホール問題はヒューリスティックな意思決定と確率論的な正解が異なる有名な例題で、以下のようなクイズ形式のゲームを考える(リンクより引用)。 モンティ・モール問題: 0: 三つの扉がある。一つは正解。二つは不正解。 1:挑戦…

時系列分析の理論と実装を概観する①ARIMA過程まで

1.時系列分析における個人的諸混乱 実務ではしょっちゅう時系列データに出くわすが、これを使って動向の予測やメカニズムの解釈をしたいと思ったときのデータの扱いが難しくて混乱しがちだ。ただ正しく使えば実務上大いに役に立つし、改めて回帰の枠組みを見…

コレポンは何をやっているのか②検討の流れ

前回 前回の記事でマーケティングリサーチにおいて多用されるコレスポンデンス分析について、その可視化までの数理を概観した。今回は出力されたマップやその他の統計量を用いた検討のポイントを見ていく。前回同様主な参考文献は以下。対応分析入門 原理か…

コレポンは何をやっているのか①数理の概要

告解 ここ数か月とても忙しく仕事をしていて*1、前の投稿から半年以上経ってしまった。とはいえ何よりも自分の知識や経験の定着を一番の目的にブログを書いているので、これだけ空いたのは怠慢でしかないんだよなぁ。。もう少し頑張ろうと思います。 マーケ…

顧客のセグメント移動を概観するはなし

優良顧客はいつまで優良か 企業に対する顧客の貢献度を何等か数値化したうえでセグメントを設定し、優良顧客にはこれこれ、離脱顧客にはそれそれといったアプローチをとるのは王道中の王道になっている。差し当たっての問題は「いかにして顧客セグメントを設…

ビジネス現場における統計的仮説検定のはなし

弁明 「何をいまさら」感のあるタイトルです。ビジネス現場における仮説検定のはなしは各種ブログで散々書かれているし、機械学習全盛の時代にあまり興味を持たれるはなしでもなさそうな気もする。それでもやはり現場では「有意差」を気にされる場面は相変わ…

ガンマ分布のはなし

いまいちイメージがつかみにくい*1 「ガンマ分布!」と言われてもイマイチなんのこっちゃわかりにくい気がする。二項分布やポアソン分布のように直感的なイメージを持ちにくく、教科書でも「ガンマ分布は指数分布の一般化です」などとどことなく味気ないから…

多重共線性の仕組みとシミュレーション

重回帰分析において重要な問題となる多重共線性について、仕組みとシミュレーションで解説します。

中心極限定理に頼ってイノベーター理論をそれっぽく使う

イノベーター理論はなぜ正規分布なのか? マーケターなら誰でも知っているだろう古典的な理論に、イノベーター理論がある。セグメントの設定とその切り方(分布)について実務的、概念的にはわかりやすく納得感があるのでよく出てくる考え方だが、統計をかじ…

このブログについて

このブログは統計学をほぼ独学で学び、日々の業務においてそれを使っている(あるいは使うチャンスを常にうかがっている)人間による、統計学の学習内容とそれに付随するよしなしごとのノートです。何分大部分において独学なので、間違いなど多々あるかもし…