リー ブログ。 p値と仲良くなる

IaCを意識したCLI開発のエッセンス

チームでのElasticsearchの運用と課題 エムスリーの検索基盤チームではElasticsearchを利用しています。 運用がかなりシンプルになったはず。 p値や統計的仮説検定に関する理論上重要な話は素晴らしい書籍がたくさん存在するのでそちらを参照していただくとして、今回は少し変わった観点からp値を眺めてみます。 タイトルの通り今回はIaCツールを作るのではなくIaCのプラクティスを意識してCLIを作るお話になるのでご了承ください。 p値は意思決定のための定量的で明確な基準を与えてくれるためとても便利ですが、盲目的に数字だけを追いかけると誤った意思決定に繋がる可能性があります。 の分布をp値の分布に変換する際に、「プログラミングのための確率統計(平岡 和幸 著・堀 玄 著)」の4章「連続値の確率分布」を参考にしました。 まとめと教訓 今回は、真のパラメータが帰無仮説と近い場合と遠い場合の2パターンに対して、p値の分布がどのように変わるかを具体的に見てみました。

もっと

◆年末年始営業日ご案内◆:2020年12月2日|グレイリー(Grailey)のブログ|ホットペッパービューティー

ここで、nが十分大きい場合、 は以下のような正規分布に従うと近似できます。

もっと

◆年末年始営業日ご案内◆:2020年12月2日|グレイリー(Grailey)のブログ|ホットペッパービューティー

これを踏まえて、p値の分布を下記のようなコードで描いてみました。 : 端の扱いが雑なので、p値が0付近の確率を計算する場合は、先に反対側の領域を計算して1から引くのが良いと思います。 qa' eskeeper また直接的なタイピングを要求しないといけないインターフェースは排除できるようにしておきます。 正規分布に近似した の確率密度分布 さらに、p値の分布を図示すると下記のようになります。 対立仮説: という仮説検定を行います。 必要に応じて、関心のあるドメインに読み替えてください。

もっと

p値と仲良くなる

帰無仮説で仮定したパラメータとあまり乖離していない場合 それぞれにおいて、p値の実現値がどのような形の分布従うのかを計算してみます。 社内で積極的に検索改善が行われており複数のIndexが管理がしづらいという問題がありました。 特に私のように若い社員にとって、このようにデータを根拠に物事を進めていく風土はとても居心地が良いです。 仕事では主に検索周りを担当しています。 一緒にデータに基づいた意思決定で事業を推進していきましょう! : 参考文献の章で何冊か紹介しています。 import scipy. ここからどのような教訓が得られるでしょうか。 設定の外在化 設定を外在化できることは言うまでもなく重要です。

もっと

◆年末年始営業日ご案内◆:2020年12月2日|グレイリー(Grailey)のブログ|ホットペッパービューティー

yaml 標準入力にするメリットは yamlを出力するツールと一緒に使いやすくするためです。 冪等性• そして、p値は「帰無仮説を仮定した時に、今手元にあるデータよりも極端な値が得られる確率」と定義されます。 「Infrastructure as Code」という本では 「無人実行はコマンドとして自動で実行できるだけでは不十分であり、人間が関与しなくても高い信頼性で実行できることが重要」と記しています。 帰無仮説で仮定したパラメータと大きく乖離している場合• 下記の例では yqというyaml操作ツールを使ってQA用の設定だけ切り出して標準入力として eskeeperに渡す例です。 下記のように定義ファイルでElasticsearchの状態を宣言できます。

もっと

IaCを意識したCLI開発のエッセンス

このとき、先ほどと同様に「 が帰無仮説に従う場合」と「 が真の分布に従う場合」それぞれについて、 の分布を描くと下記のようになります。 次に、具体的な積分値を下記のような関数で計算しました。 : 参考文献「サンプルサイズの決め方」には、「 かつ のとき、 が十分大きいとみなす」という基準が記されています。 パラメータ化 eskeeperでは上から4つをサポートしています。 準備 以下では、広告や記事などの推薦システムを想定して、あるアイテムに対して発生するクリックモデル化する場合を考えます。 なぜなら、「まだ若いから」「まだ経験が浅いから」などの理由で意見が通らないことが起きにくいからです。

もっと