統計学

帰無仮説と対立仮説

統計学において「仮説の是非」は、検定(仮説検定)によって決められます(*1)。仮説検定では、まず「帰無仮説」を立て、次に「対立仮説」を立てます(*2)。主張したい仮説は「対立仮説」になります(*2)。 手本引きを例にすると、ある賭場で「六が50%以上の確…

最小二乗法

統計学において「真の値」を推測する方法として、最小二乗法があります(*1)。最小二乗法とは、残差(ズレ)の二乗の和を最小化する推定法です(*2)。回帰式の「切片」と「回帰係数」は最小二乗法によって求められます(*3)。 <引用・参考文献> *1 『統計学が…

回帰式

2つの数値が比例し、線形の関係であれば、回帰直線で現すことができます(*1)。回帰直線を示す式が、回帰式です(*1)。 「組員の月額上納金」(x)と「親分の年収」(y)を例にします。「組員の月額上納金」を独立変数(x)、「親分の年収」を従属変数(y)と…

1試合平均得点数

プロ野球各チームの1試合平均「得点数」は以下の通りです(*1)。 *小数第三位を四捨五入 セリーグ(8月31日時点 平均試合数122.67 標準偏差1.80)(*1) 1位 巨人 4.76 2位 DeNA 4.16 3位 広島 4.14 4位 阪神 3.68 5位 中日 3.88 6位 ヤクルト 4.54 パリーグ(…

QS

先発投手の能力を示す指標の1つがQSです。QSとは、Quality Startの略です(*1)。6回以上先発し、加えて自責点3点以内に抑えた場合、QSがつきます(*1)。勝利数は「自軍の打線の援護」にも影響されます。QSにおいては、投手の能力のみが現されます。全先発数に…

奪三振率

「三振奪取力」の指標として知られるのが、奪三振率です(*1)。以下の計算式で、奪三振率は求められます(*1)。 奪三振率=奪三振×9÷投球回 奪三振率は、9イニングつまり「1試合」あたりの数値に置き換えられる為、「×9」という処理がされています(*1)。「1投…

守備率

野球における守備能力の指標の1つが守備率です(*1)。守備率は以下の計算式で求められます(*1)。 例えば刺殺30、補殺40、失策4の選手の場合、守備率は0.946です。また刺殺5、補殺10、失策3の選手の場合、守備率は0.833です。打球処理機会に対し、失策をしなか…

奪三振と与四球の標準偏差

プロ野球で活躍する実力投手達の奪三振数、与四球数の「平均からの差(標準偏差)」を調べてみました。 2019年6月30日時点、規定投球回数(=チーム試合数)到達の両リーグ投手を対象にしました(*1)。セ・リーグの対象投手は11人、パ・リーグの対象投手も11…

説明変数と目的変数

統計学において「結果」の変数は、目的変数と呼ばれます(*1)。一方、「要因」の変数は説明変数と呼ばれます(*1)。覚醒剤小売価格の市中相場は季節によって変動します(*2)。盆暮れは覚醒剤需要が高まり、小売価格が高くなります(*2)。この場合、季節が「説明…

WHIP

野球の守備おいて重要なのが「出塁」させないことです。「投手の1イニングに出した出塁数」の指標として知られるのがWHIP (Walks plus Hits per Inning Pitchedの略)です(*1)。WHIPの計算式は以下です(*1)。 <引用・参考文献> *1 『岩波 科学ライブラリ―…

パークファクター

「本拠地の野球場におけるホームランの出やすさ」を表す指標として「パークファクター」があります(*1)。パークファクターは以下の計算式で求められます(*1)。 つまり「本拠地1試合において本塁打及び被本塁打の出る率」と「他球場1試合において本塁打及び被…

出塁率と長打率の計算式

野球においても統計学的な要素は用いられています。打者の能力を測る指標として「出塁率」「長打率」があります。計算式は以下です(*1)。 <引用・参考文献> *1 『岩波 科学ライブラリ―223 勝てる野球の統計学 セイバーメトリクス』(鳥越規央・データスタ…

相関係数の数式

相関係数(相関の強さを表す指標)rの数式は以下になります(*1)。 <引用・参考文献> *1 『ブルーバックスB-2085 今日から使える統計解析 普及版 理論の基礎と実用の“勘どころ”』(大村平、2019年、講談社), p238

標準偏差の数式

標準偏差の数式は以下になります(*1)。 <引用・参考文献> *1 『ブルーバックスB-2085 今日から使える統計解析 普及版 理論の基礎と実用の“勘どころ”』(大村平、2019年、講談社), p34

無作為抽出

統計学において「母集団」から「標本」を抽出する際、「無作為」に行うことが求められます(*1)。「無作為」の逆、作為的な標本抽出は避けなければなりません。例えば大阪府警が大阪府に活動拠点を置くヤクザ組織の実態を調査する際、大阪の繁華街・ミナミに…

オッズ比

統計学において「因子(要因)と結果の関係の強さ」を確認する方法として、オッズ比があります(*1)。オッズ比は、数値が高いほど、因子と結果の関係の強さを示します(*1)。 ヤクザ組織における「50歳代以上の構成員のキャリア」を例にオッズ比について説明し…

相関

2つのデータの関係性を知りたい時、「相関」は重要な道具となります。例えば「関東最大ヤクザ組織の住吉会の構成員数」と「暴力団排除条例全国施行(2011年)以降 (*1)の経過した年数」の関係性を知りたい場合、相関が役立ちます。 相関とは、1つのデータの…

標準偏差

ばらつきの大きさを示す尺度として「標準偏差」があります(*1)。標準偏差とは、平均からの差のことです。 例えばヤクザ組織の2次団体A会は8つの下部団体を持っているとします。8つの下部団体の総構成員数は48人です。一方2次団体B連合も8つの下部団体を持ち…

母集団と標本

統計学の有用の1つとして、「部分の性質」から全体の性質を推測できることがあります。統計学では対象とする全体は「母集団」、母集団の中から調査の為に取り出された一部見本は「標本」と呼ばれます(*1)。「標本」の性質から「母集団」の性質を推測する統計…

統計学のデータ

統計学におけるデータは4つに分けられます。名義尺度、順序尺度、間隔尺度、比例尺度の4つです。ヤクザ組織の世界で表していくと名義尺度とは、例えば指定暴力団を「1」、非指定暴力団を「2」と名義的に数値化する尺度のことです(*1)。順序尺度は、構成員数…