Which League is Best?

この作品は Madeline Gall との共著です。

あるスポーツのスカウティングは簡単ですが(カレッジフットボール → NFL)、NHL のスカウティングはもっと大変なプロセスになることがあります。 45を超える国際的なアイスホッケーリーグから選手が集まり、それぞれが独自の規制や困難を抱えている中で、どのようにして選手のパフォーマンスの質を適切に評価することができるのでしょうか。 マイナーリーグで他の18歳を相手にプレーする18歳の得点と、NHLでベテランを相手にプレーする18歳の得点が同じ価値であってはならないのです。

このことを説明するために、Rob Vollmanのhockey translation factorsやGabriel DesjardinのNHL Equivalency Ratings(NHLe)のような選手の翻訳変数などの他の試みがあります。 DesjardinのNHLeは以前、リーグからNHLへの移行(他のリーグからNHLへの移行)に対する選手のパフォーマンスを比較・予測する問題に取り組んでいました。 手軽で一般的な比較には最適で、確かに利点(簡単で素早く計算できる)もありますが、その方法にはいくつかの欠点があります。 まず、チームの質、ポジション、年齢を必ずしもコントロールできていなかったことです。 換算係数は、NHLで20試合以上プレーする前に、所定のリーグで20試合以上プレーした選手の統計データを使って計算されます。 つまり、このような中間の遷移に関する貴重なデータがたくさんあるにもかかわらず、それが使われていないのです。

このプロジェクトでは、これらの欠点を考慮した調整済み z スコア指標を使用して、リーグ間のプレーヤーのパフォーマンスを比較および予測する新しい方法を紹介します。 この指標は、年齢、リーグ、シーズン、ポジションなど、選手の P/PG 指標に影響を与える要因を制御し、関心のあるあらゆるリーグに適用することが可能です。 この新しい指標は、リーグごとに異なる多くの特性があるため、必要なものです。 プレースタイルや対戦相手の難易度が異なるため、世界中のホッケーリーグで選手のパフォーマンスを比較評価するための一貫した指標は存在しないのです。 ゴールキーパーの強さ、ペナルティ率、リンクの大きさといった他の要因も、国際リーグ間で一貫性がありません。 同じような強さの選手が一見異なるパフォーマンスを発揮しているように見えるシナリオが起こり得るのです

このような例として、直近の2019年ドラフトからトーマス・ハーレーとヴィル・ハイノーラが挙げられます。 両者は異なるリーグで異なる相手と対戦し、大きく異なる数字を残した選手でありながら、ほぼ同じと評価された。 ハーレーはカナディアン・ジュニア・アイスホッケー・リーグでプレーするアメリカ生まれのディフェンスマンで、現在はオンタリオ・ホッケー・リーグのミシソーガ・スティールヘッズでプレーしている。 2019年NHLエントリードラフト1巡目でダラス・スターズから全体18位で指名された。 一方、ハイノラはフィンランドのプロアイスホッケーディフェンスマンで、現在はナショナルホッケーリーグのウィニペグジェッツのプロスペクトとして、リーガのルッコにレンタルされてプレーしています。 彼は2019年のNHLエントリードラフトに参加できる国際的なスケーターの中でトップクラスにランクインしている。 ハイノーラはジェッツから全体20位でドラフト指名された。 この2人の選手は、結局、それぞれのチームからどのように評価されたのだろうか。 おそらく、スカウティング情報に加えて、我々の指標と似たようなものを使っているのだろう。

私たちの指標は、NHLe のような以前のアプローチだけでなく、最近急増している Elo にも触発されました。 Eloは、ゼロサムゲームにおける選手の相対的なスキルレベルを計算するための手法です。 当初はチェスのプレイヤーのレーティングを測定するために作られましたが、Eloはプロスポーツのような他の様々なシナリオにも適用することができます。 スポーツにおけるEloの詳細と例については、538によるチュートリアルをご覧ください。 Eloは単純に対比較モデルのための特定のモデルです。 私たちが一対比較/Elo モデルを作成したプロセスを説明します。

始めに、eliteprospects.com からスクラップした、利用可能な選手情報 (名前、ポジション、リーグ、誕生日など) および選手統計 (出場試合、ゴール、アシストなど) から約 300,000 件の観測値を含むデータセットを使用しました。 私たちが最初にぶつかった問題の一つは、年齢、リーグの強さ、ポジションなどを制御して、選手の統計を比較するために、どのような応答変数を作成できるかということでした。 NHLでは、WAR、GAR、Corsiなど、さまざまな測定方法で選手のパフォーマンスが広く計算されています。 しかし、データ収集はすべてのリーグで平等ではありません。 ヒットやブロックなどのスタッツのトラッキングに積極的でないリーグもあり、そのため、回帰の要因として、すべてのリーグに偏在している変数しか利用できませんでした。

新しい応答変数を作成するとき、年齢、シーズン、ポジション、およびリーグを説明する方法で、1 試合あたりのポイントを変換したいと思いました。 最初のステップは、1 試合あたりのポイントの対数に 1 を足したものでした。 この変換は、生のpoint per gameが非常に右側に偏っているのに対して、より正規の分布を持っていました。 対数変換によってデータがより正規分布に見えるようになったとはいえ、1試合あたりの対数得点はまだ上記の変数を考慮に入れていません。 我々は、そのような変数を考慮するために、各選手の対数試合得点のzスコアを作成することにしました。 まず、ポジション、シーズン、リーグ、年齢の各グループの平均と標準偏差を算出した。 そして、コントロールする変数に関連する平均と標準偏差を使用して、各選手の観察に対してzスコアが計算されました。 こうして、1試合あたりの得点の対数に1を加えたものが、最終的な応答変数となりました。 z-スコアは、ゲームごとの対数ポイントよりもさらに正規分布しているように見え、ディフェンダーやフォワードのようなグループのz-スコアも正規分布していることがわかりました。
ペア比較モデルの作成、これはEloモデルに非常に似ています。 まず始めに、比較データフレームを構築します。 各プレーヤーについて、プレーヤーとリーグのシーズンのペアを作成し、プレーヤーがプレーしたリーグについて、すべてのペアワイズ比較の小さなデータフレームがあるようにします。 つまり、ある選手が K 個のリーグでプレーしたことがある場合、その選手は K 個の選択-2 組の選手-リーグ-シーズンを持つことになります。 次に、同じリーグを持つペアや、1シーズン以上離れているペアを排除して、結果変数を計算します。 この変数は,使用する回帰によって,連続またはバイナリのいずれかになる. プレーするのが「難しい」リーグは、実際にはより低い結果変数を持つということを理解することが重要です。 これは、より難しいリーグは、より良いディフェンスとゴールキーパーがいて、得点することをより難しくしているという仮定に基づいています。

1.Krisレタン

1.158

選手名 リーグ シーズン Z-スコア
Kris Letang QMJHL 2006-07 1.829
Kris Letang NHL 2006-07
Kris Letang AHL 2007-08 1.1.557
オリジナルデータセットからのスニペットの一例で、Kris Letangの様々なリーグとZスコアの詳細情報が記載されています。
リーグ1 シーズン1 Zスコア1 リーグ2 シーズン2 Z-を含む。スコア2 Z-Score Difference
QMJHL 2006-07 1.829 NHL 2006-07 1.158 0.0 0.671
nhl 2006-07 1.158 ahl 2007-08 1.557 -0.399
qmjhl 2006-07 1.829 ahl 2007-08 1.557 0.272
この場合、結果変数はZスコアの差(連続変数)ですが、使用する回帰の種類によっては、0または1のバイナリ勝敗結果もあり得ます。

一対比較モデルを構築した後、係数を計算するために様々なタイプの回帰を使用しました。 我々は、バイナリ結果を作成する自作ロジスティック・モデル、Bradley Terry モデル (R の BTm パッケージを使用)、および連続結果を作成する普通最小二乗回帰の両方を使用することに焦点を当てました。 どの回帰が最も正確な結果を生み出すかを評価するために、まず、ペアとなったデータを70対30に分割し、トレーニングサンプルとテストサンプルとしました。 そして、調整された1ゲームあたりのポイントZスコアに基づいて、すべてのリーグの勝利の確率を予測しました。 勝利」の閾値が設定され,確率が閾値より大きい場合,予測結果は=1であった. そこから,各モデルの予測精度を計算するために,予測された結果と実際の結果とを比較した. その結果は、以下の表に示すとおりである。

私たちの異なるモデリング方法が作成された後、その強さによって決定されるリーグのランキングを作成するために、モデルからの強さ係数を使用することが出来ました。 2008年から2018年までの各年、および全体の戦力係数について、ナショナル・ホッケー・リーグが最強のリーグと見なされるのは、当然のことでした。 その他、常に2番目に強いとされていたリーグは世界選手権で、これは各国のベストプレーヤーが競い合うものであり、この大会はNHLでプレーする多くの選手で構成されていることから納得がいくものです。 単純にリーグを見ると、AHL、KHL、SHL、DELは一貫して45チーム以上の最強リーグの一つでした。 最終的に上位10リーグのランキングは、NHL、世界選手権、世界ジュニア選手権、KHL、SHL、AHL、USDP、世界ジュニア選手権U18、DEL、NLAとなった。 意外だったのは、ジュニアホッケーリーグ、つまりUSDPのリーグです。 これらのリーグがランキングで上位に表示されたのは、モデルで年齢を考慮したためです。 これにより、選手の年齢ではなく、選手の質で強さを判断することができるようになったのです。 私たちが作成した3つのモデルは、それぞれ、わずかな偏差があるに過ぎず、似たようなランキングになりました。

Strength Coefficients Over Time:上のグラフは、2008年~2018年の各年度の各リーグの戦力係数を示したものである。 より一般的に知られているリーグや常に強いリーグは、上にハイライトされています。

私たちの調整済み1試合あたりのポイントに基づいてリーグのランキングを生成した後、次のステップは、これらのランキングが1試合あたりのポイントだけを使用した場合と比較してどうであるかを確認することでした。 1試合あたりのポイントを使用する場合、リーグの強さ係数に3つのことが起こることに気づきました。 強さ係数が高いリーグは、調整後の1試合あたりの得点でも依然として強い傾向がある。 全リーグの中で中位に位置するリーグでは、生の1試合あたりの得点の強さ係数は、調整後の1試合あたりの得点の強さ係数と非常によく似ています。 最後に、生の1試合あたりの得点に対する強度係数が最も低いリーグは、調整後の1試合あたりの得点に対する強度係数がより悪かった。 ストレングス係数が低いリーグで、ストレングス係数が調整1試合あたりポイントで改善されたのは、若い選手がいるリーグだけでした。 この傾向は、U20とU18の両方の世界ジュニア選手権と、アメリカ合衆国高校、ミネソタ州リーグで起こります。 ミネソタ州の高校リーグについては、1試合あたりの生得点を応答変数とした場合、圧倒的に悪いリーグとされていましたが、調整済み1試合あたりの得点を用いることで、このリーグは他の10リーグ(その多くはプロリーグ)よりも良いパフォーマンスを示しています。 このことから、リーグ戦の強さの予測因子としての1試合あたりの得点の欠点をさらに確認することができ、またリーグ戦の強さを決定する際に年齢を考慮することがいかに重要であるかが浮き彫りになりました。

生P/GP対調整P/GPの各リーグの強さ係数:このグラフは、2つの異なる応答変数に対する各リーグの強さ係数を表示します。 強度係数は、同じモデリング方法を用いて計算されました。

上述のように,1試合あたりのポイントなどの既存の予測変数は,年齢,リーグの強さ,チームの強さ,年によって偏りがあるため,プレーヤーのパフォーマンスに関する新しい推定値を作成する必要がありました. 選手タイプのパーセンタイルを作成することで、プロスペクトを他の類似した選手と比較することができ、より正確な予測を可能にします。 対数P/GPのパーセンタイルと私たちが選んだ方法は、45以上のどのリーグにおいても、与えられた選手のパフォーマンスを予測することができるので、非常に有用です。 これだけ多くのリーグがあると、そのリーグからNHLにドラフトされた選手であることが保証されるわけではありませんが、モデル方式でなければ、正確な予測をするためにそのようなことは必要ないのです。

例えば、ピッツバーグ・ペンギンズの2017-2018シーズンにおけるジェイク・ゲーンツェルの1試合あたりの調整済み得点は、0.94でした。 この調整済み1試合あたりのポイントを使えば、他のどのリーグでも彼の調整済み1試合あたりのポイントを予測することができます。 以下に、より一般的なリーグをいくつか表示し、それぞれのリーグにおけるジェイク・グエンツェルの予測調整済み1試合あたり得点を示します。 比較のため、2016-2017年のジェイク・グエンツェルはAHLで2.30という調整済み1試合あたりのポイントを持っていました。 我々の予測する調整済み1試合あたりの得点は2であり、むしろ近い値である。

プレーヤーが任意のリーグでどのように機能するかを決定するためにプレーヤーの調整済み1試合あたりのポイントを予測する我々の方法は、前述のモデリングプロセスから得られた我々の強さ係数から単純に計算されます。 2つのリーグを比較するには、それぞれのリーグのストレングス係数を引き算します。 次にこの値を、そのプレーヤーがデータを記録しているリーグの調整済み1試合あたり得点またはzスコアに加えます。 zスコアとストレングス係数の差の合計が、他の任意のリーグの調整済み1試合あたりのポイントになります」

1 人のプレーヤーのパフォーマンスを予測することがスカウトの目的に役立つだけでなく、ストレングス係数がリーグの強さの情報を提供します。 この係数は年齢、シーズン、ポジション、リーグを考慮したものである。 これにより、スカウトは、影が薄いかもしれないユースリーグに、より多くのリソースを投入することができる。 というのも、年齢は1試合あたりの得点を大きく左右するが、その他の交絡変数をすべて考慮すると、全体としてプロリーグよりもはるかに優れたリーグ力を持つユースリーグがいくつか存在したからである。

これらのコンセプトは、実生活にも応用できます。 2016年のドラフトまでの数カ月間、コロンバス ブルー ジャケッツが全体3位で誰を指名するかについて議論されてきました。 ほとんどのスカウトは、フィンランド人フォワードのジェシー・プルジュヤルヴィを評価し、それが総意とされていたが、CBJが代わりにカナダ人センターマンのピエール=ルック・デュボアを指名したと聞いて、ファンはショックを受けていた。 しかし、数字を見れば、この決断が驚くべきものでないことがわかるだろう。 プロホッケーリーグ・リーガでプレーしていたプルジュヤルヴィは、レギュラーシーズン50試合で28得点という素晴らしい成績を収め、20歳以下のリーガ選手の中で5位にランクインしていた。 一方、デュボアはマイナーリーグでプレーしていたが、それでも62試合99得点でQMJHL得点ランキング3位となった。 この係数を使って、NHLでの修正P/GPを計算し、比較してみると、統計的な観点からデュボアがプルジュヤルヴィをリードしていることが分かる。 もちろん、これだけがスカウトの判断材料ではないだろう。デュボアの圧倒的なサイズと身体能力も間違いなく彼らの判断に影響を与えたが、ブルージャケッツはプルヤルヴィよりもデュボアを選んだとき、それぞれの選手がどのように他の選手に対して積み重なっているかをよりよく知っていたと考えることができるだろう。

選手間の比較以外の用途としては、リーグ間の比較が挙げられます。 ハーレー対ハイノーラの例に戻ると、それぞれのリーグを同じような地位の他のリーグで評価することができます。 コントラストが明らかなNHLとOHLを比較するのではなく、OHLと他の北米マイナーリーグを比較することで、よりニュアンスのある評価を行うことができるのです。 以下のグラフから、OHLが実はNAマイナーリーグの中で最強のリーグであるのに対し、Liigaは他のプロリーグと比較して中途半端なランクのリーグであることがわかるだろう。

OHLと他のNAジュニアリーグとの比較。 このグラフは、北米の全ジュニアリーグの戦力係数を表示し、OHLは緑色でハイライトされています。

リーガ対他のプロホッケーリーグ。 このグラフは、世界中のプロホッケーリーグの戦力係数を表示し、Liigaは水色でハイライトされています。

調整済み1試合あたりのポイント選手メトリックでは、選手の年齢、ポジション、リーグ、およびシーズンなどの交絡変数が制御されるだけでなく、任意の特定の選手の価値の見通しを変更することができます。 また、モデリング技術により、著名なメジャーリーグだけでなく、世界中のホッケーリーグの選手比較も可能です。 これにより、従来は偏った推定値を用いていた、任意の選手が自国のリーグで類似の選手と比較してどのような成績を残すかを予測する能力がチームに備わります。 また、1試合あたりのポイントを調整することで、より総合的な選手評価が可能となり、これまで見過ごされてきた選手や、端役に甘んじていた選手に道を開くことができます。 調整済み1試合あたりのポイントを使うだけで、すでに多くのアプリケーションがありますが、スカウトランキングや予想ゴールなど、他のタイプのデータも同様に使うことが可能です。 今後、全リーグでより詳細なデータが出れば、この手法もさらに改善されるでしょう。

この記事の研究は、Katerina WuによってCBJHAC20でも発表されました。 スライドはこちらでご覧いただけます。

Twitterで@kattaqueueと@madelinejgallをフォローしてください!

コメントを残す

メールアドレスが公開されることはありません。