だいたいNBA

Kだよ。だいたいNBAのことを書くのです。だいたいスパーズのことを書くのです。

B.LEAGUEのスタッツの諸問題

NBAの充実したスタッツに慣れているため余計にそう思うというところはあると思いますが、B.LEAGUEのスタッツはイマイチですね。

トータルのスタッツと1試合あたりのスタッツを混在させているのは良くなくて、トータルならトータル、1試合あたりなら1試合あたりで切り替えられるようにすべきでしょう。1試合あたりのスタッツで計算されているのが得点・総リバウンド・アシストだけでスティールその他は計算されないというもの中途半端(全部やると情報量が多すぎて表示しづらくなるから、ということでしょうが、だったらなおさらトータルと1試合あたりで分けて表示すべき)。

また、Play by Playを記録しているのだから、そこから正確なポゼッション数を計算できるはずで、ポゼッションベースのスタッツも見れるようにしたほうがいいでしょう。stats.nba.comのPace(48分あたりポゼッション数)は、ポゼッション数が推定値であって実測値ではないので、ちゃんとやればNBAの先をいけます。ちなみに、stats.nba.comのポゼッション数は「Possessions = FGA + (0.44 x FTA) + TO – OReb」で計算され、割と大雑把な値になります。BBRでは「0.5 * ((Tm FGA + 0.4 * Tm FTA - 1.07 * (Tm ORB / (Tm ORB + Opp DRB)) * (Tm FGA - Tm FG) + Tm TOV) + (Opp FGA + 0.4 * Opp FTA - 1.07 * (Opp ORB / (Opp ORB + Tm DRB)) * (Opp FGA - Opp FG) + Opp TOV))」と計算されます。複雑になりますが、より実測値に近い値が出ます。Play by Playからの実測値はPBP Statsで見ることができます。実測値<BBR<stats.nba.comという順にポゼッション数が大きくなる傾向があります。1試合あたりのスタッツはプレータイムに左右され、単位時間あたりのスタッツはPaceに左右されるので、特定の単位でのスタッツを出すのであればポゼッションベースのスタッツが最もフェアです。

また、Play by PlayからPlus/Minusも計算できるので、それも計算したほうがいいでしょう。Play by Playは基礎データの宝庫なので、ここから引き出せるスタッツはとにかく引き出すべきです。

総合指標系の発展的スタッツは、「どの基礎スタッツが、他と比べてどれぐらいの価値があるか」と重み付けしてしまう部分があります。なのでリーグがそれを採用してしまうと、「ブロックにはそんなに価値がない」とか、(ボックススコアにはディフェンス力を測る要素が少なく、発展的スタッツはオフェンス力ばかり測ることになってしまいがちなことから)「バスケで重要なのは圧倒的にオフェンス」とか「ボールを持ったら放さない選手は優れた選手」などと、リーグが公式にそういう意見表明を実質的にしてしまうことになります。そういうわけでB.LEAGUEがPER(USG%とオフェンススタッツにほぼ左右される)を代表とする総合指標系の発展的スタッツを基本的に取り扱わないのは妥当な態度と言えますが、唯一EFFというスタッツが採用されています。まず、この事の何が問題かと言うと、このEFFというスタッツの計算式が全く示されておらず、ただ「貢献度」とのみ記載されていることです。中身がわからないのに、何がどう貢献しているといえるのか。バスケのスタッツ分析の世界にはすでに2種類のEFF(Efficiency)というスタッツが存在しており、一つはNBAがかつて採用していたもの(現在NBAが採用しているPIEとは別のもの)、もう一つが現在ユーロリーグなどで採用されているものです。実際に式に当てはめたところ、かつてNBAが採用していたものと結果が一致したので、「EFF = (PTS + REB + AST + STL + BLK − Missed FG − Missed FT - TO) / GP」ということになります。単にボックススコアに記録される数値をそのまま足したり引いたりしているだけで、価値の重み付けをしていないために客観性の高い総合指標ということはできます。一方で、価値の重み付けをしない総合指標がプレーヤーの「実質的な価値」を反映することはありません。例えば、このEFFが示すのは、1回のスティールは1点分の価値しかない、ということです。通常1ポゼッションの得点期待値は1を超えます。NBAであれば、スティール(とそれに伴うTO)が存在しない世界では、1ポゼッションあたりの得点期待値は1.16点程度になります(2015-2016レギュラーシーズンのスタッツに基づく)。したがって、スティールには1.16点分の価値があります。また、スティールは速攻につながりやすく、その次のポゼッションは通常よりも得点期待値が高くなりますので、その得点期待値の上昇分の価値も上乗せされます。推測ですが、1回のスティールには1.2点分ぐらいの価値はあるはずです。また、ブロックはDREBなしにポゼッションの交代には結びつかず、スティールと同じ価値があるとは言えません。さらに、相手のシュートミスからDREBを獲得した場合、EFFはオフェンス側に-1、ディフェンス側に+1の価値を見出しますが、ブロックからDREBに繋がった場合はディフェンス側に+2の価値を見出すためこのケースのほうがディフェンス側が高く評価されることになりますが、結果は同じポゼッションの交代であって実質的には価値の違いはありません。そもそも、計算式上は明らかにビッグマンが有利になるようにできていることが問題です。REBやBLKはビッグマンが圧倒的に伸ばしやすく、リム付近でプレーするためシュートミスも少なくTOもゲームメイカーに比べれば少なくなるでしょう。昨シーズンのスタッツを観てもEFFの上位はほぼ外国人ビッグマンで占められています。単に実力的に優れているという面はあるでしょうが、そもそもビッグマンが有利になるスタッツであるからこういう結果になるわけです。シュートミスの少なさやREB%の高さが過大評価につながるのは、ボックススコアベースの他の総合指標も同様ですが、重み付けを放棄するEFFはそういった面が過大に出ます。かといって公式のスタッツが重み付けをするのは良くないでしょう。そもそもの話をすると、ボックススコア自体がディフェンスの価値をほとんど反映しません。厳しいマークで相手選手にタフショットを打たせてDREBにつなげたとして、「相手にタフショットを打たせた」ことを記録する項目がボックススコアにはないので、どうしても、そのディフェンスポゼッションを無失点で終えたことの価値をDREBを獲得した選手が総取りするような計算式しか作れません。このケースでは、タフショットを打たせたマークマンとリバウンダーとで、果たしてどちらの「貢献度」が高かったのか、合わせて1点分の価値があったとして、どのような比率で配分すべきか、その前に他の3選手は「貢献」していなかったと言えるのか、こうした問題点にEFFが、その他のボックススコアベースの総合指標が答えられることはありません。こうしたスタッツで、リーグが公式にプレーヤーの「貢献度」を評価していいのか、個人的にはすべきではないと考えます。

市井のサイトでは、Basketballnavi.DBというサイトが非常に良くできています。「ペイント内での得点」などの項目があることからPlay by Playデータを収集しているのでしょう。nba_pyという、NBA.comのAPIを解析してデータを収集するプログラムがあって、Play by Playデータを扱っているような独立系のスタッツサイトは多分みんなこれを使っていると思うんですが、Basketballnavi.DBも同じような方法でやってるんではないかと思います。立派です。Plus/Minusがあるのも良いです。

しかしながら、このサイトも簡単なものしか計算式を示していないのは問題で、計算式を示す必要がないもの以外はすべて示すべきです。検証不能な数字は全面的には信用できません。例えば、発展的スタッツの中では重要度の高いUSG%というスタッツがありますが、これはBBRstats.nba.comでは計算式が異なり差異が出るのですが、どちらも意味は「あるプレーヤーがフロア上にいるときに、そのプレーヤーがチームのプレーを消費する割合(The percentage of team plays used by a player when he is on the floor)」を指します。簡易なstats.nba.comの計算式を示すと、「(FGA + (0.44 * FTA) + TO) / POSS」であり、これが「そのプレーヤーがチームのプレーを消費する割合=そのプレーヤーがオフェンスポゼッションを終わらせる可能性のあるプレーをする割合」であることがわかるかと思います(シュートが外れてもOREBなどでポゼッションが終了しないこともあるので、ポゼッションを終わらせる「可能性のある」プレー、と表現するのが適切でしょう。ポゼッションを終わらせるFTの数は0.44 * FTAで概算するのが一般的です)。しかし、Basketballnavi.DBではUSG%を「「対象選手がフロアに出ている際」の、チーム攻撃時にシュートを試投する割合」と説明しており、NBAなどで一般的に通用しているUSG%の説明とは異なります。FTAやTOは計算に入れていないのでしょうか。具体的に2017-2018シーズンの北海道のマーク・トラソリーニのUSG%をstats.nba.comの式で計算してみたところ約34%となり、サイトの計算値である29.3%とはかけ離れたものになりました。また、そもそもポゼッションがPlay by Playからの実測値なのか推定値なのかもわからないので、ポゼッションが絡むスタッツはすべてが不明瞭です。これも同じく2017-2018シーズンの北海道のスタッツでポゼッションをstats.nba.comの式で計算してみると4501.72となり、Pace=40分あたりポゼッション数は74.6となります。このサイトの測定値は78.4なのでかなり乖離がありますし、普通は実測値よりも推定値(特にstats.nba.comの式)のほうがポゼッション数が多くなるので、こういう乖離の仕方は不思議です。やはりきちんと検証できないものは信用できないので、計算手法はオープンにすべきでしょう。