YONのドバトブログ

YONの土鳩ブログ

ゲーム好きの鳩"YON"がツイッターでは言い切れないことについて書き連ねるブログ

スマブラ使用キャラの多様性を定量的に評価する

この記事では、スマブラ使用キャラの「多様性」を定量的に評価する手法を検討し、スマメイトのキャラ分布データに適用して考察を行う。

 

なお、この記事は寝椅子氏の企画であるスマブラAdventCalendar2023に参加している。この記事の1つ手前の記事はクロマキバレット氏の以下の記事であり、スマブラオフ大会のクロブラの8年の歴史を振り返っている。自分自身クロブラに何度か参加したことがあり、感慨深いものだった。企画に参加している他の記事も是非読んでみてほしい。

 

 

多様性の定量的評価

キャラバランスが取れていて、使用されるキャラが「多様」である状況は、一般的に対戦ゲームにとって望ましい。プレイヤーが取れる選択肢が増えるだけでなく、競技シーンや観戦シーンに様々なキャラの試合が提供されるメリットもある。

では、キャラの多様性はどう評価すればいいだろうか?各キャラの使用率を観察するのもよいが、キャラ数が増えるほど個々のキャラの使用率は小さくなる傾向があるため、汎用性の高い指数とは言い難い。そこで、統計学生態学で使われる3つの指数を検討してみよう。

 

変動係数

変動係数とは、標準偏差を平均値で割った値のことである。標準偏差はデータのバラつきを表す有名な指数であるが、平均値が大きい集団の方が大きくなる傾向がある。そこで、標準偏差を平均値で割ることで、平均値が異なる集団間での比較を可能にしている。キャラ多様性の評価に用いるなら、各キャラの使用数の変動係数が小さいほど多様性が大きいと言える。 \sigma標準偏差 \bar{x}を平均値とするとき、変動係数 CVは次の式で表される。

 \displaystyle CV = \frac{\sigma}{\bar{x}}

変動係数の長所は使用率0%のキャラの存在を考慮できる点である。後述する2つの指数は生態学の指数であるため、環境に居ないキャラは考慮できず、存在してもしなくとも同じ結果になる。しかし、使用率0%のキャラがいるということは、その分だけ他のキャラに分布が偏っているため、多様性を減じなければならない。変動係数は平均値から外れたデータであれば考慮でき、使用率0%のキャラの存在に応じて多様性を減じた評価を与える。

変動係数の短所は、キャラ数を考慮できない点である。たとえば「キャラ数10でどのキャラの使用率も10%」の変動係数と、「キャラ数100でどのキャラの使用率も1%」の変動係数は、どちらも0になってしまう。両者とも使用率は均等であるが、後者はキャラ数が前者の10倍であるため、その分多様性を高く評価しなければならないだろう。なお、後述する2つの指数ではキャラ数の考慮が可能であり、後者の多様性を前者より高く評価する。

変動係数により多様性を評価した事例として、うじこ氏によるスマブラSPのキャラバランス評価が挙げられる。オフ大会のキャラ使用回数を用いて変動係数を計算し、キャラバランス(多様性)を評価している。使用回数0のキャラが大量にいるため、変動係数を適切に用いた事例と言えるだろう。

 

シャノンの多様度指数

シャノンの多様度指数とは、種の各割合から算出した平均情報量により多様性を評価する数値のことである。大きい値ほど多様性を高く評価することを意味する。キャラ多様性の評価に用いるなら、種の割合をキャラ使用率とすればよい。種 iの個体数が全個体数に占める割合を p_iとすると、シャノンの多様度指数 H'は次の式で表される。*1 *2 *3

 \displaystyle H' = -\sum_{i}{p_i}{\ln p_i}

シャノンの多様度指数の長所は、キャラ分布の均等度だけでなくキャラ数も評価できる点である。前述の例で言えば、多様度指数は「キャラ数10でどのキャラの使用率も10%」のとき約2.30、「キャラ数100でどのキャラの使用率も1%」のとき約4.61となる。後者の方が大きい値を取っており、多様性を高く評価している。

シャノンの多様度指数の短所は、使用率0%のキャラの存在を考慮できない点と、低使用率キャラの影響を強く受ける点である。前述の式において、 \ln p_iは使用率0%のキャラに対しては評価できず、さらに低使用率キャラに対し大きな値を取ってしまう。どのキャラも最低限の人口は見込めるときに使うのが良いだろう。

シャノンの多様度指数により多様性を評価した事例として、Splatoon 統計課氏によるスプラ3のブキ多様性評価が挙げられる。stat.inkのビッグデータを用いていることからどのブキも最低限の人口は見込めると思われ、シャノンの多様度指数を適切に用いた事例と言えるだろう。

 

シンプソンの多様度指数

シンプソンの多様度指数とは、「個体のランダム選択を2回行ったとき、異なる種の個体が選択される」確率により多様性を評価する数値のことである。大きい値ほど多様性を高く評価することを意味する。キャラ多様性の評価に用いるなら、各種の個体数を各キャラの使用回数とすればよい。種 iの個体数が全個体数に占める割合を p_iとすると、シンプソンの多様度指数 Dは次の式で表される。

 \displaystyle D = 1 - \sum_{i}{p_i^2}

シンプソンの多様度指数の長所は、シャノンの多様度指数と同じく、キャラ分布の均等度だけでなくキャラ数も評価できる点である。前述の例で言えば、多様度指数は「キャラ数10でどのキャラの使用率も10%」のとき約0.9、「キャラ数100でどのキャラの使用率も1%」のとき約0.99となる。後者の方が大きい値を取っており、多様性を高く評価している。

シンプソンの多様度指数の欠点は、使用率0%のキャラの存在を考慮できない点と、高使用率キャラの影響を強く受ける点である。前述の式において、 p_i^2は使用率0%のキャラに対して0になってしまい、さらに高使用率キャラに対し大きな値を取ってしまう。使用率0%のキャラも、極端に大きい使用率のキャラも居ないときに使うのが良いだろう。

 

以上をまとめる。

 

スマメイトのキャラ多様性評価

では早速、スマメイトのキャラ多様性の変遷を見てみよう。今回使用するデータはスマアナ運営者であるフェザント氏からご提供頂いた、スマメイト15.5期から25期まで(2021/9/5~2023/10/2)のキャラ使用率データである。ピーチデイジーとシモンリヒターは合算している。なお、データ取得期間中にはVer.13.0.0(2021/10/19配信、ソラ参戦)とVer.13.0.1(2021/12/2配信)の2回のアップデートが行われている。

多様性の評価指数には何を使うのが良いだろうか?スマメイトのデータは大きく、startggの報告キャラと異なり使用率0%のキャラは存在しない。また、取得期間の中で最も使用率が大きかった15.5期のホムラヒカリでさえ使用率は4.99%に留まるため、シンプソンの多様度指数を使うのが適当だろう。

上記は、スマメイト各期のキャラ使用率に対しシンプソンの多様度指数を計算し、その変遷を示したグラフである。アップデートによる多様性向上の影響は僅かに見られるものの限定的であり、最後のアップデート(Ver.13.0.1)から1年半以上経った25期においても、多様性は減少していないと言える。

 

 

 

*1: p_i のことを相対優占度という

*2:対数の底に2や10を用いることもある

*3:情報科学における平均情報量=シャノン・エントロピーとほぼ同じ式だが、実際それが由来になっている。平均情報量は全事象の発生確率が等しいとき最大となり、シャノンの多様度指数は全種の個体数割合が等しいとき最大になる