先にご承知おきください。今回の検証は厳密さ少々欠けます。
なぜかというと、今回はこちらのデータセット Meta kaggleの中のUsers.csvという、kaggleのユーザデータを元に分析を始めるのですが、このデータセットの説明が公式に明記されていないのです。
私と同じ疑問を持った人が質問をしていたのですが、こちらもいまだに返事がなく、データが少々曖昧です。
今回はこのUsers.csvというデータのPerformanceTierという列が、kaggleの階級を表している様子です。私が一人一人ぽちぽちとプロフィールを50人ほど見たところ
- 0: Novices
- 1: Contributors
- 2: Experts
- 3: Masters
- 4: Grandmasters
- 5: Kaggle Staff
で間違いなさそうなので、この50サンプルを信じて結論を出します。
kaggle grand masterの人数は?
243人(/6,125,690人中)です!!わずか0.003%です!
kaggle master の人数は?
1643人(/6,125,690人中)です!!こちらもわずか0.026%です!
kaggle expertの人数は?
7797人(/6,125,690人中)です!!こちらもわずか0.127%です!
kaggle contributorの人数は?
96441人(/6,125,690人中)です!!こちらもわずか1.574%です!
・・・・・・・(アクティブユーザーで見ないと意味ない気がしてきましたが、、そのデータはないのでこのまま行きます)
kaggle noviceの人数は?
6019501人(/6,125,690人中)です!!こちらもわずか98.26%です!
ほとんどの人が登録だけして終わっていますね。。。
という訳で、少し頑張るだけでもとても偉いということがわかりました!!
kagglerは増えているのか?
今回こちらのUser.csvのデータの中にはユーザがいつ登録したのかというデータも存在します。
これをプロットしてみるとこのようになりました。

注意していただきたいのですが、いつexpert, masterに成ったかではありません。今のexpertやmasterがいつ始めたかです。
やっぱり増え続けていますね。2019年後半から減っているように見えますが、これは減っているのではなくまだexpert以上に成っていないだけなのでそう見えてしまうだけです。
novice や contributorもプロットすると以下のようになります。

kaggle人口はしばらくは増加していきそうですね。
まさかexpertがこんなにも少ないなんて。。頑張っているだけでも偉いことがわかってよかったです。
みなさん、良いkaggleライフを!

