这是华语乐坛数据分析的第6篇,前5篇在这里:
华语乐坛40年金曲分析(1)
40年华语音乐数据分析②:歌手大热单曲数量排名
华语乐坛分析⑤:哪位歌手的持久度高?
华语乐坛数据分析④:14-60岁最强的歌手是谁?
华语乐坛数据分析③:夺冠次数与夺冠时单曲数量排行
这些分析均涉及从1983到2021年,每年约100首热单,共3300多首热单的数据。
在第五篇中,计算了歌手的连续输出能力。这里不妨放宽条件,不要求连续性,来看综合输出能力。
既保证数量又要求质量是非常难的。我们不妨借用学术界用来衡量学者论文引用情况的H指数,来计算一下歌手的热单指数。比如一个歌手的H指数是10,就表明他在10个年头里,每年创造至少10首热单,这里就不要求是连续10年了。结果如下:
歌手按年度热单计算的H指数
计算结果显示,H=3的有19位,也就是说这19位歌手,都有3个年头里,每年都贡献至少3首热单。H=4的有2位,5和6的没有,周杰伦的H为7。由于空间有限和数量众多,H=2及以下的就不一一列出了。
H指数是个非常硬核的指标,它同时要求大数量和高质量,缺一不可。H指数差1可不是数字差1那么简单,其难度会剧烈增加。H=3的歌手基本都是一流歌手了。
不过H指数并没有考虑权重的问题,假如一个歌手的H为3,那么哪怕他有一年产生了10首热单,那和3首的效果也是一样的。为此,诞生了G指数,它比H复杂一些,就不介绍定义了,有兴趣的可以搜索百科词条。
下面是G指数的计算结果:
歌手按年度热单计算的G指数
按G指数计算,周杰伦依然独属第一类。在算之前,我就估计在考虑权重的情况下,周杰伦与其他歌手G指数的差距应该会进一步拉大,实际确实如此,周的H比第二类高了3,但G指数则高了4,达到9。
注意,我不是周杰伦粉丝,也不是任何华语歌手的粉丝,很多歌手压根不认识。我电脑中存3000余首歌,至少2500首没有人声,剩下一些是小语种。谁高谁低,谁有谁无对我来说没有心理压力。
H(左)和G(右)指数的比较
与左边的H相比,右边G的第二类变化挺大,张学友没变,陈奕迅降了一级,谭咏麟,beyond,任贤齐,许嵩则升了一级。
在G的第三级中,原来在H中的孙燕姿,张杰,五月天也降低了,新出现了陈慧娴,王杰,王菲,莫文蔚,凤凰传奇,李荣浩几个人。
你们觉得H和G哪个合理呢?无论如何,按照不同的计算方式,会呈现不同的结果,从来不会有一个结果能让所有人满意。数据所能做的,只是从不同维度来给出一个歌手的侧写。