从萌娘百科整理得到的 周刊 VOCALOID 中文排行榜 数据。
数据格式为 json,每一期周刊单独存为一个文件。目前统计了 ♪118–♪522 的全部数据。
用于数据爬取和整理的 Python 脚本在 这里 。
- 现已加入 GitHub Pages 豪华午餐:通过 GET 方法访问 URL 可以获取 json 格式的数据文件:
https://cpk.moe/vocaloid-china-biliran-data/vc-weekly/{期号}.json
- 也可以直接 Download ZIP 下载当前已更新的所有文件到本地
每一期的数据为一个文件名为期号的 json 文件。
根对象为一个数组。数组中的对象为按照当期排名依次排列的 Super Hit 曲目(位于最前)、主榜曲目和 Pick Up 曲目。
曲目对象:
键 | 类型 | 说明 |
---|---|---|
id |
num |
视频 av 号。所有的 BV 号均转换成了 av 号以保证前后数据统一 |
title |
str |
曲名 |
isCover |
bool |
是否为翻唱曲。true 为翻唱,false 为原创曲 |
date |
str |
视频发布时间。格式为yyyy-MM-dd HH:mm |
rank |
num |
排名。Super Hit 使用0 表示 |
point |
num |
最终得点 |
view |
num |
播放数 |
reply |
num |
评论数 |
danmaku |
num |
弹幕数 |
favorite |
num |
收藏数 |
corrA |
num |
修正 A |
corrB |
num |
修正 B |
参见萌娘百科模板页面 Template:VOCALOID_Chinese_Ranking 。
注:
- 注意:Super Hit 曲目没有记录修正 A 和 修正 B 的数据。
- “评论权重” 在数值上等于 修正 A × 25 (
corrA * 25
) - “弹幕权重” 在数值上等于 修正 A (
corrA
) - “收藏权重” 在数值上等于 修正 B (
corrB
) - “播放权重” 可根据周刊规则中 “播放得点” 部分直接计算,但只有当修正 B < 10 时会在视频中显示出来。
周刊 VOCALOID 中文排行榜 ♪118–♪306 采用 CC BY-NC-ND 3.0 中国大陆 许可协议; ♪307–♪324 没有声明许可协议;♪325 以后采用 CC BY-NC-ND 4.0 国际 许可协议。
萌娘百科采用 CC BY-NC-SA 3.0 中国大陆 许可协议。
♪118–♪450 数据于 2021-5-5 收集自萌娘百科。♪451–♪483 数据于 2021-11-19 收集自萌娘百科。♪484 数据于 2021-11-21 收集自萌娘百科。- ♪118–♪497 数据于 2022-2-22 重新收集自萌娘百科,并且对数据格式做了调整。
- ♪498-♪499 数据于 2022-3-8 收集自萌娘百科。
- ♪500-♪522 数据于 2022-8-16 收集自萌娘百科。
按照萌娘百科上的记录对部分数据进行了手动修正:
- ♪129 7 位《神经病之歌》收藏数 43 → 247;
- ♪255 SH 《达拉崩吧》播放数 160758 → 112141;
- ♪371 SH 《达拉崩吧·史诗版》发布日期 2019-08-17 09:47 → 2019-08-17 17:47;播放数 115844 → 97333。
- 洛天依新曲排行榜、中文VOCALOID新曲排行榜及周刊VOCALOID中文排行榜 制作组
- 萌娘百科 及 萌百VC编辑团队 、周刊VOCALOID中文排行榜页面贡献者
- 如你所见,周刊的每个视频简介里都会留下 http://vc.biliran.moe/ 这个神秘的周刊官网地址。你说它停更了,但是它确实在定期更新内容(虽然常常比 B 站视频晚一两期);你说它更新及时,但是网站页面布局全是旧的,刊娘画风和 B 站 logo 全是 2015 年以前的样子,甚至还挂着一个早就用不了的 “B 站视频专题” 链接……
- 顺带一提,这一域名的主站 www.biliran.moe 在几年以前也确实是周刊哔哩哔哩排行榜的官网,但是不知道什么时候挂了( 网页时光机 ),倒是 VC 子站点还活到了现在……
- 这些数据能不能做成 API?
在学了在学了,下次一定做好虽然没学,但是好像能用了 - 2021 年 5 月刚开始收集数据时适逢萌百大规模 WAF ,一度以为自己把萌百爬坏了
- 2022 年 2 月对数据格式进行了一些修改,这时候萌百又在 WAF 了
刊娘真可爱