同传摸鱼/DD 检测机

🤝 Contributor:

pren1, scPointer

📃 Introduction

本脚本通过对过去七个月所记录的vtuber相关bilibili直播弹幕处理，实现以下功能：

获取目标在vtuber相关直播间发送的弹幕
获取在vtuber相关直播间进行同传的名单
获取目标在vtuber相关直播间发送的同传弹幕数量变化
获取直播间同传man弹幕数变化情况

📦 Update by scPointer

version 1.1

debug :

修改有关文件路径 ''为 os.sep
原文件中用最后一个半角冒号分隔UID和弹幕，但弹幕中可能出现冒号，如 "(:зゝ∠)"，导致UID未正确划分
一些弹幕文件信息出错导致 numpy 的 asarray 函数请求过量空间。用 try-except 特判解决

功能改动 :

修改同传判定规则，并附在建库代码中。这意味着同传判定在建库时进行而不是在查询时。
原弹幕数据bilibili-vtuber-danmaku中最初记录数据没有UID或时间戳，用txt_processor.preprocess_readin_list()中一长串特判解决了这个问题。没有UID的同传部分单独划分到UID=0。
增加输出信息项：同传平均字符数，同传偏爱直播间等。所有附加信息只使用一次查询实现。

时间效率改进 :

修改数据库输入信息，现在只录入同传弹幕的用户/直播间/日期/时间/长度，且不记录弹幕内容。数据库大小3.11GB -> 38MB，所有信息都可以几秒出解。后续可以增加记录弹幕内容，改动不大。
修改数据库内记录项的格式。之前所有格式均为文本，增加了搜索数据时比较项不必要的时间。

结构改动 :

因为更新了判定规则，检测到的同传man变多了，所以顺便更新了man_id_nick_name_chart.csv
修改 Data_seatcher.py 中sqlite查询语句的结构。
使用constants统一规范一些变量：数据库名，同传man的id/昵称对应文件名，直播间的id/昵称对应文件名，输出同传man的rank的文件名

适配 :

暂时把所有形如 f'abc{d}'的改成 'abc'+str(d) (done)
调用b站api找直播间和同传man名字时可能会卡，加个delay

🌲 Request Packages

⚡️ Quick start

首先，下载本repo:

git clone https://github.com/pren1/DD_Radar-lock-on.git

然后，下载 bilibili-vtuber-danmaku 弹幕数据库到本repo文件夹下:

git clone https://github.com/dd-center/bilibili-vtuber-danmaku.git

运行:

python3 Dataset_builder.py

然后，运行:

python3 Naive_data_insight.py

🎉 Result examples

同传man名单（含排名）将会被保存到 interpretation_man_rank.csv:

Rank	昵称	同传弹幕数	平均每条同传字符数	偏爱直播间(占该同传man条数的比例)
0	殿子desu	60303	8.94	癒月巧可Official(57%)
1	夜行游鬼	40586	8.46	夏色祭Official(74%)
2	快递员小黑	31689	10.55	大神澪Official(43%)
3	精神王	21830	8.9	夜空梅露Official(62%)
4	HTdatou	20656	10.21	百鬼绫目Official(13%)
5	叫霓裳	18126	8.42	湊-阿库娅Official(52%)
6	Searrle	15506	8.46	Milky_Vtuber(100%)
7	涼風青葉頑張るぞい	13031	8.25	白上吹雪Official(85%)
8	天火official	12383	8.71	夏色祭Official(83%)
9	call_me_Gump	10277	8.05	赤井心Official(79%)
10	徽铯huise	10250	9.04	夏色祭Official(56%)
11	小V不是弱受	9648	10.25	猫又小粥Official(75%)
12	長門凖	9049	11.28	白百合リリィOfficial(98%)
13	namelostman	6094	9.73	贝尔蒙德Official(89%)
14	小天man	5572	9.45	百鬼绫目Official(78%)
15	LEDお兄ちゃん	5142	11.72	Kanna_康娜Official(90%)
16	scPointer	5043	12.55	神楽Mea_Official(99%)
17	樱晴末雨	4326	7.94	湊-阿库娅Official(43%)
18	校了个寂寞	4119	9.27	夏色祭Official(82%)
19	有只小强爬过	3978	11.14	花园Serena(68%)
20	夜语晚樱	3851	8.87	花园Serena(78%)
21	MEISSS	3422	10.61	百鬼绫目Official(51%)
22	Diana-ディアナ	3371	9.77	高槻律official(93%)

接下来是相关数据可视化:

直播间同传弹幕数量变化

同传man同传弹幕数量变化

弹幕数量变化（包含同传与非同传）

☁️ Utilization

更详细的注释在相应函数内

from Naive_data_insight import Naive_data_insight
NDI = Naive_data_insight()

# '导出同传man名单'
NDI.output_interpretation_man_rank_csv(csv_name="interpretation_man_rank.csv")

# ‘显示直播间同传弹幕数量变化’
NDI.visualize_single_room_timeline(room_id='13946381')

# ‘显示同传man同传弹幕数量变化 与 普通弹幕数量变化’
NDI.visualize_single_uid_timeline(input_UID='27212086')

from Dataset_searcher import Dataset_searcher
ds = Dataset_searcher("test.db")
ds.connect_dataset()

# '返回目标同传man发送的所有同传弹幕'
all_interpretation = ds.show_target_interpretation_from_UID(input_UID='739848')

# ‘返回目标发送的所有弹幕’
all_danmaku = ds.show_all_danmaku_from_UID(input_UID='739848')

# ‘返回目标同传弹幕信息随时间的变化’
single_uid_interpretation_timeline = ds.Single_UID_interpretation_timeline(input_UID='739848')

# ‘返回目标弹幕数量随时间的变化’
single_uid_all_danmaku_timeline = ds.Single_UID_all_danmaku_timeline(input_UID='739848')

# ‘设定最少发送的同传弹幕数，并以此筛选同传man名单’
simultaneous_interpretation_man_list = ds.select_simultaneous_interpretation_man(man_threshold=100, show_name=False)

# ‘获取某一时间段内的弹幕信息’
date_within = ds.select_date_within(start_date='2019-09-01', end_date='2019-09-30')

# ‘返回同传man的UID列表’
pure_uid_man_list = [row[0] for row in simultaneous_interpretation_man_list]

# ’返回目标直播间弹幕信息随时间的变化‘
single_live_roow_interpretation_timeline = ds.Single_live_room_interpretation_timeline(input_room_id='11588230', pure_uid_man_list=pure_uid_man_list)

# ‘生成直播间 ID与vtuber昵称的对应列表’
ds.build_fast_name_chart()

# ‘生成同传man UID与昵称的对应列表’
ds.build_simultaneous_interpretation_man_name_chart(pure_uid_man_list=pure_uid_man_list)

☀️ Special thanks

感谢所有【同传man】对bilibili vtuber直播所付出的努力
感谢simon3000在开发过程中关于id与昵称转换的帮助
感谢Curtis Xiao对开发提出的建议

Name		Name	Last commit message	Last commit date
Latest commit History 42 Commits
constants		constants
image		image
Dataset_builder.py		Dataset_builder.py
Dataset_searcher.py		Dataset_searcher.py
File_scan.py		File_scan.py
Naive_data_insight.py		Naive_data_insight.py
README.md		README.md
interpretation_man_rank.csv		interpretation_man_rank.csv
man_id_nick_name_chart.csv		man_id_nick_name_chart.csv
room_id_nick_name_chart.csv		room_id_nick_name_chart.csv
txt_processor.py		txt_processor.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

同传摸鱼/DD 检测机

🤝 Contributor:

📃 Introduction

📦 Update by scPointer

version 1.1

🌲 Request Packages

⚡️ Quick start

🎉 Result examples

直播间同传弹幕数量变化

同传man同传弹幕数量变化

弹幕数量变化（包含同传与非同传）

☁️ Utilization

☀️ Special thanks

About

Releases

Packages

Contributors 2

Languages

pren1/DD_Radar-lock-on

Folders and files

Latest commit

History

Repository files navigation

同 传 摸 鱼/DD 检 测 机

🤝 Contributor:

📃 Introduction

📦 Update by scPointer

version 1.1

🌲 Request Packages

⚡️ Quick start

🎉 Result examples

直播间同传弹幕数量变化

同传man同传弹幕数量变化

弹幕数量变化（包含同传与非同传）

☁️ Utilization

☀️ Special thanks

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

同传摸鱼/DD 检测机

Packages