此项目fork自 https://github.com/yoshiko2/Movie_Data_Capture ,最后的开源代码大概到版本 6.6.7 . 从版本 7.0 开始 原项目已经商业化,且不在开源,并移除了历史源码. 但是由于我也对Python 比较感兴趣,想学习学习,就fork了一份,修修改改.
部分代码参考MDC 流程做细分 改为三大流程: 索引,抓取,组织. 不含下载影片功能
- 只能以源码方式运行.适配 Linux版本 Python3.10 ,Win 或者其它平台有问题,可以提issue,然后等待好心人贡献源码.
- Docker 不可用.
-
索引: 提取文件基础信息
- 可索引目录 持久化在本地sqlite数据库
-
抓取:从信息网站读取更多影片信息
- 使用 scrapy 获取网页信息
-
组织: 根据影片信息分类移动/存储/重命名/链接 文件
- nfo 定义为通用数据模型, 方便生成nfo文件.
- nfo 模型
- 站点解析器遵循 抽象类,方便以后扩展更多站点.
- 文件名刮削模式: 尽量去除干扰字段-》搜索文件名
- 源刮削策略: 懒惰模式(默认):返回优选的源信息,贪婪模式: 合并所有搜索到的结果,尽量补全所信息
- 整理模式:
- 按系列整理文件
- 按演员整理:
- 大于三人=众星
- 如果演员的片子数量少于n部,则统一移到其他演员,并且文件名必须+演员名
- 清楚文件(清理前确认待清理的文件列表)
- (有nfo文件/有图片) 但无同名视频文件的
- 正则匹配到的 文件路径(含文件名)
- 文件大小
- 是否纠正片名(可移除文件名广告)
- 相关元数据 移动到指定文件夹(利用SSD读取更快,优化加载速度)
- 把系列Pack文件夹里的视频统一移到指定目录,并且当原文件夹不大于某大小时 删除,默认0时候删除.