Skip to content

tanpengsccd/Movie_Data_Capture

 
 

Repository files navigation

来源

此项目fork自 https://github.com/yoshiko2/Movie_Data_Capture ,最后的开源代码大概到版本 6.6.7 . 从版本 7.0 开始 原项目已经商业化,且不在开源,并移除了历史源码. 但是由于我也对Python 比较感兴趣,想学习学习,就fork了一份,修修改改.

项目改动

部分代码参考MDC 流程做细分 改为三大流程: 索引,抓取,组织. 不含下载影片功能

暂不可用项

  1. 只能以源码方式运行.适配 Linux版本 Python3.10 ,Win 或者其它平台有问题,可以提issue,然后等待好心人贡献源码.
  2. Docker 不可用.

计划改造 img

  1. 索引: 提取文件基础信息

    1. 可索引目录 持久化在本地sqlite数据库
  2. 抓取:从信息网站读取更多影片信息

    1. 使用 scrapy 获取网页信息
  3. 组织: 根据影片信息分类移动/存储/重命名/链接 文件

日后计划

  • nfo 定义为通用数据模型, 方便生成nfo文件.
    • nfo 模型
  • 站点解析器遵循 抽象类,方便以后扩展更多站点.
  • 文件名刮削模式: 尽量去除干扰字段-》搜索文件名
  • 源刮削策略: 懒惰模式(默认):返回优选的源信息,贪婪模式: 合并所有搜索到的结果,尽量补全所信息
  • 整理模式:
    • 按系列整理文件
    • 按演员整理:
      • 大于三人=众星
      • 如果演员的片子数量少于n部,则统一移到其他演员,并且文件名必须+演员名
    • 清楚文件(清理前确认待清理的文件列表)
      • (有nfo文件/有图片) 但无同名视频文件的
      • 正则匹配到的 文件路径(含文件名)
      • 文件大小
    • 是否纠正片名(可移除文件名广告)
    • 相关元数据 移动到指定文件夹(利用SSD读取更快,优化加载速度)
    • 把系列Pack文件夹里的视频统一移到指定目录,并且当原文件夹不大于某大小时 删除,默认0时候删除.

About

Local Movies Organizer

Resources

License

MIT, Unknown licenses found

Licenses found

MIT
LICENSE
Unknown
LICENSE.chromedriver

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 94.1%
  • HTML 4.8%
  • Other 1.1%