目前 Zotero 中有许多抓取中文学术网站的插件,这些插件有些已经非常老旧,缺少及时的维护。希望能在这里召集一些志同道合的朋友,共同维护中文学术或其他类型网站的抓取插件。
- 知网或知网海外 -> CNKI.js
- 搜索页面PDF附件下载
- 期刊详细页面的信息收集
- 文章格式都为PDF,学位论文的CAJ链接已经替换为PDF,注意学位论文的PDF应该是没有目录信息的。如果想要下载CAJ格式的学位论文,将
CNKI.js
中两处keepPDF
改为false
- 修改旧版本将知网导出
refworks
中CN
字段保存为期刊条目中的call number
,修改后CN
字段不保留 - 修改了拉取知网
refworks
格式引文的网址,新网址提供的摘要字数最多为500字 - 知网海外版PDF和CAJ附件下载支持
- 支持文献类型:期刊,学位论文,会议论文,报纸,修改知网refworks会议论文类型错误的问题
- 已同步到官方版本库中
- 万方数据 -> WanFang.js ❗
- 抓取引文信息
- 支持文献类型:期刊,学位论文,专利,会议论文
- PDF附件下载
- 维普 -> WeiPu.js ❗
- 抓取引文信息
- 支持文献类型:期刊
- PDF附件下载
- 百度学术 -> Baidu Scholar.js
- 修复抓取图书时错误
- 修复中文作者姓,名问题
- Bilibili 视频网站 -> BiliBili.js
- 视频页抓取信息,包括Up主,标签,上传日期,视频选集
- 搜索页面信息抓取,包括Up主,上传日期,标题,抓取信息比较少
- 谷粉学术-谷歌学术 -> GFSOSO.js
- 修改了网页匹配,识别抓取代码抄自Google Scholar。从搜索结果页识别搜索结果,引文信息正常
- 部分文献的PDF下载可能会有问题,谷粉搜搜上可能没有相应的下载链接
- 安装Adblock插件的朋友请注意下将谷粉学术
*.glgoo.top
添加到白名单,不然可能会出现问题
- 专利搜索网站Soopat -> Snnopat.js
- 搜索页面和单个专利页面信息抓取
- PDF附件下载(需要登录,网站验证码可能会导致PDF下载失败)
在开始创建前,浏览下面这些材料可以帮你了解一些创建 translator 的基本知识和开发的工具。
- Zotero 文档教你写 translator
- Zotero JavaScript API
- Translator 中可能用到的函数
- Wiki-Create translator,了解基本HTML结构,CSS选择器,javascript基本语法等
- refworks 引文格式,有些学术网站可以将引文导出为 refworks 格式
- Scaffold 使用说明,官方出品,便于创建 translator 的工具
- MDN Javascript 中文教程
- Zotero 条目类型说明
- How to write a Zotero translator
如果有问题的,可以加群 913637964,一起交流。