Files
crawlab/CHANGELOG-zh.md
2020-01-16 17:15:06 +08:00

10 KiB
Raw Blame History

0.4.4 (2020-01-17)

功能 / 优化

  • 邮件通知. 允许用户发送邮件消息通知.
  • 钉钉机器人通知. 允许用户发送钉钉机器人消息通知.
  • 企业微信机器人通知. 允许用户发送企业微信机器人消息通知.
  • API 地址优化. 在前端加入相对路径,因此用户不需要特别注明 CRAWLAB_API_ADDRESS.
  • SDK 兼容. 允许用户通过 Crawlab SDK 与 Scrapy 或通用爬虫集成.
  • 优化文件管理. 加入树状文件侧边栏,让用户更方便的编辑文件.
  • 高级定时任务 Cron. 允许用户通过 Cron 可视化编辑器编辑定时任务.

Bug 修复

  • nil retuened 错误.
  • 使用 HTTPS 出现的报错.

0.4.3 (2020-01-07)

功能 / 优化

  • 依赖安装. 允许用户在平台 Web 界面安装/卸载依赖以及添加编程语言(暂时只有 Node.js
  • Docker 中预装编程语言. 允许 Docker 用户通过设置 CRAWLAB_SERVER_LANG_NODEY 来预装 Node.js 环境.
  • 在爬虫详情页添加定时任务列表. 允许用户在爬虫详情页查看、添加、编辑定时任务. #360
  • Cron 表达式与 Linux 一致. 将表达式从 6 元素改为 5 元素,与 Linux 一致.
  • 启用/禁用定时任务. 允许用户启用/禁用定时任务. #297
  • 优化任务管理. 允许用户批量删除任务. #341
  • 优化爬虫管理. 允许用户在爬虫列表页对爬虫进行筛选和排序.
  • 添加中文版 CHANGELOG.
  • 在顶部添加 Github 加星按钮.

Bug 修复

  • 定时任务问题. #423
  • 上传爬虫zip文件问题. #403 #407
  • 因为网络原因导致崩溃. #340
  • 定时任务无法正常运行
  • 定时任务列表列表错位问题
  • 刷新按钮跳转错误问题

0.4.2 (2019-12-26)

功能 / 优化

  • 免责声明. 加入免责声明.
  • 通过 API 获取版本号. #371
  • 通过配置来允许用户注册. #346
  • 允许添加新用户.
  • 更高级的文件管理. 允许用户添加、编辑、重命名、删除代码文件. #286
  • 优化爬虫创建流程. 允许用户在上传 zip 文件前创建空的自定义爬虫.
  • 优化任务管理. 允许用户通过选择条件过滤任务. #341

Bug 修复

  • 重复节点. #391
  • "mongodb no reachable" 错误. #373

0.4.1 (2019-12-13)

功能 / 优化

  • Spiderfile 优化. 将阶段由数组更换为字典. #358
  • 百度统计更新.

Bug 修复

  • 无法展示定时任务. #353
  • 重复节点注册. #334

0.4.0 (2019-12-06)

功能 / 优化

  • 可配置爬虫. 允许用户添加 Spiderfile 来配置抓取规则.
  • 执行模式. 允许用户选择 3 种任务执行模式: 所有节点, 指定节点 and 随机.

Bug 修复

  • 任务意外被杀死. #306
  • 文档更正. #301 #301
  • 直接部署与 Windows 不兼容. #288
  • 日志文件丢失. #269

0.3.5 (2019-10-28)

功能 / 优化

  • 优雅关闭. 详情
  • 节点信息优化. 详情
  • 将系统环境变量添加到任务. 详情
  • 自动刷新任务日志. 详情
  • 允许 HTTPS 部署. 详情

Bug 修复

  • 定时任务中无法获取爬虫列表. 详情
  • 无法获取工作节点信息. 详情
  • 运行爬虫任务时无法选择节点. 详情
  • 结果量很大时无法获取结果数量. #260
  • 定时任务中的节点问题. #244

0.3.1 (2019-08-25)

功能 / 优化

  • Docker 镜像优化. 将 Docker 镜像进一步分割成 alpine 镜像版本的 master、worker、frontendSplit docker further into master, worker, frontend.
  • 单元测试. 用单元测试覆盖部分后端代码.
  • 前端优化. 登录页、按钮大小、上传 UI 提示.
  • 更灵活的节点注册. 允许用户传一个变量作为注册 key而不是默认的 MAC 地址.

Bug 修复

  • 上传大爬虫文件错误. 上传大爬虫文件时的内存崩溃问题. #150
  • 无法同步爬虫. 通过提高写权限等级来修复同步爬虫文件时的问题. #114
  • 爬虫页问题. 通过删除 Site 字段来修复. #112
  • 节点展示问题. 当在多个机器上跑 Docker 容器时,节点无法正确展示. #99

0.3.0 (2019-07-31)

功能 / 优化

  • Golang 后端: 将后端由 Python 重构为 Golang很大的提高了稳定性和性能.
  • 节点网络图: 节点拓扑图可视化.
  • 节点系统信息: 可以查看包括操作系统、CPU数量、可执行文件在内的系统信息.
  • 节点监控改进: 节点通过 Redis 来监控和注册.
  • 文件管理: 可以在线编辑爬虫文件,包括代码高亮.
  • 登录页/注册页/用户管理: 要求用户登录后才能使用 Crawlab, 允许用户注册和用户管理,有一些基于角色的鉴权机制.
  • 自动部署爬虫: 爬虫将被自动部署或同步到所有在线节点.
  • 更小的 Docker 镜像: 瘦身版 Docker 镜像,通过多阶段构建将 Docker 镜像大小从 1.3G 减小到 700M 左右.

Bug 修复

  • 节点状态. 节点状态不会随着节点下线而更新. #87
  • 爬虫部署错误. 通过自动爬虫部署来修复 #83
  • 节点无法显示. 节点无法显示在线 #81
  • 定时任务无法工作. 通过 Golang 后端修复 #64
  • Flower 错误. 通过 Golang 后端修复 #57

0.2.4 (2019-07-07)

功能 / 优化

  • 文档: 更优和更详细的文档.
  • 更好的 Crontab: 通过 UI 界面生成 Cron 表达式.
  • 更优的性能: 从原生 flask 引擎 切换到 gunicorn. #78

Bug 修复

  • 删除爬虫. 删除爬虫时不止在数据库中删除,还应该删除相关的文件夹、任务和定时任务. #69
  • MongoDB 授权. 允许用户注明 authenticationDatabase 来连接 mongodb. #68
  • Windows 兼容性. 加入 eventletrequirements.txt. #59

0.2.3 (2019-06-12)

功能 / 优化

  • Docker: 用户能够运行 Docker 镜像来加快部署.
  • CLI: 允许用户通过命令行来执行 Crawlab 程序.
  • 上传爬虫: 允许用户上传自定义爬虫到 Crawlab.
  • 预览时编辑字段: 允许用户在可配置爬虫中预览数据时编辑字段.

Bug 修复

  • 爬虫分页. 爬虫列表页中修复分页问题.

0.2.2 (2019-05-30)

功能 / 优化

  • 自动抓取字段: 在可配置爬虫列表页种自动抓取字段.
  • 下载结果: 允许下载结果为 CSV 文件.
  • 百度统计: 允许用户选择是否允许向百度统计发送统计数据.

Bug 修复

  • 结果页分页. #45
  • 定时任务重复触发: 将 Flask DEBUG 设置为 False 来保证定时任务无法重复触发. #32
  • 前端环境: 添加 VUE_APP_BASE_URL 作为生产环境模式变量,然后 API 不会永远都是 localhost #30

0.2.1 (2019-05-27)

  • 可配置爬虫: 允许用户创建爬虫来抓取数据,而不用编写代码.

0.2 (2019-05-10)

  • 高级数据统计: 爬虫详情页的高级数据统计.
  • 网站数据: 加入网站列表(中国),允许用户查看 robots.txt、首页响应时间等信息.

0.1.1 (2019-04-23)

  • 基础统计: 用户可以查看基础统计数据,包括爬虫和任务页中的失败任务数、结果数.
  • 近实时任务信息: 周期性5 秒)向服务器轮训数据来实现近实时查看任务信息.
  • 定时任务: 利用 apscheduler 实现定时任务,允许用户设置类似 Cron 的定时任务.

0.1 (2019-04-17)

  • 首次发布