mirror of
https://github.com/crawlab-team/crawlab.git
synced 2026-01-21 17:21:09 +01:00
10 KiB
10 KiB
0.4.4 (2020-01-17)
功能 / 优化
- 邮件通知. 允许用户发送邮件消息通知.
- 钉钉机器人通知. 允许用户发送钉钉机器人消息通知.
- 企业微信机器人通知. 允许用户发送企业微信机器人消息通知.
- API 地址优化. 在前端加入相对路径,因此用户不需要特别注明
CRAWLAB_API_ADDRESS. - SDK 兼容. 允许用户通过 Crawlab SDK 与 Scrapy 或通用爬虫集成.
- 优化文件管理. 加入树状文件侧边栏,让用户更方便的编辑文件.
- 高级定时任务 Cron. 允许用户通过 Cron 可视化编辑器编辑定时任务.
Bug 修复
nil retuened错误.- 使用 HTTPS 出现的报错.
0.4.3 (2020-01-07)
功能 / 优化
- 依赖安装. 允许用户在平台 Web 界面安装/卸载依赖以及添加编程语言(暂时只有 Node.js)。
- Docker 中预装编程语言. 允许 Docker 用户通过设置
CRAWLAB_SERVER_LANG_NODE为Y来预装Node.js环境. - 在爬虫详情页添加定时任务列表. 允许用户在爬虫详情页查看、添加、编辑定时任务. #360
- Cron 表达式与 Linux 一致. 将表达式从 6 元素改为 5 元素,与 Linux 一致.
- 启用/禁用定时任务. 允许用户启用/禁用定时任务. #297
- 优化任务管理. 允许用户批量删除任务. #341
- 优化爬虫管理. 允许用户在爬虫列表页对爬虫进行筛选和排序.
- 添加中文版
CHANGELOG. - 在顶部添加 Github 加星按钮.
Bug 修复
0.4.2 (2019-12-26)
功能 / 优化
- 免责声明. 加入免责声明.
- 通过 API 获取版本号. #371
- 通过配置来允许用户注册. #346
- 允许添加新用户.
- 更高级的文件管理. 允许用户添加、编辑、重命名、删除代码文件. #286
- 优化爬虫创建流程. 允许用户在上传 zip 文件前创建空的自定义爬虫.
- 优化任务管理. 允许用户通过选择条件过滤任务. #341
Bug 修复
0.4.1 (2019-12-13)
功能 / 优化
- Spiderfile 优化. 将阶段由数组更换为字典. #358
- 百度统计更新.
Bug 修复
0.4.0 (2019-12-06)
功能 / 优化
- 可配置爬虫. 允许用户添加
Spiderfile来配置抓取规则. - 执行模式. 允许用户选择 3 种任务执行模式: 所有节点, 指定节点 and 随机.
Bug 修复
0.3.5 (2019-10-28)
功能 / 优化
Bug 修复
0.3.1 (2019-08-25)
功能 / 优化
- Docker 镜像优化. 将 Docker 镜像进一步分割成 alpine 镜像版本的 master、worker、frontendSplit docker further into master, worker, frontend.
- 单元测试. 用单元测试覆盖部分后端代码.
- 前端优化. 登录页、按钮大小、上传 UI 提示.
- 更灵活的节点注册. 允许用户传一个变量作为注册 key,而不是默认的 MAC 地址.
Bug 修复
- 上传大爬虫文件错误. 上传大爬虫文件时的内存崩溃问题. #150
- 无法同步爬虫. 通过提高写权限等级来修复同步爬虫文件时的问题. #114
- 爬虫页问题. 通过删除
Site字段来修复. #112 - 节点展示问题. 当在多个机器上跑 Docker 容器时,节点无法正确展示. #99
0.3.0 (2019-07-31)
功能 / 优化
- Golang 后端: 将后端由 Python 重构为 Golang,很大的提高了稳定性和性能.
- 节点网络图: 节点拓扑图可视化.
- 节点系统信息: 可以查看包括操作系统、CPU数量、可执行文件在内的系统信息.
- 节点监控改进: 节点通过 Redis 来监控和注册.
- 文件管理: 可以在线编辑爬虫文件,包括代码高亮.
- 登录页/注册页/用户管理: 要求用户登录后才能使用 Crawlab, 允许用户注册和用户管理,有一些基于角色的鉴权机制.
- 自动部署爬虫: 爬虫将被自动部署或同步到所有在线节点.
- 更小的 Docker 镜像: 瘦身版 Docker 镜像,通过多阶段构建将 Docker 镜像大小从 1.3G 减小到 700M 左右.
Bug 修复
- 节点状态. 节点状态不会随着节点下线而更新. #87
- 爬虫部署错误. 通过自动爬虫部署来修复 #83
- 节点无法显示. 节点无法显示在线 #81
- 定时任务无法工作. 通过 Golang 后端修复 #64
- Flower 错误. 通过 Golang 后端修复 #57
0.2.4 (2019-07-07)
功能 / 优化
- 文档: 更优和更详细的文档.
- 更好的 Crontab: 通过 UI 界面生成 Cron 表达式.
- 更优的性能: 从原生 flask 引擎 切换到
gunicorn. #78
Bug 修复
- 删除爬虫. 删除爬虫时不止在数据库中删除,还应该删除相关的文件夹、任务和定时任务. #69
- MongoDB 授权. 允许用户注明
authenticationDatabase来连接mongodb. #68 - Windows 兼容性. 加入
eventlet到requirements.txt. #59
0.2.3 (2019-06-12)
功能 / 优化
- Docker: 用户能够运行 Docker 镜像来加快部署.
- CLI: 允许用户通过命令行来执行 Crawlab 程序.
- 上传爬虫: 允许用户上传自定义爬虫到 Crawlab.
- 预览时编辑字段: 允许用户在可配置爬虫中预览数据时编辑字段.
Bug 修复
- 爬虫分页. 爬虫列表页中修复分页问题.
0.2.2 (2019-05-30)
功能 / 优化
- 自动抓取字段: 在可配置爬虫列表页种自动抓取字段.
- 下载结果: 允许下载结果为 CSV 文件.
- 百度统计: 允许用户选择是否允许向百度统计发送统计数据.
Bug 修复
- 结果页分页. #45
- 定时任务重复触发: 将 Flask DEBUG 设置为 False 来保证定时任务无法重复触发. #32
- 前端环境: 添加
VUE_APP_BASE_URL作为生产环境模式变量,然后 API 不会永远都是localhost#30
0.2.1 (2019-05-27)
- 可配置爬虫: 允许用户创建爬虫来抓取数据,而不用编写代码.
0.2 (2019-05-10)
- 高级数据统计: 爬虫详情页的高级数据统计.
- 网站数据: 加入网站列表(中国),允许用户查看 robots.txt、首页响应时间等信息.
0.1.1 (2019-04-23)
- 基础统计: 用户可以查看基础统计数据,包括爬虫和任务页中的失败任务数、结果数.
- 近实时任务信息: 周期性(5 秒)向服务器轮训数据来实现近实时查看任务信息.
- 定时任务: 利用 apscheduler 实现定时任务,允许用户设置类似 Cron 的定时任务.
0.1 (2019-04-17)
- 首次发布