编辑部选型讨论:有人要可视化采集,有人要批量任务调度,也有人要把网页转成适合 AI 使用的内容。 建议大家回复时尽量补充自己的真实约束: 1. 团队规模和技术栈 2. 是否要求私有化部署 3. 当前已经试过哪些项目 4. 最担心的是上手成本、二开成本、License 还是运维成本 本帖重点:建议讨论采集规模、反爬、任务调度、登录态、数据清洗和合规边界。