Apache Nutch 1.18 发布了。Nutch是一个成熟的、可用于生产的 Web 爬虫。 Nutch 1.x 可以依靠 Apache Hadoop™ 数据结构进行细粒度配置,这对于批处理非常有用。 此版本包含 30 多个错误修复和改进,部分更新内容如下: Bug 修复 javax.ws packaging.type 的可靠解决方案 升级 lvy 以解决未设置 package.type 属性的问题... Web 爬虫 Apache Nutch 1.18 发布下载地址