spaCy 2.0.0 发布了,spaCy 是一个 Python 和 CPython 的 NLP 自然语言文本处理库。 通过使用最新的深度学习技术,发布了 spaCy 的最新版本,使得在可扩展的云计算工作流程中运行spaCy变得更容易。 spaCy 2.0.0 已经修复了60多个bug,包括几个长期存在的问题,为7种语言增加了13个神经网络模型,并为8种新语言添加了 alpha 标记化支持。 还重新编写了几乎所有的使用指南,API文档和代码示例。 主要特性和改进: NEW: Convolutional neural network models for English, German, Spanish, Portuguese, French, Italian, Dutch and multi-language NER. Substantial improvements in accuracy over the v1.x models. NEW: Vectors class for managing word vectors, plus trainable document vectors and contextual similarity via convolutional neural networks. bug 修复: Fix issue #125, #228, #299, #377, #460, #606, #930: Add full Pickle support. Fix issue #152, #264, #322, #343, #437, #514, #636, #785, #927, #985, #992, #1011: Fix and improve serialization and deserialization of Doc objects. 完整内容请查看发布主页。 下载地址: Source code (zip) Source code (tar.gz) spaCy 2.0.0 发布,NLP 自然语言文本处理库下载地址