Gensim 是用于主题模型、文档索引和海量文本的相似检索的 Python 库,目标受众是自然语言处理(NLP)和信息检索(IR)社区。 Gensim 3.1.0 已发布,主要更新如下: 大幅度优化 LSI 模型训练 将常用术语添加至 Phrases 新增 segment_wiki.py 脚本 FastText 测试提速 优化 SlicedCorpus.__len__ word_vec 将返回不可变量 不再支持 win x32,新增滚动构建 点此可查阅完整更新内容 下载地址: Source code (zip) Source code (tar.gz) Gensim 3.1.0 发布,主题模型 Python 工具包下载地址