1. XenForo 1.5.14 中文版——支持中文搜索!现已发布!查看详情
  2. Xenforo 爱好者讨论群:215909318 XenForo专区

新闻 Apache Tika 1.16 发布 ,内容抽取工具集合 下载

本帖由 漂亮的石头2017-07-13 发布。版面名称:软件资讯

  1. 漂亮的石头

    漂亮的石头 版主 管理成员

    注册:
    2012-02-10
    帖子:
    487,994
    赞:
    47
    Apache Tika 1.16 发布了,Tika 是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了 POI 和 Pdfbox,并且为文本抽取工作提供了一个统一的界面。其次,Tika 也提供了便利的扩展 API,用来丰富其对第三方文件格式的支持。

    部分更新内容如下:


    • Exclude jj2000 from edu.ucar grip to avoid potential

      license conflicts with ASL 2.0




    • Add Age recognition using Ensemble model for Linear regression

      and Apache OpenNLP Maximum Entropy. Tika can now detect age from

      text (TIKA-1988).




    • Add Tika Deep Learning support for the VGG16 model for

      Very Deep Convolutional Networks for Large-Scale Image Recognition.


    • Now Tika supports both Inception v3/v4 and VGG16 based image

      recognition (TIKA-2298).


    • Extract macros from PPT (TIKA-2089).

    完整内容

    下载地址:


    >>>【评论有礼】7月10日-31日在下方评论资讯,即有机会获得 9 活跃积分和开源中国实物周边。活动详情
    Apache Tika 1.16 发布 ,内容抽取工具集合下载地址
     
正在加载...