个性化阅读
专注于IT技术分析

标签:Tika文档

Tika

Tika将文档解析为纯文本示例

半瓶木阅读(1014)评论(0)赞(0)

Tika允许我们获取各种格式的提取内容, 例如文本, html或xhtml等。ContentHandler类负责返回内容。如果要以纯文本形式获取文档正文的内容, 也可以使用BodyContentHandler。 让我们看一个示例, 其中我们...