Confluence 6 附件是如何被索引的

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Confluence 6 附件是如何被索引的相关的知识,希望对你有一定的参考价值。

当一个文件被上传到 Confluence 后,Confluence 将会尝试对文件进行解压,然后对文件中的内容进行索引。这样系统就能够允许用户对文件中的内容进行搜索,而不仅仅是搜索文件名。这个过程对系统的内存要求比较高,如果你上传的附件比较大的时候还会导致内存溢出。Confluence 有下面的一些配置被用来避免出现内存溢出的错误:

  • 如果你上传的文件大小大于 100 MB,Confluence 将不会尝试对文件进行解压和内容进行索引。你只能在 Confluence 中对文件名进行查找。

  • 如果你上传的文件为下面的一些文件类型,Confluence 仅仅对不超过大小的文件类型进行解压:

    • 1 MB Excel 的文本(.xlsx)

    • 8 MB PDF 的文本(.pdf)

    • 10 MB Text 文件的文本(包括 .txt, .xml, .html, .rtf 等)

    • 16 MB Word  的文本(.docx)

  • 当从上面的文件类型中解压出来的文件超过 1MB,那这个内容就是可以在系统中进行查找,但是 Confluence 将不会在快速查找中显示结果。

如果 Confluence 停止解压文本,那么这个文本文件中只有部分内容可以进行查找。

Confluence 只会对文件进行解压和索引一次,如果在这个过程中失败了,Confluence 不会再出尝试进行解压和索引。

一些变量是可以通过 system properties 的参数进行配置的。如果你在附近进行索引的过程中遇到内存错误,你可能希望对系统进行调整,调整可以使用的参数如下:

  • atlassian.indexing.attachment.maxsize

  • officeconnector.excel.extractor.maxlength

  • officeconnector.textextract.word.docxmaxsize

  • atlassian.indexing.contentbody.maxsize

 

https://www.cwiki.us/display/CONF6ZH/Configuring+Attachment+Size


以上是关于Confluence 6 附件是如何被索引的的主要内容,如果未能解决你的问题,请参考以下文章

Confluence 6 附件存储提取文本文件

Confluence 6 整合到支持的附件存储选项

Confluence 6 重构索引缓慢

Confluence 6 重构索引缓慢

Confluence 6 从一个备份中获得文件附件

Confluence 6 如何备份存储文件和页面信息