个性化阅读
专注于IT技术分析

反向索引与正向索引之间的差异

倒排索引

它是一种数据结构, 用于存储从单词到文档或文档集的映射, 即从单词到文档的指导。

建立反向索引的步骤是:

  • 提取文档并收集所有单词。
  • 检查每个单词(如果存在), 然后将文档引用添加到索引, 否则在该单词的索引中创建新条目。
  • 对所有文档重复上述步骤, 并对单词进行排序。

索引很慢, 因为它首先检查单词是否存在。

搜索非常快。

倒排索引示例:

Word                              Documents
hello                             doc1      
sky                               doc1, doc3
coffee                            doc2
hi                                doc2
greetings                         doc3

它不会在索引中存储重复的关键字。

现实生活中反向索引的示例:

  • 书后的索引。
  • 反向查询

远期指数:

它是一种数据结构, 用于存储从文档到单词的映射, 即引导你从文档到单词。

建立前进索引的步骤是:

  • 提取文档并收集所有关键字。
  • 在此文档的索引条目中附加所有关键字。
  • 对所有文档重复上述步骤

索引编制非常快, 因为它在前进时仅附加关键字。

搜索非常困难, 因为它必须查看索引的每个内容才能检索与单词相关的所有页面。

前向索引示例:

Document                          Keywords
doc1                              hello, sky, morning      
doc2                              tea, coffee, hi
doc3                              greetings, sky

它在索引中存储重复的关键字。例如:单词” sky”被多次存储。

现实生活中的前向索引示例:

  • 书中的目录。
  • DNS查询

正向索引和反向索引之间的相似性:

  • 两者都用于搜索文档或文档集中的文本。

赞(0)
未经允许不得转载:srcmini » 反向索引与正向索引之间的差异

评论 抢沙发

评论前必须登录!