倒排索引实现方式

Posted 身带吴钩

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了倒排索引实现方式相关的知识,希望对你有一定的参考价值。

def inverted_index_test():
    df1 = pd.DataFrame("A":[\'a c a\',\'b d\'],"B":[\'a d a\',\'c a\'])
    print(df1)
    print("A分割操作")
    df2 = df1[\'A\'].str.split(\' \',expand=True)
    print(df2)
    print("堆叠操作")
    df3 = df2.stack()
    print(df3)
    print("修剪索引")
    df4 = df3.reset_index(level=1,drop=True)#level 会删除对应的mutil值
    df4 = pd.DataFrame(df4)
    print(df4.index)
    print(df4)
    print("执行join操作")
    df5 = df4.join(df1)
    print(df5)

  输出内容:

Python 3.9.12 (main, Apr  5 2022, 06:56:58) 
[GCC 7.5.0] on linux
       A      B
0  a c a  a d a
1    b d    c a
A分割操作
   0  1     2
0  a  c     a
1  b  d  None
堆叠操作
0  0    a
   1    c
   2    a
1  0    b
   1    d
dtype: object
修剪索引
Int64Index([0, 0, 0, 1, 1], dtype=\'int64\')
   0
0  a
0  c
0  a
1  b
1  d
执行join操作
   0      A      B
0  a  a c a  a d a
0  c  a c a  a d a
0  a  a c a  a d a
1  b    b d    c a
1  d    b d    c a

  

以上是关于倒排索引实现方式的主要内容,如果未能解决你的问题,请参考以下文章

Lucene内核索引实现方式简析

利用MapReduce实现倒排索引

倒叙索引

ElasticSearch倒排索引及其原理

MapReduce经典案例—倒排索引

Elasticsearch 倒排索引