Python - 检查列表中的重复项并将重复项添加在一起以使用总和值更新列表

Posted

技术标签:

【中文标题】Python - 检查列表中的重复项并将重复项添加在一起以使用总和值更新列表【英文标题】:Python - Checking duplicates in a list and adding duplicates together to update the list with the summed value 【发布时间】:2017-08-09 22:13:05 【问题描述】:

我的问题的目的是阅读这样的帖子:

([

    'title': 'Invade Manhatten, anyone?',
    'tags': ['world-domination', 'hangout'],
    'posts': [
        
            'author': 'Mr. Sinister',
            'content': "I'm thinking 9 pm?",
            'upvotes': 2,
        ,
        
            'author': 'Mystique',
            'content': "Sounds fun!",
            'upvotes': 0,
        ,
        
            'author': 'Magneto',
            'content': "I'm in!",
            'upvotes': 0,
        ,
    ],

]))

并创建一个定义来输出:

[('Mr. Sinister', '2', 'Cautioiusly Evil'), ('Magneto', '0', 'Insignificantly Evil'), ('Mystique', '0', 'Insignificantly Evil')]

列表按点赞数从高到低排序,平局按字母顺序排列。

但是,当我收到这个帖子时:

([

    'title': 'Invade Manhatten, anyone?',
    'tags': ['world-domination', 'hangout'],
    'posts': [
        
            'author': 'Mr. Sinister',
            'content': "I'm thinking 9 pm?",
            'upvotes': 2,
        ,
        
            'author': 'Mr. Sinister',
            'content': "Sounds fun!",
            'upvotes': 0,
        ,
        
            'author': 'Mr. Sinister',
            'content': "I'm in!",
            'upvotes': 0,
        ,
    ],

]))

作者多次发帖的地方,我的程序输出:

[('Mr. Sinister', '2', 'Cautioiusly Evil'), ('Mr. Sinister', '0', 'Insignificantly Evil'), ('Mr. Sinister', '0', 'Insignificantly Evil')]

我的程序打印每个单独的帖子,而不是像这样组合结果:

[('Mr. Sinister', 2, 'Cautiously Evil')]

澄清一下,如果线程是:

([

    'title': 'Invade Manhatten, anyone?',
    'tags': ['world-domination', 'hangout'],
    'posts': [
        
            'author': 'Mr. Sinister',
            'content': "I'm thinking 9 pm?",
            'upvotes': 2,
        ,
        
            'author': 'Loki',
            'content': "Sounds fun!",
            'upvotes': 2,
        ,
        
            'author': 'Mr. Sinister',
            'content': "I'm in!",
            'upvotes': 2,
        ,
        
            'author': 'Loki',
            'content': "I'm in it!",
            'upvotes': 20,
        ,

    ],

]))

应该输入:

[('Loki', 22, 'Justifiably Evil'), ('Mr. Sinister', 4, 'Cautiously Evil')]

我的代码在这里:

  def author_rankings(thread_list):
# TODO: Determine (author, upvotes, ranking) over all threads.
counterA = 0
counterB=2

listA = []
Final = []
Double = 
for i in thread_list[0]['posts']:
    for ii in i:
        if ii == 'content':
            null = 1
        else:
            b = str(i[ii])
            if b in Double:
              Double[b]
            a = b
            if a.isdigit():
              a = int(a)
            listA.append(a)
bel=[]
for qq in listA:
    if counterA == counterB:
        bel = []
        counterB+=2
    if counterA%2 ==0:
         bel.append(qq)
         counterA+=1
    else:
       bel.append(qq)
       qq = int(qq)
       if qq == 0:
           bel.append('Insignificantly Evil')

     elif qq < 20:
          bel.append('Cautiously Evil')


     elif qq < 100:
          bel.append('Justifiably Evil')

     elif qq < 500:
           bel.append('Wickedly Evil')

     elif qq >= 500:
          bel.append('Diabolically Evil')

     counterA+=1



     tuuple = tuple(bel)
     Final.append(tuuple)



Final.sort()      

Final.sort(key=lambda tup: -tup[1])

我知道我的代码有点不符合 Python 风格/难以阅读。很抱歉给您带来不便。

谢谢!

【问题讨论】:

你想总结一下作者的点赞数吗? 对不起,这东西是不可读的,它不是“有点不像pythonic”,它是魔鬼的作品。你至少不能给出有意义的名字之类的吗?在提供帮助的同时让我们的生活更轻松? @droravr 对不起!我将变量更改为更易于理解的名称。 迭代帖子并将数据保存在author:upvote 对的字典中,在迭代过程中添加赞成票。您必须使用字典 get 方法或首先测试或捕获 KeyError 或使用集合字典容器来解决丢失键的问题。当帖子完成后,遍历字典项并通过添加适当的 evilness 来构造元组。 docs.python.org/3/howto/sorting.html 【参考方案1】:

我不明白你在问什么,因为逻辑不是很清楚。

但是,聚合可以这样完成:

some_pages = [
        
            'title': 'Invade Manhatten, anyone?',
            'tags': ['world-domination', 'hangout'],
            'posts': [
                
                    'author': 'Mr. Sinister',
                    'content': "I'm thinking 9 pm?",
                    'upvotes': 2,
                ,
                
                    'author': 'Mr. Sinister',
                    'content': "Sounds fun!",
                    'upvotes': 0,
                ,
                
                    'author': 'Mr. Sinister',
                    'content': "I'm in!",
                    'upvotes': 0,
                ,
            ],
        
    ]

author_aggregation = 
for pages in some_pages:
    for post in pages.get('posts', []):
        a = post.get('author')
        v = post.get('upvotes')
        c = post.get('content')
        if a in author_aggregation:
            author_aggregation.update(a: 'upvotes': author_aggregation[a]['upvotes'] += v, 'content': author_aggregation[a]['content'].append(c))
        else:
            author_aggregation[a] = 'upvotes': v, 'content': [c]

相关:

Group by and aggregate the values of a list of dictionaries in Python

【讨论】:

【参考方案2】:

这可能有效,它会忽略内容(如果需要也可以添加),只接受投票和作者。它还使用字典而不是列表:

authors = dict()

for post in x[0]['posts']:
    try:
        authors[post['author']] += post['upvotes']

    except KeyError:
        authors[post['author']] = post['upvotes']

for k, upvotes in authors.iteritems():
    if upvotes == 0:
        authors[k] = (upvotes, "Insignificantly Evil")

    elif upvotes < 20:
        authors[k] = (upvotes, "Cautioiusly Evil")

    elif upvotes < 100:
        authors[k] = (upvotes, "Justifiably Evil")

    elif upvotes <= 500:
        authors[k] = (upvotes, "Wickedly Evil")

    elif upvotes > 500:
        authors[k] = (upvotes, "Diabolically Evil")

print authors

输出:

'Mr. Sinister': (2, 'Cautioiusly Evil')

还有:

'Mr. Sinister': (4, 'Cautioiusly Evil'), 'Loki': (22, 'Justifiably Evil')

第二个例子。

【讨论】:

【参考方案3】:

此代码有效,希望它具有足够的可读性,以便您调整它

x = in[0]  # returns a dict from your input

for post in x.get('posts'):
        author = post.get('author')
        if author not in d.keys():
            d[author] = post
        else:
            d.get('author')['upvotes'] += post.get('upvotes')

这将返回一个没有重复作者的字典,并且如果它已经存在,则不会更新分数。

我在你的数据上试过了,效果很好

d '先生。 Sinister':'content':“我想晚上 9 点?”,“upvotes”:2,“author”:“Mr.险恶'

【讨论】:

您的代码不计算同一张海报的所有投票。它只会从每个作者的第一篇文章中获得投票。

以上是关于Python - 检查列表中的重复项并将重复项添加在一起以使用总和值更新列表的主要内容,如果未能解决你的问题,请参考以下文章

Python - 在字典列表中查找重复项并将它们分组

java 检查列表中的重复项

替换python中重复项列表中的一个特定重复项

删除列表python中的重复项[重复]

C# 合并重复列表项并将它们的第二个值求和(2D 对象列表)

Python统计列表中的重复项出现的次数