python SQLでSELECT DISTINCTしてユニークな组み合わせをカウントするような问い合わせを,熊猫のデータフレームに书き変えてみました。以下「お昼のセットメニューの组み合わせに投票」と

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python SQLでSELECT DISTINCTしてユニークな组み合わせをカウントするような问い合わせを,熊猫のデータフレームに书き変えてみました。以下「お昼のセットメニューの组み合わせに投票」と相关的知识,希望对你有一定的参考价值。

#ユーザーに"main_dish"と"soup"を組み合わせて投票してもらいます。
#ただし、ユーザーは同じメニューの組み合わせに何度でも投票できるため
#一つの組み合わせの有効票は1ユーザにつき1としてカウントしたい、とします。
import pandas as pd
import numpy as nm
d = {{"main_dish": pd.Series(["ステーキ","ハンバーグ",,,])\
      ,"soup":pd.Series(["みそ汁","クラムチャウダー",,,]) \
      ."user": pd.Series(["@user1","@user2",,,])
      
df = pd.DataFrame(d)
#階層的インデックスを持つSeriesが得られる。"user"の値はユニークなユーザーのリストとなる。
df_u = df.groupby(["main_dish","soup"]).user.unique() 
#SeriesをDataFrameに変換
df_u = pd.DataFrame(df_u)
#unique()で返える"user"はユーザ名のnd.arrayなため、この項目をユーザ数に置き換える
df_u["user"] = df_u["user"].map(lambda x: len(x))

df_u
#ハンバーグ コーンスープ 25
#のようなデータフレームが得られます

以上是关于python SQLでSELECT DISTINCTしてユニークな组み合わせをカウントするような问い合わせを,熊猫のデータフレームに书き変えてみました。以下「お昼のセットメニューの组み合わせに投票」と的主要内容,如果未能解决你的问题,请参考以下文章

写出SQL查询语句的基本结构,并说明结构中各子句表示的含义

sql SQLでCSV

markdown VIMでSQLを実行する环境

sql bigqueryでJST 1日分のデータを取得

unique 和distinct 的区别

sql ぱぱっと不亦乐乎でテストデータを作る