如何为关联规则分析使用一个热编码数据帧(先验)

Posted

技术标签:

【中文标题】如何为关联规则分析使用一个热编码数据帧(先验)【英文标题】:How to One Hot Encode Dataframe for Association Rule Analysis (apriori) 【发布时间】:2020-06-13 04:05:36 【问题描述】:

我得到了一个模仿购物清单的数据框:

import pandas as pd

data = 'Produce':  ['Brocolli', 'Spinach','Spinach','Lettuce','Brocolli','Lettuce','Lettuce',],
        'Dairy': ['Milk', '','Milk','Cheese','Milk','Yogurt','Yogurt',],
        'Beverage': ['', '','Orange Juice','Soda','Soda','Orange juice','',],
        'Fruit': ['Brocolli', 'Spinach','Spinach','Lettuce','Brocolli','Lettuce','Lettuce',],
        'Poultry': ['Chicken Tender', 'Chicken Breasts','Chicken Tender','Chicken Thigh','Chicken Breasts','','Chicken Breasts',],
        'Deli': ['Turkey Breasts', 'Ham','Ham','','','Turkey Breasts','',],
       

df = pd.DataFrame (data, columns = ['Produce','Dairy','Beverage','Fruit','Deli'])

df

如何执行 one-hot-encoding 来转换此数据帧,以便我可以先验地对其运行(据我所知,基本上所有独特的值都作为列标签和值替换为布尔值)?

【问题讨论】:

【参考方案1】:

你可以试试:

pd.get_dummies(df)

【讨论】:

以上是关于如何为关联规则分析使用一个热编码数据帧(先验)的主要内容,如果未能解决你的问题,请参考以下文章

第九章 数据关联规则分析算法——基于Apriori算法的关联项分析

是否可以在 mysql 语句中运行先验关联规则?

R - 关联规则 - 先验

关联分析的关联分析的方法

R中使用先验函数的关联规则

r 关联规则先验