利用Kettle实现Excel文件拆分并发送邮件(上)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了利用Kettle实现Excel文件拆分并发送邮件(上)相关的知识,希望对你有一定的参考价值。

参考技术A 我们财务有一个需求,希望将整理好的一份供应商付款明细Excel文件,按供应商拆分成多个Excel文件,并发送给对应供应商的联系人。

供应商付款明细表格式如下:

另外有一份供应商联系人表存放每个供应商对应的联系人邮箱:

用户希望将供应商A的两行记录,拆分成一个独立的Excle文件,作为附件发送给供应商A的两个联系人aa1、aa2。将供应商B的一行记录,拆分成一个独立的Excle文件,作为附件发送给供应商B的两个联系人bb1、bb2。

作业中关联两个转换,T1转换用来获取原始文件内容参数中,T2转换用来将参数一行行写入到一个个独立Excel文件中。

Python自动化办公之Excel拆分并自动发邮件


今天我们来分享一个真实的自动化办公案例,希望各位 Python 爱好者能够从中得到些许启发,在自己的工作生活中更多的应用 Python,使得工作事半功倍!

需求

需要向大约 500 名用户发送带有 Excel 附件的电子邮件,同时必须按用户从主 Excel 文件中拆分数据以创建他们自己的特定文件,然后将该文件通过电子邮件发送给正确的用户

需求解析


大致的流程就是上图,先拆分 Excel 数据,提取出对应的邮件地址和用户的数据信息,再自动添加到邮件的附件当中

代码实现

首先我们先来看下我们手中 Excel 的数据形式是怎么样的

import datetime
import os
import shutil
from pathlib import Path
import pandas as pd


src_file = Path.cwd() / 'data' / 'Example4.xlsx'
df = pd.read_excel(src_file)
df.head()


可以看出,CUSTOMER_ID 就是那个唯一的用户 ID,下面我们以该字段来分组,得到如下数据

customer_group = df.groupby('CUSTOMER_ID')
for ID, group_df in customer_group:
    print(ID)
>>>Output>>>
A1000
A1001
A1002
A1005
...

我们再来看下用户 A1005 所对应的数据形式


接下来我们就为每一个用户创建一个 Excel,后面就可以作为附件使用

attachment_path = Path.cwd() / 'data' / 'attachments'
today_string = datetime.datetime.today().strftime('%m%d%Y_%I%p')
attachments = []
for ID, group_df in customer_group:
    attachment = attachment_path / f'ID_today_string.xlsx'
    group_df.to_excel(attachment, index=False)
    attachments.append((ID, str(attachment)))

我们来看下变量 attachments 所包含的数据吧

[('A1000',
'c:\\\\Users\\\\luobo\\\\notebooks\\\\2020-10\\\\data\\\\attachments\\\\A1000_01162021_12PM.xlsx'),
('A1001',
'c:\\\\Users\\\\luobo\\\\notebooks\\\\2020-10\\\\data\\\\attachments\\\\A1001_01162021_12PM.xlsx'),
('A1002',
'c:\\\\Users\\\\luobo\\\\notebooks\\\\2020-10\\\\data\\\\attachments\\\\A1002_01162021_12PM.xlsx'),
('A1005',
'c:\\\\Users\\\\luobo\\\\notebooks\\\\2020-10\\\\data\\\\attachments\\\\A1005_01162021_12PM.xlsx')]

最后我们可以通过将 DataFrame 合并在一起来生成带有电子邮件地址的文件列表

email_merge = pd.merge(df, df2, how='left')
combined = email_merge[['CUSTOMER_ID', 'EMAIL', 'FILE']].drop_duplicates()

得到的 DataFrame 如下


我们已经收集了客户名单、他们的电子邮件和附件,现在我们就可以用 Outlook 发送一封电子邮件了

import win32com.client as win32

today_string2 = datetime.datetime.today().strftime('%b %d, %Y')

class EmailsSender:
    def __init__(self):
        self.outlook = win32.Dispatch('outlook.application')

    def send_email(self, to_email_address, attachment_path):
        mail = self.outlook.CreateItem(0)
        mail.To = to_email_address
        mail.Subject = today_string2 + ' Report'
        mail.Body = """Please find today's report attached."""
        mail.Attachments.Add(Source=attachment_path)
        # Use this to show the email
        #mail.Display(True)
        # Uncomment to send
        #mail.Send()

通过上面这个简单的类,我们可以生成电子邮件并附加 Excel 文件

同时我们还注意到,这里使用了 win32,关于这个库的具体使用,我们在下次的文章中再具体说明吧

email_sender = EmailsSender()
for index, row in combined.iterrows():
    email_sender.send_email(row['EMAIL'], row['FILE'])


最后,我们再把所有生成的 Excel 存档,以备后面审查、比对等

archive_dir = Path.cwd() / 'archive'

for f in attachments:
    shutil.move(f[1], archive_dir)

至此,我们的编码结束,整体来看还是比较简单的

推荐阅读:

睡在我上铺的室友用python,一个月挣了我一学期的生活费

以上是关于利用Kettle实现Excel文件拆分并发送邮件(上)的主要内容,如果未能解决你的问题,请参考以下文章

Python自动化办公之Excel拆分并自动发邮件

Kettle实现从数据库中提取数据到Excel

Python 自动化办公之 Excel 拆分并自动发邮件

kettle 有新插入数据则发送邮件提醒?

Windows下Kettle定时任务执行并发送错误信息邮件

利用kettle,怎样把数据导入到同一个excel,不同sheet中