从带有附件的 Databricks Notebook 发送电子邮件

Posted

技术标签:

【中文标题】从带有附件的 Databricks Notebook 发送电子邮件【英文标题】:Send email from Databricks Notebook with attachment 【发布时间】:2021-04-14 09:15:46 【问题描述】:

我是 Python 和 Spark 世界的新手。我正在尝试构建一个 pyspark 代码以从 Databricks 发送一封电子邮件以及来自挂载点位置的附件。我正在使用下面的代码来实现相同的 -

import smtplib
from pathlib import Path
from email.mime.multipart import MIMEMultipart
from email.mime.base import MIMEBase
from email.mime.text import MIMEText
from email.utils import COMMASPACE, formatdate
from email import encoders


def send_mail(send_from = <from_email>, send_to = <to_email>, subject = "Test", message = "Test", files=["/mnt/<Mounted Point Directory>/"],
              server="<SMTP Host>", port=<SMTP Port>, username='<SMTP Username>', password='<SMTP Password>',
              use_tls=True):

    msg = MIMEMultipart()
    msg['From'] = send_from
    msg['To'] = COMMASPACE.join(send_to)
    msg['Date'] = formatdate(localtime=True)
    msg['Subject'] = subject

    msg.attach(MIMEText(message))

    for path in files:
        part = MIMEBase('application', "octet-stream")
        with open(path, 'rb') as file:
            part.set_payload(file.read())
        encoders.encode_base64(part)
        part.add_header('Content-Disposition',
                        'attachment; filename=""'.format(Path(path).name))
        msg.attach(part)

    smtp = smtplib.SMTP(server, port)
    if use_tls:
        smtp.starttls()
    smtp.login(username, password)
    smtp.sendmail(send_from, send_to, msg.as_string())
    smtp.quit()

但由于某种原因,代码给了我文件或目录不存在异常。

我这里有什么遗漏吗?

谢谢

【问题讨论】:

你能贴出完整的错误信息吗? 如何传递文件名——它们是在 DBFS 上还是在本地? @AlexOtt - 文件位于 DBFS(Blob 存储挂载点位置) @AndreasStorvikStrauman - FileNotFoundError: [Errno 2] No such file or directory: '/mnt//' 顺便说一句,您的代码似乎是为 Python 3.5 或更早版本编写的。 email 库在 3.6 中进行了大修,现在更加通用和合乎逻辑。可能扔掉你所拥有的,然后重新开始examples from the email documentation. 【参考方案1】:

您需要修改代码以使其适用于 DBFS,因为 open 函数对 DBFS 或其他文件系统一无所知,并且只能适用于本地文件(请参阅 documentation 关于 DBFS)。

你可以这样做:

如果您使用的是“完整的 Databricks”,而不是社区版,那么您需要在文件名前面加上 /dbfs,例如,/dbfs/mnt/.... - 这个/dbfs 挂载是访问 DBFS 上文件的方式适用于本地文件的代码(但写入该位置时存在一些限制)。 或者您可以使用dbutils.fs.cp command 将文件从 DBFS 复制到本地文件,然后使用该文件副本附加,如下所示:
dbutils.fs.cp("/mnt/...", "file:///tmp/local-name")
with open("/tmp/local-name", "r"):
...

【讨论】:

是否可以直接从 DBFS 使用 open,原因是我不想将其复制到本地文件系统。 是的,正如我所写 - 只需将 /dbfs 添加到文件名之前,例如 /dbfs/mnt/..... 谢谢@AlexOtt。编译时问题现已解决。但是,由于某种原因,我没有同时使用 SMTP 详细信息和 localhost 来接收电子邮件。你有什么可以帮助我的,或者有什么需要包含/修改在这个代码中的吗? 我不熟悉那个库,可能有一些网络问题或类似的东西(端口 25 经常被阻塞)。查看文档以查看是否可以启用一些日志记录以查看该库在做什么

以上是关于从带有附件的 Databricks Notebook 发送电子邮件的主要内容,如果未能解决你的问题,请参考以下文章

从 C# 发送带有附件的电子邮件,附件在 Thunderbird 中作为第 1.2 部分到达

无法从 python 发送带有附件的电子邮件?

从资产文件夹发送带有附件的电子邮件

从 html 表单发送带有 csv 附件的电子邮件

如何从 PHP 表单发送带有附件的电子邮件?

Imaplib从带有附件的gmail转发邮件(Python)