只获取新的电子邮件 imaplib 和 python
Posted
技术标签:
【中文标题】只获取新的电子邮件 imaplib 和 python【英文标题】:Get only NEW Emails imaplib and python 【发布时间】:2012-10-24 00:39:27 【问题描述】:这是一个更大项目的一小部分。我只需要获取未读电子邮件并解析它们的标题。如何修改以下脚本以仅获取未读电子邮件?
conn = imaplib.IMAP4_SSL(imap_server)
conn.login(imap_user, imap_password)
status, messages = conn.select('INBOX')
if status != "OK":
print "Incorrect mail box"
exit()
print messages
【问题讨论】:
我忘了还要求提供电子邮件的正文。 【参考方案1】:你可以使用 imap_tools 包: https://pypi.org/project/imap-tools/
from imap_tools import MailBox, AND
with MailBox('imap.mail.com').login('test@mail.com', 'password', 'INBOX') as mailbox:
# get unseen emails from INBOX folder
for msg in mailbox.fetch(AND(seen=False)):
print(msg.date, len(msg.html or msg.text))
【讨论】:
【参考方案2】:上面的答案实际上不再起作用,或者可能从未起作用,但我对其进行了修改,因此它只返回看不见的消息,它曾经给出:错误无法解析 fetch 命令或类似的东西,这是一个工作代码:
mail = imaplib.IMAP4_SSL('imap.gmail.com')
(retcode, capabilities) = mail.login('email','pass')
mail.list()
mail.select('inbox')
n=0
(retcode, messages) = mail.search(None, '(UNSEEN)')
if retcode == 'OK':
for num in messages[0].split() :
print 'Processing '
n=n+1
typ, data = mail.fetch(num,'(RFC822)')
for response_part in data:
if isinstance(response_part, tuple):
original = email.message_from_string(response_part[1])
print original['From']
print original['Subject']
typ, data = mail.store(num,'+FLAGS','\\Seen')
print n
我认为错误来自messages[0].split(' ')
,但上面的代码应该可以正常工作。
另外,请注意 +FLAGS
而不是 -FLAGS
,它将邮件标记为已读。
编辑 2020:如果您在 python 2.7 死亡后在 2020 年路过:将 email.message_from_string(data[0][1])
替换为 email.message_from_bytes(data[0][1])
【讨论】:
当然,别忘了导入imaplib
和email
如何从 original 获取邮件正文?【参考方案3】:
这样的事情就可以解决问题。
conn = imaplib.IMAP4_SSL(imap_server)
try:
(retcode, capabilities) = conn.login(imap_user, imap_password)
except:
print sys.exc_info()[1]
sys.exit(1)
conn.select(readonly=1) # Select inbox or default namespace
(retcode, messages) = conn.search(None, '(UNSEEN)')
if retcode == 'OK':
for num in messages[0].split(' '):
print 'Processing :', message
typ, data = conn.fetch(num,'(RFC822)')
msg = email.message_from_string(data[0][1])
typ, data = conn.store(num,'-FLAGS','\\Seen')
if ret == 'OK':
print data,'\n',30*'-'
print msg
conn.close()
这里还有一个重复的问题 - Find new messages added to an imap mailbox since I last checked with python imaplib2?
两个有用的函数,用于检索您检测到的新邮件的正文和附件(参考:How to fetch an email body using imaplib in python?) -
def getMsgs(servername="myimapserverfqdn"):
usernm = getpass.getuser()
passwd = getpass.getpass()
subject = 'Your SSL Certificate'
conn = imaplib.IMAP4_SSL(servername)
conn.login(usernm,passwd)
conn.select('Inbox')
typ, data = conn.search(None,'(UNSEEN SUBJECT "%s")' % subject)
for num in data[0].split():
typ, data = conn.fetch(num,'(RFC822)')
msg = email.message_from_string(data[0][1])
typ, data = conn.store(num,'-FLAGS','\\Seen')
yield msg
def getAttachment(msg,check):
for part in msg.walk():
if part.get_content_type() == 'application/octet-stream':
if check(part.get_filename()):
return part.get_payload(decode=1)
PS:如果在python 2.7死后2020年路过:把email.message_from_string(data[0][1])
换成email.message_from_bytes(data[0][1])
【讨论】:
用两个新函数getMsgs
和 getAttachment
更新了我的答案,然后您可以在 for message in messages[0].split(' '):
for 循环中使用它们。
关于将消息标记为已见的说明。将行 typ, data = conn.store(num,'-FLAGS','\\Seen') 更改为 typ, data = conn.store(num,'+FLAGS','\\Seen') 为我修复了它.
ret 定义在哪里?
您的答案并非在所有情况下都有效。我尝试检查看不见的消息,看不见的消息列表中的第一条消息有['flags', ('RFC822', 'message')
,而其他消息有[('RFC822', 'message')]
。要么这是一些 IMAP 奇怪,要么 imaplib2 有一个奇怪的输出格式。
check()
是什么? Python 没有找到它【参考方案4】:
我已经设法使用 Gmail 让它工作:
import datetime
import email
import imaplib
import mailbox
EMAIL_ACCOUNT = "your@gmail.com"
PASSWORD = "your password"
mail = imaplib.IMAP4_SSL('imap.gmail.com')
mail.login(EMAIL_ACCOUNT, PASSWORD)
mail.list()
mail.select('inbox')
result, data = mail.uid('search', None, "UNSEEN") # (ALL/UNSEEN)
i = len(data[0].split())
for x in range(i):
latest_email_uid = data[0].split()[x]
result, email_data = mail.uid('fetch', latest_email_uid, '(RFC822)')
# result, email_data = conn.store(num,'-FLAGS','\\Seen')
# this might work to set flag to seen, if it doesn't already
raw_email = email_data[0][1]
raw_email_string = raw_email.decode('utf-8')
email_message = email.message_from_string(raw_email_string)
# Header Details
date_tuple = email.utils.parsedate_tz(email_message['Date'])
if date_tuple:
local_date = datetime.datetime.fromtimestamp(email.utils.mktime_tz(date_tuple))
local_message_date = "%s" %(str(local_date.strftime("%a, %d %b %Y %H:%M:%S")))
email_from = str(email.header.make_header(email.header.decode_header(email_message['From'])))
email_to = str(email.header.make_header(email.header.decode_header(email_message['To'])))
subject = str(email.header.make_header(email.header.decode_header(email_message['Subject'])))
# Body details
for part in email_message.walk():
if part.get_content_type() == "text/plain":
body = part.get_payload(decode=True)
file_name = "email_" + str(x) + ".txt"
output_file = open(file_name, 'w')
output_file.write("From: %s\nTo: %s\nDate: %s\nSubject: %s\n\nBody: \n\n%s" %(email_from, email_to,local_message_date, subject, body.decode('utf-8')))
output_file.close()
else:
continue
【讨论】:
【参考方案5】:original = email.message_from_string(response_part[1])
需要更改为:
original = email.message_from_bytes(response_part[1])
【讨论】:
这可能是 Python 3 的必要修复,但不会尝试回答 OP 的问题,而应该是评论,显然是参考Amro's answer。以上是关于只获取新的电子邮件 imaplib 和 python的主要内容,如果未能解决你的问题,请参考以下文章
获取 HTML、imaplib 和 Django 格式的文本
IMAPLIB:是否有任何MOVED标志来识别邮箱之间移动的邮件