通过电子邮件标头检测电子邮件正文语言的可能性

Posted

技术标签:

【中文标题】通过电子邮件标头检测电子邮件正文语言的可能性【英文标题】:Possibility of detecting language of email body by Email headers 【发布时间】:2011-04-15 01:04:59 【问题描述】:

添加一个从这里扩展的查询Detecting language of email body:

因为我想确定我在系统上收到的电子邮件的语言,以便我可以用相同的语言回复发件人。

因此,在电子邮件标题中有一个这样的标题:

'内容类型:文本/纯文本; charset=ISO-8859-1'

它在确定电子邮件正文的语言方面有多好?

例如(从 gmail 中取出的所有标题):

    对于中文主题和正文 'Content-Type: text/plain; charset=GB2312'

    对于韩语主题和正文 'Content-Type: text/plain; charset=EUC-KR'

    对于法语/意大利语主题和正文 'Content-Type: text/html; charset=ISO-8859-1'

还有没有人可以指导我为语言定义映射到字符集的列表?

提前致谢

阿什

【问题讨论】:

而且大多数时候,utf-8 的意思是“陆地” 【参考方案1】:

Here is the required list

我建议你去 google api 来检测语言。按照建议here

【讨论】:

以上是关于通过电子邮件标头检测电子邮件正文语言的可能性的主要内容,如果未能解决你的问题,请参考以下文章

检测过期的电子邮件地址? [复制]

通过 Return-Path 标头检测退回的邮件

Python-解析电子邮件正文并截断 MIME 标头

在电子邮件中注入 PHP 以添加标题?

只获取 MIME 电子邮件的“文本/纯文本”部分

通过outlook发送R Markdown输出作为正文电子邮件(RDCOMclient)