如何获取多部分邮件的基础 html 源

How to get the underlying html source for a Multipart mail

我需要解析传入的多部分邮件并从邮件中获取内联附件。

这部分已经完成,我可以使用 javamail api 从邮​​件中提取所有内联附件。但是邮件中嵌入的附件很少,不需要。我必须找到那些附件并将它们过滤掉(例如:头像图片)

例如:

<img width=564 height=419 id="_x0020_1" src="cid:image005.jpg@01D0E4C9.BDF788A0">

<img border=0 width=32 height=32 id=avatar-image src="cid:image006.png@01D0E4C9.BDF788A0">

<img border=0 width=16 height=16 id="_x0000_i1087" src="cid:image007.png@01D0E4C9.BDF788A0">

所以从上面三张来自邮件的图片来源可以看出,我会需要第一张和第三张图片,而第二张不需要。所以我必须过滤掉它。区别于其他人的唯一方法是通过 img 标签的 id。

因此,如果我能以某种方式获得图像的 html 来源,那么我就可以解析它,然后相应地过滤掉它。我尝试了几个选项,但似乎没有任何效果。

谁能告诉我如何做到这一点。

获取消息的html内容非常简单,参见this JavaMail FAQ entry

不过我可能不明白你说的"html source of the image"是什么意思。