java - 使用 JavaMail 将“mail.imaps.fetchsize”属性设置为大数字有什么影响?
问题描述
我有一个计划作业从文件夹中获取最近的电子邮件并将这些电子邮件写入文件(.eml 文件)。但它需要很长时间(阅读一封 9mb 大小的电子邮件需要 5 到 6 分钟)才能完成。由于我使用的是 JavaMail API,因此我在代码中设置了如下属性,以提高性能,这样它花费的时间非常少(20 秒)。
props.setProperty("mail.imaps.partialfetch","false");
props.setProperty("mail.imaps.fetchsize", "1048576");
- 这(设置
fetchsize
为更大的值)是否会在我的应用程序中产生任何其他问题? - 设置
fetchsize
为 1048576 意味着我的计划作业将始终占用这么多内存,剩余的内存将分配给我的应用程序的其余部分。我的理解在这里正确吗?如果没有,有人可以通过一个例子帮助我更好地理解这一点吗?
整个代码如下,
package com.indiscover;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStream;
import java.util.Properties;
import javax.mail.Flags;
import javax.mail.Folder;
import javax.mail.Message;
import javax.mail.MessagingException;
import javax.mail.NoSuchProviderException;
import javax.mail.Session;
import javax.mail.Store;
import javax.mail.search.FlagTerm;
public class ReadMail {
public static void main(String[] args) throws InterruptedException, IOException {
String protocol="imaps";
String emailAddress = "email_id";
String password = "password";
Properties props = new Properties();
props.setProperty("mail.store.protocol", protocol);
props.setProperty("mail.imaps.socketFactory.class", "javax.net.ssl.SSLSocketFactory");
props.setProperty("mail.imaps.socketFactory.fallback", "false");
props.setProperty("mail.imaps.port", "993");
props.setProperty("mail.imaps.socketFactory.port", "993");
props.setProperty("mail.imaps.partialfetch","false");
props.setProperty("mail.imaps.fetchsize", "1048576");
Session session = Session.getInstance(props, null);
try {
Store store = session.getStore(protocol);
store.connect("imap-mail.outlook.com", emailAddress, password);
Folder inbox = store.getFolder("Archive/Test");
inbox.open(Folder.READ_WRITE);
//search for all "unseen" messages
Flags recent = new Flags(Flags.Flag.RECENT);
FlagTerm recentFlagTerm = new FlagTerm(recent, true);
Message messages[] = inbox.search(recentFlagTerm);
for (int i = 0; i < messages.length; i++) {
Message message = messages[i];
String subject = message.getSubject();
processSaveToFile(message,subject);
}
inbox.close(false);
store.close();
}catch (NoSuchProviderException ex) {
System.out.println("No provider.");
ex.printStackTrace();
} catch (MessagingException ex) {
System.out.println("Could not connect to the message store.");
ex.printStackTrace();
}
}
private static void processSaveToFile (Message msg, String subject) throws MessagingException, IOException
{
String whereToSave = "/Users/XXX/Documents/" + "some_random_name" + ".eml";
OutputStream out = new FileOutputStream(new File(whereToSave));
try {
msg.writeTo(out);
}
finally {
if (out != null) { out.flush(); out.close(); }
}
}
}
解决方案
从 JakartaMail 常见问题解答中检索大型邮件正文有时似乎效率低下:
如果您使用的是 IMAP 提供程序,您可以尝试增加 mail.imap.fetchsize 属性(当前默认值为 16k)。这将导致数据以更大的块从服务器获取。请注意,执行此操作时,您可能会冒 JVM 内存不足的风险。
正如您所指出的,您只需要足够的堆空间。
将 fetchsize 设置为 1048576 意味着我的计划作业将始终占用这么多内存,剩余的内存将分配给我的应用程序的其余部分。
挖掘imap 包的源代码,看起来 fetchsize 用于为每个IMAPInputStream
. 看起来它将取决于 IMAPInputStream 的生命周期以及内存中可访问的 IMAPInputStream 数量将决定堆使用的行为方式。从您的源代码看来,它应该是相当可预测的。
在您的应用程序上运行内存配置文件以调整您的堆设置。
推荐阅读
- reactjs - Firebase 不一致的数据,同时从 React 更新两个集合
- javascript - 从数据库中获取数据时数据表不起作用
- firebase - Firebase 和 Unity:找不到命令行工具错误
- python - 使用 BeautifulSoup 和 Selenium 抓取多个网站
- amazon-web-services - 从 apigateway 迁移到 apigatewayv2
- c - 为什么尽管更换了标准输入,但我的管道没有在 printf 中读取?
- python-3.x - 在 pandas 加载一个大文件并在加载前过滤列
- php - 将列复制到同一表中的其他列
- swiftui - 水平滚动视图不起作用swiftUI
- python - 安装 mysqlclient 后没有名为“MySQLdb”的模块