使用Hibernate进行数千次插入时的CPU利用率很高

Question

我们最近使用Hibernate和EntityManager（没有Spring）实现了数据库绑定，以便将记录写入数据库。为简单起见，我将仅讨论仅插入的过程的变化。（另一个非常相似的过程会更新现有记录一次以设置状态，但除此之外，只需插入一堆记录。）

此过程每个事务可以插入多达10,000条记录，但平均值小于该值，可能至少减半。我们可能会在同一个JVM下同时在不同的线程中运行此进程的一些实例。

我们遇到了一个生产问题，即运行该流程的服务是将机器上的所有24个核心连接起来。（他们增加了12只是为了试图适应这种情况。）我们将这种高利用率缩小到了Hibernate。

我花了几天研究，除了使用hibernate.jdbc.batch_size和hibernate.order_inserts之外，找不到任何可以改善我们性能的东西。不幸的是，我们使用IDENTITY作为我们的生成策略，因此Hibernate可以/不会批量插入这些插入。

我花了几天时间研究，并且在进行大量插入时没有找到任何其他性能提示。（我看过很多关于读取，更新和删除的提示，但很少有插入。）

我们有一个根JobPO对象。我们只需在其上调用merge，并通过级联注释处理所有插入。我们需要在一次交易中完成这项工作。

我们只插入了8个不同的表，但记录的层次结构有点复杂。

public void saveOrUpdate(Object dataHierarchyRoot) {
    final EntityManager entityManager = entityManagerFactory.createEntityManager();
    final EntityTransaction transaction = entityManager.getTransaction();

    try {
        transaction.begin();

        // This single call may result in inserting up to 10K records
        entityManager.merge(dataHierarchyRoot);
        transaction.commit();
    } catch (final Throwable e) {
        // error handling redacted for brevity
    } finally {
        entityManager.close();
    }
}

我们只创建一次EntityManagerFactory。

有任何想法吗？

补充说明：

没有人抱怨使用太多内存的过程
对于仅进行插入的过程的变化，我们可以使用“persist”而不是“merge”。我们正在共享代码，所以我们进行合并。我试着转而坚持没有明显改善。
我们的注释会在一些字段上产生双向级联。我尝试删除这些，但对Hibernate不熟悉，无法正确保存。但据我所知，这似乎不会导致插件的性能下降。我没有使用明确的“反向”设置，因为这似乎对插入也无关紧要。不过，我对这两方面都有点不稳定。这方面还有改进的余地吗？
我们在单个事务中运行SQL事件探查器。似乎没有什么不妥，我没有发现改进的余地。（有大量的exec sp_prepexec语句，与插入的记录数大致相同。这就是报告的所有内容。）
在生产中表现出这种行为的代码是在commit（）之前对entityManager.flush（）进行显式调用。我在本地环境中删除了该代码。它没有明显的改进，但我不会添加它，因为我们没有理由调用flush（）。

Answer 1

另一答案

Answer 2

另一答案