从另一个表的行批量更新一个表

Posted

技术标签:

【中文标题】从另一个表的行批量更新一个表【英文标题】:Bulk updating a table from rows from another table 【发布时间】:2008-09-25 23:56:56 【问题描述】:

2 个表:

Employees
- EmployeeID
- LeadCount


Leads
- leadID
- employeeID

我想通过计算Leads 表中具有相同EmployeeID 的潜在客户数来更新Employees.LeadCount 列。

注意:可能有不止 1 个潜在客户具有相同的employeeID,所以我必须做一个DISTINCT(SUM(employeeID))

【问题讨论】:

【参考方案1】:
UPDATE
    Employees E
SET
    E.LeadCount = (
        SELECT COUNT(L.EmployeeID)
        FROM Leads L
        WHERE L.EmployeeID = E.EmployeeID
    )

【讨论】:

【参考方案2】:

您正在为数据同步问题做好准备。随着 Leads 表中的行被插入、更新或删除,您需要不断更新 Employees.LeadCount 列。

最好的解决方案是根本不存储 LeadCount 列,而是根据需要使用 SQL 聚合查询重新计算潜在客户数。这样它就永远是正确的。

SELECT employeeID, COUNT(leadId) AS LeadCount
FROM Leads
GROUP BY employeeID;

另一种解决方案是在 Leads 表上为 INSERT、UPDATE 和 DELETE 创建触发器,以便始终保持Employees.LeadCount 列最新。例如,使用 mysql 触发器语法:

CREATE TRIGGER leadIns AFTER INSERT ON Leads
FOR EACH ROW BEGIN
  UPDATE Employees SET LeadCount = LeadCount + 1 WHERE employeeID = NEW.employeeID;
END

CREATE TRIGGER leadIns AFTER UPDATE ON Leads
FOR EACH ROW BEGIN
  UPDATE Employees SET LeadCount = LeadCount - 1 WHERE employeeID = OLD.employeeID;
  UPDATE Employees SET LeadCount = LeadCount + 1 WHERE employeeID = NEW.employeeID;
END

CREATE TRIGGER leadIns AFTER DELETE ON Leads
FOR EACH ROW BEGIN
  UPDATE Employees SET LeadCount = LeadCount - 1 WHERE employeeID = OLD.employeeID;
END

如果您使用 MySQL,另一种选择是使用多表 UPDATE 语法。这是 SQL 的 MySQL 扩展,它不能移植到其他品牌的 RDBMS。首先,将所有行中的 LeadCount 重置为零,然后对 Leads 表进行连接,并在连接产生的每一行中增加 LeadCount。

UPDATE Employees SET LeadCount = 0;
UPDATE Employees AS e JOIN Leads AS l USING (employeeID)
  SET e.LeadCount = e.LeadCount+1;

【讨论】:

如果不需要确切的值,那么如果以某种方式作为计划任务运行,所要求的可能会非常好。 + 1 表示不存储 LeadCount,但 -1 表示触发器。我认为它们真的应该是单独的回复。【参考方案3】:

Join 对更新(和删除)的作用与对选择的作用相同(编辑:至少在某些流行的 RDBMS 中*):

UPDATE Employees SET
  LeadCount = Leads.LeadCount
FROM Employee
JOIN (
  SELECT EmployeeId, COUNT(*) as LeadCount 
  FROM Leads 
  GROUP BY EmployeeId
) as Leads ON
  Employee.EmployeeId = Leads.EmployeeId  

SUM(DISTINCT EmployeeId) 没有意义 - 你只需要一个 COUNT(*)。

MS SQL Server 支持UPDATE...FROM 和DELETE...FROM 语法,MySql 也支持,但 SQL-92 标准不支持。 SQL-92 会让您使用行表达式。我知道DB2 支持这种语法,但不确定其他任何语法。坦率地说,我发现 SQL-92 版本令人困惑 - 但标准和理论专家会争辩说,FROM 语法违反了关系理论,并且在不精确的 JOIN 子句或切换 RDBMS 供应商时会导致不可预测的结果。

【讨论】:

由于某种原因更新查询更加复杂,希望现在我能以同样的方式思考它们! UPDATE 和 DELETE 中的联接不是标准 SQL,但某些实现支持它们作为扩展。哪个品牌的 RDBMS 支持上述语法?【参考方案4】:
UPDATE Employees SET LeadCount = (
  SELECT Distinct(SUM(employeeID)) FROM Leads WHERE Leads.employeeId = Employees.employeeId
)

【讨论】:

sum(employeeid) 没有任何意义,并且围绕单个值区分将始终返回相同的值,因此它是多余的。 IIRC 会很慢(我只用过 MySQL)【参考方案5】:

从上面提取并删除依赖的子查询。

// create tmp -> TBL (EmpID, count)

insert into TBL 
   SELECT employeeID COUNT(employeeID) Di
   FROM Leads WHERE Leads.employeeId = Employees.employeeId GROUP BY EmployeeId
UPDATE Employees SET LeadCount = (
  SELECT count FROM TBL WHERE TBL.EmpID = Employees.employeeId
)

// drop TBL

编辑这是“分组依据”而不是“不同”:b(感谢 Mark Brackett)

【讨论】:

以上是关于从另一个表的行批量更新一个表的主要内容,如果未能解决你的问题,请参考以下文章

Django 批量更新两个表的数据

两个表,根据条件批量更新其中一个表的某一列数据。(高分求救,在线等待。)

Oracle两张表关联批量更新其中一张表的数据

从另一个表的多条记录更新一个表中的一条记录。其中一个表的列名是另一个表的字段

如何通过 MS ACCESS 表执行 SQL Server 表的批量更新

mysql 3张表关联批量更新