SQL查询根据值和字段名从两个表中获取计数

Posted

技术标签:

【中文标题】SQL查询根据值和字段名从两个表中获取计数【英文标题】:SQL query to obtain counts from two tables based on values and field names 【发布时间】:2019-03-22 07:20:56 【问题描述】:

我想根据地区统计候选人的警报。

以下是按地区划分的警报查找表

Table_LKP_AlertMastInfo

DistrictID             FieldName              AlertOptionValue  
  71                    AreYouMarried                 Yes
  71                      Gender                      Female
  72                    AreYouMarried                 Yes

上述 Table_LKP_AlertMastInfo 字段名应与 table_RegistrationInfo 字段进行比较,以检查 AlertOptionValue 以获取计数。

下面是候选人详情表:

Table_RegistrationInfo

CandidateId    DistrictID     AreYouMarried     Gender  
 Can001            71             Yes            Female
 Can002            71             No             Female
 Can003            72             Yes            Man  
 Can004            72             No             Man    

我想要如下输出:

Can001   2
Can002   1
Can003   1

上述输出计数的解释:

Can001 have selected AreYouMarried:Yes and Gender:Female then count value 2
Can002 have selected  Gender:Female then count value   1
Can003 have selected AreYouMarried:Yes then count value   1
Can004 have not alerts 

【问题讨论】:

以Can001为例——我们可以使用哪些id字段来连接表?因为 Districtid 对于候选人来说不是唯一的。 【参考方案1】:

如果您的数据按原样建模,即Table_LKP_AlertMastInfo 中的键值对和Table_RegistrationInfo 中的列,则如果没有动态 SQL,这将是不可能的。因此,让我们开始吧。提供您需要的确切结果的存储过程的完整代码在最后,我将解释它的作用。

由于警报被指定为键值对(字段名称 - 字段值),我们首先需要获取相同格式的候选数据。 UNPIVOT 可以解决这个问题,如果我们能得到它的字段列表。如果我们只有您在问题中提到的两个字段,那将相当容易,例如:

SELECT CandidateId, DistrictID
     , FieldName
     , FieldValue
  FROM Table_RegistrationInfo t
  UNPIVOT (FieldValue FOR FieldName IN (AreYouMarried, Gender)) upvt

当然不是这样,所以我们需要动态选择我们感兴趣的字段列表并提供它。由于您使用的是 2008 R2,STRING_AGG 尚不可用,因此我们将 use the XML trick to aggregate all the fields into a single string 并将其提供给上面的查询。

DECLARE @sql NVARCHAR(MAX)
SELECT @sql = CONCAT('SELECT CandidateId, DistrictID
     , FieldName
     , FieldValue
  FROM Table_RegistrationInfo t
  UNPIVOT (FieldValue FOR FieldName IN (',
    STUFF((
          SELECT DISTINCT ',' + ami.FieldName
          FROM Table_LKP_AlertMastInfo ami
          FOR XML PATH(''), TYPE).value('.', 'NVARCHAR(MAX)'), 1, 1, ''), ')) upvt')

PRINT @sql

这会产生与我编写的查询几乎完全相同的输出。接下来,我们需要将这些数据存储在某个地方。临时表来救援。让我们创建一个并使用此动态 SQL 插入其中。

CREATE TABLE #candidateFields
(
    CandidateID VARCHAR(50),
    DistrictID  INT,
    FieldName   NVARCHAR(200),
    FieldValue  NVARCHAR(1000)
);

INSERT INTO #candidateFields
EXEC sp_executesql @sql

-- (8 rows affected)
-- We could index this for good measure
CREATE UNIQUE CLUSTERED INDEX uxc#candidateFields on #candidateFields
(
     CandidateId, DistrictId, FieldName, FieldValue
);

太好了,除此之外,我们现在拥有两个数据集 - 警报和候选数据 - 格式相同。只需加入即可在两者之间找到匹配项:

SELECT cf.CandidateID, COUNT(*) AS matches
  FROM #candidateFields cf
 INNER
  JOIN Table_LKP_AlertMastInfo alerts
    ON alerts.DistrictID = cf.DistrictID
   AND alerts.FieldName = cf.FieldName
   AND alerts.AlertOptionValue = cf.FieldValue
 GROUP BY cf.CandidateID

为样本数据提供所需的输出:

CandidateID 匹配
-------------------------------------------------- ------------
可以001 2
可以002 1
可以003 1

(受影响的 3 行)

所以我们现在可以将所有这些拼接在一起形成一个可重用的存储过程:

CREATE PROCEDURE dbo.findMatches
AS
BEGIN
    SET NOCOUNT ON;

    DECLARE @sql NVARCHAR(MAX)
    SELECT @sql = CONCAT('SELECT CandidateId, DistrictID
         , FieldName
         , FieldValue
      FROM Table_RegistrationInfo t
      UNPIVOT (FieldValue FOR FieldName IN (',
        STUFF((
              SELECT DISTINCT ',' + ami.FieldName
              FROM Table_LKP_AlertMastInfo ami
              FOR XML PATH(''), TYPE).value('.', 'NVARCHAR(MAX)'), 1, 1, ''), ')) upvt')

    CREATE TABLE #candidateFields
    (
        CandidateID VARCHAR(50),
        DistrictID  INT,
        FieldName   NVARCHAR(200),
        FieldValue  NVARCHAR(1000)
    );

    INSERT INTO #candidateFields
    EXEC sp_executesql @sql


    CREATE UNIQUE CLUSTERED INDEX uxc#candidateFields on #candidateFields
    (
         CandidateId, DistrictId, FieldName
    );

    SELECT cf.CandidateID, COUNT(*) AS matches
      FROM #candidateFields cf
      JOIN Table_LKP_AlertMastInfo alerts
        ON alerts.DistrictID = cf.DistrictID
       AND alerts.FieldName = cf.FieldName
       AND alerts.AlertOptionValue = cf.FieldValue
     GROUP BY cf.CandidateID

END;

执行

EXEC dbo.findMatches

您当然需要调整类型并可能在此处添加许多其他内容,例如错误处理,但这应该可以让您走上正确的道路。您需要该警报表上的覆盖索引,即使有很多记录,它也应该很快。

【讨论】:

【参考方案2】:

我设法在不使用动态查询的情况下获得了预期结果。 不确定这是否是您正在寻找的:

 SELECT DISTINCT 
    c.CandidateId, SUM(a.AreYouMarriedAlert + a.GenderAlter) AS AlterCount
FROM 
    Table_RegistrationInfo c
OUTER APPLY
(
    SELECT 
        CASE 
            WHEN a.FieldName = 'AreYouMarried' AND c.AreYouMarried = a.AlertOptionValue THEN 1 
            ELSE 0 
        END AS AreYouMarriedAlert,
        CASE 
            WHEN a.FieldName = 'Gender' AND c.Gender = a.AlertOptionValue THEN 1 
            ELSE 0 
        END AS GenderAlter
    FROM 
        Table_LKP_AlertMastInfo a 
    WHERE 
        a.DistrictID = c.DistrictID
) a
GROUP BY c.CandidateId
HAVING SUM(a.AreYouMarriedAlert + a.GenderAlter) > 0 

结果:

【讨论】:

请不要传递静态值 a.FieldName = 'AreYouMarried' 和 a.FieldName = 'Gender' 。我有 100 个新领域要管理。 @Pratik Bhavsar 我认为光标对动态有帮助? @mohdmazharkhan 不确定,我对游标不太熟悉【参考方案3】:

我假设有 100 个字段,您有一组警报,这些警报是值的组合。此外,我假设您可以始终以正确的顺序拥有一个选择列表。所以

select candidateid,
       AreyouMarried || '|' || Gender all_responses_in_one_string
from ....

是可能的。所以上面会返回

candidateid  all_responses_in_one_string
can001       Yes|Female
can002       No|Female

所以现在您的警报可以是连接字符串的正则表达式。您的提醒是基于您匹配的数量。

【讨论】:

【参考方案4】:

这是一种简单的方法:

SELECT subq.*
FROM
(SELECT CandidateId,
        (SELECT COUNT(*)
         FROM Table_LKP_AlertMastInfo ami
         WHERE ami.DistrictID = ri.DistrictID
           AND ami.FieldName ='AreYouMarried'
           AND ami.AlertOptionValue = ri.AreYouMarried) +
        (SELECT COUNT(*)
         FROM Table_LKP_AlertMastInfo ami
         WHERE ami.DistrictID = ri.DistrictID
           AND ami.FieldName ='Gender'
           AND ami.AlertOptionValue = ri.Gender) AS [count]
 FROM Table_RegistrationInfo ri) subq
WHERE subq.[count] > 0;

见SQL Fiddle demo。

【讨论】:

嗨,请不要传递静态值 ami.FieldName ='AreYouMarried' 和 ami.FieldName ='Gender' 。我有 100 个新领域要管理,它应该是动态的。 @史蒂夫钱伯斯【参考方案5】:

我不确定这是否可以完全使用 SQL 完成。如果您使用的是 ADO.NET 等后端技术,则可以将结果存储在 Datatables 中。遍历列名并进行比较。

动态 SQL 可用于使 Table_LKP_AlertMastInfo 看起来像 Table_RegistrationInfo。 该脚本可以在存储过程中使用,并且可以在数据表中检索结果。

DECLARE @SQL NVARCHAR(MAX)

DECLARE @PivotFieldNameList nvarchar(MAX)

SET @SQL = ''
SET @PivotFieldNameList = ''
SELECT @PivotFieldNameList = @PivotFieldNameList + FieldName + ', '
FROM (SELECT DISTINCT FieldName FROM Table_LKP_AlertMastInfo) S

SET @PivotFieldNameList = SUBSTRING(@PivotFieldNameList, 1, LEN(@PivotFieldNameList) - 1) 
--SELECT @PivotFieldNameList


SET @SQL = '  SELECT DistrictId, ' + @PivotFieldNameList + ' FROM 
 Table_LKP_AlertMastInfo 
 PIVOT
 (   MAX(AlertOptionValue) 
    FOR FieldName IN (' + @PivotFieldNameList + '
  ) ) AS p  '
PRINT @SQL
EXEC(@SQL)

上面的查询结果如下

DistrictId  AreYouMarried   Gender
 71         Yes             Female
 72         Yes             NULL

如果您从 Table_RegistrationInfo 中获取结果到另一个 Datatable 中,则两者都可以用于比较。

【讨论】:

【参考方案6】:

未经测试,但这应该可以解决问题:

SELECT      CandidateId,
  ( CASE 
    WHEN AreYouMarried = "Yes" AND Gender = 'Female' THEN 2 
    WHEN Gender = 'Female' THEN 1
    WHEN AreYouMarried = "Yes" THEN 1
    ELSE 0 END 
  ) as CandidateValue

  FROM 
    (SELECT * FROM Table_LKP_AlertMastInfo) as Alert
  LEFT JOIN 
    (SELECT * FROM Table_RegistrationInfo) as Registration
  ON (Alert.DistrictID = Registration.DistrictID);

这应该会为您提供一个包含与条件计数匹配的候选 ID 的列表

【讨论】:

以上是关于SQL查询根据值和字段名从两个表中获取计数的主要内容,如果未能解决你的问题,请参考以下文章

SQL查询字段名

hibernate 直接通过表名,获取字段名及字段类型??

java如何获得数据库表中各字段的字段名

SQL中如何根据字段名查找该字段名存在于数据库的哪些表中?

SQL 查询某字段数据所在的表

THINKPHP如何获取一个表2个字段中相同的数据