在sql中检索帖子“喜欢”的有效方法是啥？

Posted 2023-04-14

技术标签:

【中文标题】在sql中检索帖子“喜欢”的有效方法是啥？【英文标题】：What's the efficient way to retrieve "likes" of a post in sql?在sql中检索帖子“喜欢”的有效方法是什么？ 【发布时间】：2021-07-17 20:22:58 【问题描述】：

所以我有两个表，“videos”和“video_likes”。 “视频”表如下所示：

id | creator | url        | likes
1  |  5      |https://... |  10
2  |  8      |https://... |  20
3  |  4      |https://... |  30
4  |  2      |https://... |  40

“video_likes”表如下所示：

id | video_id | like_user_id
1  |  2       |   8
2  |  2       |   5
3  |  4       |   2

如您所见，两者都是基本表格。好的，现在这是有趣的部分。当用户喜欢/不喜欢帖子时，我不会从“videos”表中增加和减少“喜欢”，而是将它们更新为与“video_likes”表中的行数相同，如下所示：

UPDATE videos SET likes = (SELECT COUNT(id) FROM video_likes WHERE video_id = '$video_id') WHERE id = '$video_id'

什么时候该拿号码了。喜欢的视频，我只是这样做：

SELECT likes FROM videos WHERE id = '$video_id' LIMIT 1

问题是每次用户喜欢或不喜欢视频时都会调用更新查询，我猜这可能非常昂贵。我有三个与此问题相关的问题：

1) 当“video_likes”表增长到一个很大的数字（比如一百万或十亿）时是否存在性能问题？

2) 更新计数时sql会锁表吗？如果是，新插入（用户在更新期间喜欢该帖子）会失败吗？如果有，如何预防？

3) 达到相同结果的最快和最有效的方法是什么？我不想增加或减少 likes 字段，因为这只是一种非规范化，实际喜欢计数可能存在不一致。这样做的正确方法是什么？这些是过去几天一直困扰着我的几个问题。希望你能回答。问候。

【问题讨论】：

你的主要问题是*sql注入我确实采取了一些措施来防止它们。只是没有包括，因为它不是我的问题的一部分。 【参考方案1】：

我推荐

不要重新计算；那只会越来越慢。在您将INSERT 添加到 Likes 表的同时增加计数器。当您忙到每秒有数百次写入（插入、更新）时，请将类似计数器拆分为并行表（“垂直分区”）。这将有助于避免在增加单个视频喜欢计数时由于行锁（不是表锁）与对该表的其他访问发生冲突。 SELECT likes FROM videos WHERE id = '$video_id' LIMIT 1 没有意义——videos 表中的视频是否不止一行？为什么？如果是这样，你想要哪一个 (limit 1)？您是否还想要一个“不喜欢”计数器？或者你会简单地“减量”。考虑一下。 video_likes 不需要id。相反，PRIMARY KEY(video_id, user_id)。这将让您防止用户反复增加计数。（但是，这需要在进行增量之前进行检查。）等

不喜欢

如果“不喜欢”不是一个功能，但“不喜欢”是，我建议实现“不喜欢”类似

START TRANSACTION;
DELETE FROM video_likes WHERE ...;
UPDATE videos SET like_ct = like_ct - 1 WHERE ...;
COMMIT;

这样，两个“喜欢”机制将完美同步。这在某种程度上是“Like”代码的镜像。

限制 1

想想LIMIT 只是为了控制你得到多少输出。

当只有一行时，LIMIT 1 不会改变查询所需的时间。当查询必须排序（ORDER BY）来决定哪个是第一个/最后一个/什么，那么它已经做了很多工作； LIMIT 只是减少了传递的行数。另一方面，当INDEX 可用于ORDER BY 时，排序可能会消失。因此，LIMIT 控制传递的行数。

AUTO_INCREMENT 与否

一个表必须有一个PRIMARY KEY。如果您没有明确指定 PK，则会为您生成一个。（不建议。） “自然”PK 是自然发生的。例如，国家/地区表可以（应该）使用标准的 2 字母“国家/地区代码”——US、FR、IN、RU、CN、CH、IT 等。 id INT UNSIGNED NOT NULL AUTO_INCREMENT 对于没有“自然”PK 的表很有用。或者自然 PK 是一个长字符串。

在那个 4 字节 id 和 2 字节国家代码的示例中，您需要两个索引：

PRIMARY KEY(id), INDEX(country_code)

对一：

PRIMARY KEY(country_code)

id 的表更大。（虽然在 this 示例中没有足够大，这并不重要。）

在“多：多”的情况下，例如您的 video_likes，id 会影响性能。我讨论了here。

【讨论】：

感谢您的详细解释。我使用'LIMIT 1'的原因是因为认为如果我们要限制行数，sql select会更快（如果我错了，请纠正我，我不是sql专家：D） . “垂直分区”也是新事物..将对此进行研究。不，没有不喜欢的计数器。我所说的“不喜欢”只是撤消“喜欢”的动作，因此递减将是一个更好的选择。但是递增/递减会导致两个表中的不一致吗？无论如何，再次感谢您的详细解释！我还有一个问题是，为每个表添加自动增量主键不是一个好习惯吗？

以上是关于在sql中检索帖子“喜欢”的有效方法是啥？的主要内容，如果未能解决你的问题，请参考以下文章