在sql中检索帖子“喜欢”的有效方法是啥?
Posted
技术标签:
【中文标题】在sql中检索帖子“喜欢”的有效方法是啥?【英文标题】:What's the efficient way to retrieve "likes" of a post in sql?在sql中检索帖子“喜欢”的有效方法是什么? 【发布时间】:2021-07-17 20:22:58 【问题描述】:所以我有两个表,“videos”和“video_likes”。 “视频”表如下所示:
id | creator | url | likes
1 | 5 |https://... | 10
2 | 8 |https://... | 20
3 | 4 |https://... | 30
4 | 2 |https://... | 40
“video_likes”表如下所示:
id | video_id | like_user_id
1 | 2 | 8
2 | 2 | 5
3 | 4 | 2
如您所见,两者都是基本表格。好的,现在这是有趣的部分。当用户喜欢/不喜欢帖子时,我不会从“videos”表中增加和减少“喜欢”,而是将它们更新为与“video_likes”表中的行数相同,如下所示:
UPDATE videos SET likes = (SELECT COUNT(id) FROM video_likes WHERE video_id = '$video_id') WHERE id = '$video_id'
什么时候该拿号码了。喜欢的视频,我只是这样做:
SELECT likes FROM videos WHERE id = '$video_id' LIMIT 1
问题是每次用户喜欢或不喜欢视频时都会调用更新查询,我猜这可能非常昂贵。我有三个与此问题相关的问题:
1) 当“video_likes”表增长到一个很大的数字(比如一百万或十亿)时是否存在性能问题?
2) 更新计数时sql会锁表吗?如果是,新插入(用户在更新期间喜欢该帖子)会失败吗?如果有,如何预防?
3) 达到相同结果的最快和最有效的方法是什么?我不想增加或减少 likes 字段,因为这只是一种非规范化,实际喜欢计数可能存在不一致。这样做的正确方法是什么? 这些是过去几天一直困扰着我的几个问题。希望你能回答。问候。
【问题讨论】:
你的主要问题是*sql注入 我确实采取了一些措施来防止它们。只是没有包括,因为它不是我的问题的一部分。 【参考方案1】:我推荐
不要重新计算;那只会越来越慢。 在您将INSERT
添加到 Likes 表的同时增加计数器。
当您忙到每 秒 有数百次写入(插入、更新)时,请将类似计数器拆分为并行表(“垂直分区”)。这将有助于避免在增加单个视频喜欢计数时由于行锁(不是表锁)与对该表的其他访问发生冲突。
SELECT likes FROM videos WHERE id = '$video_id' LIMIT 1
没有意义——videos
表中的视频是否不止一行?为什么?如果是这样,你想要哪一个 (limit 1
)?
您是否还想要一个“不喜欢”计数器?或者你会简单地“减量”。考虑一下。
video_likes
不需要id
。相反,PRIMARY KEY(video_id, user_id)
。这将让您防止用户反复增加计数。 (但是,这需要在进行增量之前进行检查。)
等
不喜欢
如果“不喜欢”不是一个功能,但“不喜欢”是,我建议实现“不喜欢”类似
START TRANSACTION;
DELETE FROM video_likes WHERE ...;
UPDATE videos SET like_ct = like_ct - 1 WHERE ...;
COMMIT;
这样,两个“喜欢”机制将完美同步。这在某种程度上是“Like”代码的镜像。
限制 1
想想LIMIT
只是为了控制你得到多少输出。
LIMIT 1
不会改变查询所需的时间。
当查询必须排序(ORDER BY
)来决定哪个是第一个/最后一个/什么,那么它已经做了很多工作; LIMIT
只是减少了传递的行数。
另一方面,当INDEX
可用于ORDER BY
时,排序可能会消失。因此,LIMIT
控制传递的行数。
AUTO_INCREMENT 与否
一个表必须有一个PRIMARY KEY
。
如果您没有明确指定 PK,则会为您生成一个。 (不建议。)
“自然”PK 是自然发生的。例如,国家/地区表可以(应该)使用标准的 2 字母“国家/地区代码”——US、FR、IN、RU、CN、CH、IT 等。
id INT UNSIGNED NOT NULL AUTO_INCREMENT
对于没有“自然”PK 的表很有用。或者自然 PK 是一个长字符串。
在那个 4 字节 id 和 2 字节国家代码的示例中,您需要两个索引:
PRIMARY KEY(id), INDEX(country_code)
对一:
PRIMARY KEY(country_code)
id
的表更大。 (虽然在 this 示例中没有足够大,这并不重要。)
在“多:多”的情况下,例如您的 video_likes
,id
会影响性能。我讨论了here。
【讨论】:
感谢您的详细解释。我使用'LIMIT 1'的原因是因为认为如果我们要限制行数,sql select会更快(如果我错了,请纠正我,我不是sql专家:D) . “垂直分区”也是新事物..将对此进行研究。不,没有不喜欢的计数器。我所说的“不喜欢”只是撤消“喜欢”的动作,因此递减将是一个更好的选择。但是递增/递减会导致两个表中的不一致吗?无论如何,再次感谢您的详细解释! 我还有一个问题是,为每个表添加自动增量主键不是一个好习惯吗?以上是关于在sql中检索帖子“喜欢”的有效方法是啥?的主要内容,如果未能解决你的问题,请参考以下文章
在不对所有记录执行循环的情况下从数据库中检索特定数据的最有效方法是啥?