NLP 实战(11): CSDN Daily,兼谈技术写作的问题
Posted 幻灰龙
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了NLP 实战(11): CSDN Daily,兼谈技术写作的问题相关的知识,希望对你有一定的参考价值。
CSDN 极客日报社区 实验并推荐了一组以内容结构和质量为主的榜单,包含了这些不同的频道:
频道 | 相关链接 |
---|---|
铁粉增长 | CSDN铁粉介绍以及说明 |
每天值得看 | CSDN每天值得看–2022-05-20 |
每天分享能手 | CSDN 活动: 奖励每天的分享小能手 |
每天最佳新人 | CSDN 活动: 奖励每天最佳新人 |
一周精选 | 如何在 CSDN 获得直接奖励 - 你也可以! |
月度精选 | CSDN 创作者之夜 |
一周学习榜 | 月答题挑战 |
2022/05/20
CSDN 社区功能更新:
- CSDN 社区评论区打赏支持私信发送给被打赏的评论用户。如果你建立了社区,你也可以灵活使用该功能。
Need:
CSDN 有很多不同的榜单,很多榜单以交互数据排序为主。但是我们知道交互数据好和内容好之间是有相关性,但不完全是因果关系。因此,我们设计了以内容结构和质量为主要衡量因子的数据推荐管道。
Approach:
以“每天值得看”为例,定义好以内容质量为主的目标,在算法方面:
- 热榜以交互数据为主,我们用热榜的算法直接作为初始的召回计算
- 过滤博文质量分,要求大于80分
- 建立新老技术分类器,过滤老技术
- 建立机器分级分类器(实验),配置初/中/高比例
- 深度使用博文标签分类得分,让分领域博文有高度的领域相关性
- 根据领域的新/老,做配比,压缩老技术数据,增加新鲜技术数据配比
在工程方面,有如下的优势
- 基于 CSDN社区云 的社区能力,支持直接给上榜用户在评论区打赏,打赏是一个抛砖引玉的过程,我们直接和博主在留言区交流,共同探讨每一篇博客是否能改进,有什么好的改进方法,有什么值得写的技术主题。写是为了更好的思考,发生真正的交流,而不是水评。
- 通过快速的迭代,持续的更新实验,能比较快地验证哪些是有效的策略,哪些是无效的做法,哪些算法起到了真正的作用,哪些算法的精度和覆盖度不足。
Benefit:
用户的获益:
- 有很多博主在CSDN 每天值得看上面获得了意外的上榜,留言表示开心。当博主写了有质量的博文,被算法识别出来上榜,对博主来说是一个很好的鼓励。
- 我们的运营和算法工程师也会对上榜并且留言的博主直接打赏奖励,这是一个既鼓励博主创作,又有钱的榜,我们导向就是:“写结构良好的,内容质量好的博文”,我们希望好的导向鼓励更多博主关注内容本身的价值。
- 每天值得看领域榜,也会被随机推送到 @CSDN每天值得读 ,获得更多的推荐。
Competitors:
优质内容的竞争者不是别人,就是写作者自己,博主们逐渐建立起优质博文的意识,算法和推荐导向形成良性循环,才能在内容质量上获得共赢。
在今天这个知识爆炸的时代,信息不是太少,而是太多。人们不再有耐心写深度的优质的好文,追求短平快,甚至粗制滥造。早期技术启蒙的时代,技术写作者会追求技术的深入浅出,庖丁解牛,对新鲜技术保持敏感,持续跟进最新的技术。然而现在的信息变多,如何用中文写好技术却变得稀缺。一些典型的问题是
- 不重视技术文章的基本排版,包括
随意使用火星文,甚至连标题和目录都是表情包图标,我相信他们提交计算机作业文档给他们的计算机老师的时候不敢这样。实际上这降低了文章的品质,降低了文章的信噪比。随意使用各种表情包,好像写一段文字不发一个“囧”字,这段文字就没有感情是的。这和即时聊天工具不无关系,人们在即时聊天工具里大量使用了短文本交流,以及大量使用了表情包,以至于在写技术博文的时候也带有这种习惯。总结出来就是好像不写一个“囧”字,文章就没句号似的。实际上这降低了文章的品质,降低了文章的信噪比。开头和结尾反复给自己打公告,介绍自己的各种头衔。当一个读者来到了一个博客页面,开始读文章了,那就表示他对这篇博客感兴趣,这个时候开篇却是介绍这个博主是谁,这是一个很奇怪的逻辑。然后正文没读几段,文章结束,再次读到了这个博主是谁,有哪些头衔,而且里面还夹杂着很多表情符号和火星文。**实际上这降低了文章的品质,降低了文章的信噪比。**如果一个博文是好的,不用介绍其他人也会主动查看博客首页的作者信息,主动点击关注,而这样的关注才是博主的“铁粉”。开头反复放了大量的系列博客的目录。每次进入博文要把系列博客的目录过了后才能读到正文。不能说这降低了文章的品质,但降低了文章的信噪比。系列博文有一个目录页面即可,其他的博文加一个到系列目录的超链接即可,或者文章的标题是“XXX(i): xxx”,并且把博文放在一个专栏里即可。
- 不知道如何写技术博客
罗列代码,没有多少解说。有的文章没几个字,直接丢一堆代码上来。但是程序员连自己的代码都很多写完了不读,为什么他读你的博客的时候,没什么解释的情况下会看一大段十分通常不稀有的代码呢?技术文章讲解的时候,必要的代码是需要的,但是同时用列表、图示、伪代码来清晰地表达所要讲解的思路是常见的好的方法,是可以通过练习掌握的。没有一个清晰的分节层次。有的文章不需要分节,例如一整篇文章是一个论说观点的文章,只要把文章的分段划分清楚,有基本的总/分/总,把一个观点解释清楚,那么它就是一篇结构起码合理的文章。但是如果是一个介绍技术细节的文章,至少应该有一个清晰的层次,开头介绍下必要的背景和目标问题,中间分小节展开写,最后扣题小结一下。不考虑读者对领域的陌生,堆砌领域局部操作。技术领域分门别类太多了,每个人做的领域,另外一个人可能完全不熟。这种情况下会很多技术文章完全不考虑其他读者,但是他希望上榜,上榜就是所有人可见,所有人可见的情况下,应该考虑下一个问题:“其他读者对我这个领域可能是完全不熟的,他能看明白我在写的文章解决的问题是什么呢?他能从我解决领域问题的过程中理解和学习额到什么编程上的思维和能力呢?” ,有的文章看上去写的领域很高级,但是它既不是写底层的原理,有很好的计算机思维和编程上的普适性,也不能针对领域内的读者把领域内的操作说明解释的不错。这就跟一个程序员好像什么技术都会,但是给一个具体的任务,写出来的代码漏洞百出一样,是不靠谱的,质量不高的一样。- 更多的case可以持续更新…
Delivery:
CSDN 每天值得读,构建了以下的多渠道分发,初步形成良性的循环:
- 极客日报社区 的持续构建,综合利用社区的发帖/评论/打赏/触达机制来建立循环。
- @CSDN每天值得读微博 优质的技术应该推荐给更多人。
- CSDN 百度小程序榜单使用每天值得看数据
–end–
以上是关于NLP 实战(11): CSDN Daily,兼谈技术写作的问题的主要内容,如果未能解决你的问题,请参考以下文章