NLP 实战(10): CSDN 领域榜标签分组更新

Posted 幻灰龙

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了NLP 实战(10): CSDN 领域榜标签分组更新相关的知识,希望对你有一定的参考价值。

更新2022 04/12

  • 暂时保留php
  • 云原生/软件工程/后端 排序在前

CSDN 全站数据在2021年完成了标签体系的统一。在这个基础上:

  • 用户可以在UC中心选择感兴趣的标签
  • 博客/问答使用统一标签标记数据并筛选
  • 博客首页有基于统一标签的导航(blog.csdn.net/nav)
  • 动态(blink)和社区(community)数据也在逐步完成数据的机器标签化
  • 信息流(领域榜/推荐流)使用统一标签推荐数据
  • 下载内容也逐渐融入统一标签

2022开年,我们持续在改进数据质量,领域榜的数据质量改进是其中之一。

  • 针对用户反馈的标题党和软文问题,现在领域榜也和综合热榜一样对标题党和软文进行识别和过滤。
  • App这边也将领域榜和综合热榜并列展示,让App的热榜真正成为一个具有多样性的满足多种需求的榜单。同时App榜单和PC也保持一致的风格。

进一步地,我们希望对领域榜的分组做改进和调整。主要包括

  • 修订已有的领域榜所包含的二级标签
  • 新增缺失的重要领域方向一级分组

下面是领域榜修订分组的草稿

领域统一标签修订意见
c/c++“c++”,“c语言”,面向对象,STL,多态,完善
java“java”,“jar”,“java-ee”,“eclipse”,“tomcat”,“hibernate”,“spring”,“maven”,“struts”,“intellij-idea”,“myeclipse” “spring boot” “spring cloud”完善
javascript“javascript”,“juqery”,“ajax”,“node.js”,“vue.js”,“angular.js”,“react.js”,“es6”修改为“前端”
php“php”,“symfony”,“composer”,“lavarel”,“phpstorm”,“swoole”是否合并到后端
python“python”,“django”,“virtualenv”,“tornado”,“flask”,“pygame” “pycharm”
人工智能“opencv”,“数据挖掘”,“语音识别”,“计算机视觉”,“目标检测”,“机器学习”,“人工智能”,“caffe”,“深度学习”,“神经网络”,“自然语言处理”,“sklearn”,“cnn”,“mllib”,“word2vec”,“tensorflow”,“目标跟踪”,“keras”,“知识图谱”,“rnn”,“lstm”,“自动驾驶”,“dnn”,“生成对抗网络”,“mxnet”,“pytorch”,“机器翻译”,“语言模型”,“oneflow”,“mlnet”,“paddlepaddle”,“gru”,“mnn”,“boosting”,“transformer”,“xlnet”,“bert”,“openvino”,“边缘计算”,“超分辨率重建”,“智慧城市”,“视觉检测”,“图像处理”,“nlp”,“数据分析”,“scikit-learn”,“聚类”,“集成学习”,“迁移学习”,“分类”,“回归”,“中文分词”完善
区块链“虚拟货币”,“以太坊”,“区块链”,“比特币”,“智能合约”,“信任链”,“libra”,“数字货币”,“去中心化”,“分布式账本”,“共识算法”,“同态加密”,“零知识证明”完善
大数据“数据库”,“oracle”,“sql”,“database”,“mysql”,“postgresql”,“mongodb”,“mariadb”,“sqlite”, “时序数据库”,“tdengine”,“涛思数据”,“memcached”,“memcache”,“redis”“大数据”,“数据仓库”,“big data”, “nosql”, “hbase”,“hadoop”,“hive”, “storm”,“zookeeper”,“spark”,“flume”,“elasticsearch”,“rabbitmq”,“kafka”,“eureka”,“etcd”,“flink”,“consul”,“talkingdata”,“kylin”,“hdfs”,“mapreduce”,“cloudera”,“ambari”,“sqoop”,“odps”,“etl”完善
移动开发android”,“ios”,“xcode”,“xamarin”,“reactnative”,“flutter”,“objective-c”,“swift”,“小程序”,“react native”,“android studio”,“web app”,“kotlin”,“swiftui” “cocoapods” “rxswift” “phonegap” “rxjava” “android jetpack” “webview” “微信小程序” “百度小程序”完善
嵌入式“arm”,“单片机”,“stm32”,“51单片机”,“proteus”,“mcu”,“物联网”,“嵌入式硬件”,“iot”,“嵌入式实时数据库”,“rtdbs”
开发工具“github”,“git”,“svn”,“ide”,“ci”,“pycharm”,“emacs”,“vim”,“vscode”,“jupyter”,“myeclipse”,“idea”,“phpstorm”,“visualstudio”,“visual studio code”,“sublime text”,“intellij idea”,“webstorm”,“编辑器”,“visual studio”,“eclipse” “postman” “android studio” “xcode”完善
数据结构与算法“算法”,“数据结构”,“线性回归”,“链表”,“贪心算法”,“动态规划”,“排序算法”,“kmeans”,“leetcode”,“决策树”,“最小二乘法”,“b树”,“模拟退火算法”,“散列表”,“随机森林”,“支持向量机”,“启发式算法”,“逻辑回归”,“推荐算法”,“宽度优先”,“广度优先”,“深度优先”,“迭代加深”,“图搜索算法”,“爬山算法”,“近邻算法”,“均值算法”,“预编码算法”,“霍夫曼树”,“剪枝”,“哈希算法”,“list”完善
测试“单元测试”,“elenium”,“ira”,“测试工具”,“压力测试”,“测试用例”,“b测试”,“ostman”,“集成测试”,“模块测试”,“测试覆盖率”,“安全性测试”,“威胁分析”,“可用性测试”,“功能测试”完善
游戏“cocos2d”,“动画”,“ogre”,“unity”,“pygame”,“游戏引擎”,“ar”,“3dsmax”,“maya”,“贴图”,“uv”,“vr”,“ue4”,“houdini”,“着色器”,“材质”,“技术美术”,“blender”,“spine”,“图形渲染”,“虚幻”,“ue5”,“godot”,“cryengine”,“lumberyard”,“mr”,“xr”,“cinema4d”,“zbrush”,“3dcoat”,“topogun”,“rizomuv”,“substance designer”,“substance painter”,“quixel”,“数字雕刻”,“重拓扑”,“骨骼绑定”,“关卡设计”,“游戏程序”,“游戏美术”,“游戏策划”,“cascadeur”完善
网络“http”,“p2p”,“udp”,“ssl”,“https”,“wireshark”,“websocket”,“网络安全”,“tcpdump”,“网络协议”,“tcp/ip”,“rpc”,“web安全”完善
运维“linux”,“nginx”,“docker”,“ubuntu”,“centos”,“服务器”,“负载均衡”,“运维”,“ssh”,“vagrant”,“容器”,“jenkins”,“devops”,“debian”,“fabric”,“自动化”,“kubernetes”,“系统架构”,“网络”,“运维开发”,“graylog”,“elk”完善
云原生“云原生”, “服务发现”, “微服务”, “paas”, “serverless”, “docker”, “devops”, “jenkins”,“eureka”, “kubernetes”, “kubelet”, “kind”, “kubeless”, “knative”, “service_mesh”, “isito”,“terraform”, “etcd”, “zookeeper”, “consul”新增
后端“后端”,“架构”,“分布式”,“中间件”,“spring”,“spring boot”,“spring cloud”,“tomcat”,“ribbon”,“node.js”,“golang”,“django”,“flask”,“ruby”,“ruby on rails”,“asp.net”,“scala”,“rust”,“restful”,“graphql”,“rabbitmq”新增
软件工程“软件工程”,需求分析",“结对编程”,“团队开发”,“scrum”,“sprint”,“个人开发”,“规格说明书”,“极限编程”,“敏捷流程”,“性能优化”,“TDD”,“代码复审”, “重构”, “源代码管理”, “代码规范”, “UML”, “用户体验”, “用户界面”, “交互设计”, “效能分析”, “软件构建”, “CMMI”, “软件需求”, “甘特图”, “流程图”, “代码覆盖率”, “bug”, “设计模式”, “设计规范”, “Agile”, “CI/CD”,“tfs”,“jira”,“issue管理”新增

PHP 是原来的分组,是否将PHP合并到“后端”分组里呢?这里做一个投票:

以上是关于NLP 实战(10): CSDN 领域榜标签分组更新的主要内容,如果未能解决你的问题,请参考以下文章

NLP 实战 | 热榜算法更新

NLP 实战(12): AI小组2022半年小结

NLP 实战(12): AI小组2022半年小结

NLP 实战 | 热榜算法更新

BERT-多标签文本分类实战之二——BERT的地位与名词术语解释

美团获得小样本学习榜单FewCLUE第一!Prompt Learning+自训练实战