NLP 实战(10): CSDN 领域榜标签分组更新
Posted 幻灰龙
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了NLP 实战(10): CSDN 领域榜标签分组更新相关的知识,希望对你有一定的参考价值。
更新2022 04/12
- 暂时保留php
- 云原生/软件工程/后端 排序在前
CSDN 全站数据在2021年完成了标签体系的统一。在这个基础上:
- 用户可以在UC中心选择感兴趣的标签
- 博客/问答使用统一标签标记数据并筛选
- 博客首页有基于统一标签的导航(blog.csdn.net/nav)
- 动态(blink)和社区(community)数据也在逐步完成数据的机器标签化
- 信息流(领域榜/推荐流)使用统一标签推荐数据
- 下载内容也逐渐融入统一标签
2022开年,我们持续在改进数据质量,领域榜的数据质量改进是其中之一。
- 针对用户反馈的标题党和软文问题,现在领域榜也和综合热榜一样对标题党和软文进行识别和过滤。
- App这边也将领域榜和综合热榜并列展示,让App的热榜真正成为一个具有多样性的满足多种需求的榜单。同时App榜单和PC也保持一致的风格。
进一步地,我们希望对领域榜的分组做改进和调整。主要包括
- 修订已有的领域榜所包含的二级标签
- 新增缺失的重要领域方向一级分组
下面是领域榜修订分组的草稿
领域 | 统一标签 | 修订意见 |
---|---|---|
c/c++ | “c++”,“c语言”,面向对象,STL,多态, | 完善 |
java | “java”,“jar”,“java-ee”,“eclipse”,“tomcat”,“hibernate”,“spring”,“maven”,“struts”,“intellij-idea”,“myeclipse” “spring boot” “spring cloud” | 完善 |
javascript | “javascript”,“juqery”,“ajax”,“node.js”,“vue.js”,“angular.js”,“react.js”,“es6” | 修改为“前端” |
php | “php”,“symfony”,“composer”,“lavarel”,“phpstorm”,“swoole” | 是否合并到后端 |
python | “python”,“django”,“virtualenv”,“tornado”,“flask”,“pygame” “pycharm” | |
人工智能 | “opencv”,“数据挖掘”,“语音识别”,“计算机视觉”,“目标检测”,“机器学习”,“人工智能”,“caffe”,“深度学习”,“神经网络”,“自然语言处理”,“sklearn”,“cnn”,“mllib”,“word2vec”,“tensorflow”,“目标跟踪”,“keras”,“知识图谱”,“rnn”,“lstm”,“自动驾驶”,“dnn”,“生成对抗网络”,“mxnet”,“pytorch”,“机器翻译”,“语言模型”,“oneflow”,“mlnet”,“paddlepaddle”,“gru”,“mnn”,“boosting”,“transformer”,“xlnet”,“bert”,“openvino”,“边缘计算”,“超分辨率重建”,“智慧城市”,“视觉检测”,“图像处理”,“nlp”,“数据分析”,“scikit-learn”,“聚类”,“集成学习”,“迁移学习”,“分类”,“回归”,“中文分词” | 完善 |
区块链 | “虚拟货币”,“以太坊”,“区块链”,“比特币”,“智能合约”,“信任链”,“libra”,“数字货币”,“去中心化”,“分布式账本”,“共识算法”,“同态加密”,“零知识证明” | 完善 |
大数据 | “数据库”,“oracle”,“sql”,“database”,“mysql”,“postgresql”,“mongodb”,“mariadb”,“sqlite”, “时序数据库”,“tdengine”,“涛思数据”,“memcached”,“memcache”,“redis”“大数据”,“数据仓库”,“big data”, “nosql”, “hbase”,“hadoop”,“hive”, “storm”,“zookeeper”,“spark”,“flume”,“elasticsearch”,“rabbitmq”,“kafka”,“eureka”,“etcd”,“flink”,“consul”,“talkingdata”,“kylin”,“hdfs”,“mapreduce”,“cloudera”,“ambari”,“sqoop”,“odps”,“etl” | 完善 |
移动开发 | “android”,“ios”,“xcode”,“xamarin”,“reactnative”,“flutter”,“objective-c”,“swift”,“小程序”,“react native”,“android studio”,“web app”,“kotlin”,“swiftui” “cocoapods” “rxswift” “phonegap” “rxjava” “android jetpack” “webview” “微信小程序” “百度小程序” | 完善 |
嵌入式 | “arm”,“单片机”,“stm32”,“51单片机”,“proteus”,“mcu”,“物联网”,“嵌入式硬件”,“iot”,“嵌入式实时数据库”,“rtdbs” | |
开发工具 | “github”,“git”,“svn”,“ide”,“ci”,“pycharm”,“emacs”,“vim”,“vscode”,“jupyter”,“myeclipse”,“idea”,“phpstorm”,“visualstudio”,“visual studio code”,“sublime text”,“intellij idea”,“webstorm”,“编辑器”,“visual studio”,“eclipse” “postman” “android studio” “xcode” | 完善 |
数据结构与算法 | “算法”,“数据结构”,“线性回归”,“链表”,“贪心算法”,“动态规划”,“排序算法”,“kmeans”,“leetcode”,“决策树”,“最小二乘法”,“b树”,“模拟退火算法”,“散列表”,“随机森林”,“支持向量机”,“启发式算法”,“逻辑回归”,“推荐算法”,“宽度优先”,“广度优先”,“深度优先”,“迭代加深”,“图搜索算法”,“爬山算法”,“近邻算法”,“均值算法”,“预编码算法”,“霍夫曼树”,“剪枝”,“哈希算法”,“list” | 完善 |
测试 | “单元测试”,“elenium”,“ira”,“测试工具”,“压力测试”,“测试用例”,“b测试”,“ostman”,“集成测试”,“模块测试”,“测试覆盖率”,“安全性测试”,“威胁分析”,“可用性测试”,“功能测试” | 完善 |
游戏 | “cocos2d”,“动画”,“ogre”,“unity”,“pygame”,“游戏引擎”,“ar”,“3dsmax”,“maya”,“贴图”,“uv”,“vr”,“ue4”,“houdini”,“着色器”,“材质”,“技术美术”,“blender”,“spine”,“图形渲染”,“虚幻”,“ue5”,“godot”,“cryengine”,“lumberyard”,“mr”,“xr”,“cinema4d”,“zbrush”,“3dcoat”,“topogun”,“rizomuv”,“substance designer”,“substance painter”,“quixel”,“数字雕刻”,“重拓扑”,“骨骼绑定”,“关卡设计”,“游戏程序”,“游戏美术”,“游戏策划”,“cascadeur” | 完善 |
网络 | “http”,“p2p”,“udp”,“ssl”,“https”,“wireshark”,“websocket”,“网络安全”,“tcpdump”,“网络协议”,“tcp/ip”,“rpc”,“web安全” | 完善 |
运维 | “linux”,“nginx”,“docker”,“ubuntu”,“centos”,“服务器”,“负载均衡”,“运维”,“ssh”,“vagrant”,“容器”,“jenkins”,“devops”,“debian”,“fabric”,“自动化”,“kubernetes”,“系统架构”,“网络”,“运维开发”,“graylog”,“elk” | 完善 |
云原生 | “云原生”, “服务发现”, “微服务”, “paas”, “serverless”, “docker”, “devops”, “jenkins”,“eureka”, “kubernetes”, “kubelet”, “kind”, “kubeless”, “knative”, “service_mesh”, “isito”,“terraform”, “etcd”, “zookeeper”, “consul” | 新增 |
后端 | “后端”,“架构”,“分布式”,“中间件”,“spring”,“spring boot”,“spring cloud”,“tomcat”,“ribbon”,“node.js”,“golang”,“django”,“flask”,“ruby”,“ruby on rails”,“asp.net”,“scala”,“rust”,“restful”,“graphql”,“rabbitmq” | 新增 |
软件工程 | “软件工程”,需求分析",“结对编程”,“团队开发”,“scrum”,“sprint”,“个人开发”,“规格说明书”,“极限编程”,“敏捷流程”,“性能优化”,“TDD”,“代码复审”, “重构”, “源代码管理”, “代码规范”, “UML”, “用户体验”, “用户界面”, “交互设计”, “效能分析”, “软件构建”, “CMMI”, “软件需求”, “甘特图”, “流程图”, “代码覆盖率”, “bug”, “设计模式”, “设计规范”, “Agile”, “CI/CD”,“tfs”,“jira”,“issue管理” | 新增 |
PHP 是原来的分组,是否将PHP合并到“后端”分组里呢?这里做一个投票:
以上是关于NLP 实战(10): CSDN 领域榜标签分组更新的主要内容,如果未能解决你的问题,请参考以下文章