KDD Top10 论文：这些经典论文都在工业界有落地

Posted 2023-02-16 Datawhale

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了KDD Top10 论文：这些经典论文都在工业界有落地相关的知识，希望对你有一定的参考价值。

本文将介绍KDD会议历年引用和落地性比较强的10篇论文，这些经典论文都在工业界有落地，非常值得学习。

XGBoost: A Scalable Tree Boosting System

Tianqi Chen, Carlos Guestrin

论文提出命名为XGBoost 的可扩展端到端树提升系统，它被Kaggle和工业界广泛使用。 XGBoost使用稀疏感知算法和用于近似树进行学习。XGBoost提供有关缓存访问模式、数据压缩和分片的工程实现。

推荐指数：⭐️⭐️⭐️⭐️⭐️
落地指数：⭐️⭐️⭐️⭐️⭐️
开源地址：https://github.com/dmlc/xgboost

DeepWalk: online learning of social representations

Bryan Perozzi, Rami Al-Rfou, Steven Skiena

DeepWalk是一种学习网络中顶点嵌入表示的方法，是语言建模和无监督特征学习从单词序列到图形的最新进展。DeepWalk使用随机游走中获得的局部信息，通过将游走路径视为句子，并从中学习潜在表示。

推荐指数：⭐️⭐️⭐️⭐️⭐️
落地指数：⭐️⭐️⭐️⭐️⭐️
开源地址：https://github.com/phanein/deepwalk

node2vec: Scalable Feature Learning for Networks

Aditya Grover, Jure Leskovec

node2vec是用于学习网络中节点的连续特征表示的算法框架。node2vec学习了节点到低维特征空间的映射，最大化了保留节点网络邻域的可能性。与DeepWalk相比node2vec设计了一个有偏随机游走程序。

推荐指数：⭐️⭐️⭐️⭐️
落地指数：⭐️⭐️⭐️⭐️⭐️
开源地址：https://github.com/aditya-grover/node2vec

"Why Should I Trust You?": Explaining the Predictions of Any Classifier

Marco Tulio Ribeiro, Sameer Singh, Carlos Guestrin

LIME是一种新颖的解释技术，可解释任何分类器的预测过程。 LIME可以数据呈现具有代表性的个体，可以用于解释机器学习、深度学习模型。

推荐指数：⭐️⭐️⭐️
落地指数：⭐️⭐️⭐️⭐️
开源地址：https://github.com/marcotcr/lime

Structural Deep Network Embedding

Daixin Wang, Peng Cui, Wenwu Zhu

SDNE是一个半监督的深度模型，它具有多层非线性函数，从而能够捕获高度非线性的网络结构。 SDNE在多标签分类、链路预测和可视化这三个应用中取得了实质性进展。

推荐指数：⭐️⭐️⭐️⭐️
落地指数：⭐️⭐️⭐️
开源地址：https://github.com/suanrong/SDNE

Graph Convolutional Neural Networks for Web-Scale Recommender Systems

Rex Ying, Ruining He, Kaifeng Chen, Pong Eksombatchai, William L. Hamilton, Jure Leskovec

论文开发了数据高效的图卷积网络 (GCN) 算法，该算法结合了随机游走和图卷积来生成包含图结构和节点特征信息的节点嵌入。

推荐指数：⭐️⭐️⭐️⭐️⭐️
落地指数：⭐️⭐️⭐️⭐️⭐️

Optuna: A Next-generation Hyperparameter Optimization Framework

Takuya Akiba, Shotaro Sano, Toshihiko Yanase, Takeru Ohta, Masanori Koyama

Optuna是一个开源的优化框架，允许用户动态构建参数搜索和修剪策略。

推荐指数：⭐️⭐️⭐️⭐️⭐️
落地指数：⭐️⭐️⭐️⭐️
开源地址：https://github.com/pfnet/optuna/

Deep Interest Network for Click-Through Rate Prediction

Guorui Zhou, Xiaoqiang Zhu, Chenru Song, Ying Fan, Han Zhu, Xiao Ma, Yanghui Yan, Junqi Jin, Han Li, Kun Gai

论文提出了一种新颖的模型：深度兴趣网络 (DIN) ，可以以自适应地从关于某个广告的历史行为中学习用户兴趣的表示，提高了模型的表达能力。

推荐指数：⭐️⭐️⭐️⭐️
落地指数：⭐️⭐️⭐️
开源地址：https://github.com/zhougr1993/DeepInterestNetwork

Anomaly Detection with Robust Deep Autoencoders

Chong Zhou, Randy C. Paffenroth

论文对深度自动编码器的新颖扩展，它保持深度自动编码器发现高质量、非线性特征的能力，而且还可以在不访问任何干净训练数据的情况下消除异常值和噪声。

推荐指数：⭐️⭐️⭐️
落地指数：⭐️⭐️⭐️⭐️
开源地址：https://github.com/zc8340311/RobustAutoencoder

struc2vec: Learning Node Representations from Structural Identity

Leonardo F.R. Ribeiro, Pedro H.P. Saverese, Daniel R. Figueiredo

struc2vec是一种新颖且灵活的框架，用于学习节点结构身份的潜在表示。 struc2vec使用层级来度量不同尺度的节点相似度，并构建多层图来编码结构相似度并为节点生成结构上下文。

推荐指数：⭐️⭐️⭐️
落地指数：⭐️⭐️⭐️
开源地址：https://github.com/leoribeiro/struc2vec

Learning time-series shapelets

Josif Grabocka, Nicolas Schilling, Martin Wistuba, Lars Schmidt-Thieme

Shapelets可以提取时间序列的中具有类别判别性的子序列。 Shapelet首先会抽取时序序列中的片段，然后筛选其中的有效片段。

推荐指数：⭐️⭐️
落地指数：⭐️⭐️⭐️
开源地址：https://github.com/benibaeumle/Learning-Shapelets

整理不易，点赞三连↓

以上是关于KDD Top10 论文：这些经典论文都在工业界有落地的主要内容，如果未能解决你的问题，请参考以下文章