论文链接:https://arxiv.org/pdf/2010.11929.pdf 简介:谷歌大脑的研究者受到 NLP 领域中 Transformer 缩放成功的启发,尝试将标准 Transformer 直接应用于图像,并尽可能减少修改。他们提出了一个新的 Vision Transformer(ViT)模型,并在多个图像识别基准上实现了接近甚至优于当前 SOTA 方法的性能。 论文 9:Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer
论文链接:https://arxiv.org/pdf/1910.10683v3.pdf 简介:谷歌研究者通过引入一个将所有基于文本的语言问题转化为文本到文本格式的统一框架,对自然语言处理(NLP)的迁移学习方法进行了探索。他们提出了新的 Text-to-Text Transfer Transformer (T5) 模型,参数量最高达到了 110 亿。T5 模型在涵盖摘要生成、问答以及文本分类等 17 项 NLP 任务上实现了新 SOTA。此外,研究者开源了新的 Colossal Clean Crawled Corpus (C4) 语料库,内含从网上爬取的数百个千兆字节干净英文文本。 论文 10:Hierarchical Multi-Scale Attention for Semantic Segmentation
项目地址:https://github.com/huggingface/transformers 简介:transformers 库由 Hugging Face 团队创建,旨在将这些 NLP 进展开放给更广泛的机器学习社区。该库包含多个精心设计的 SOTA Transformer 架构,并使用统一的 API。transformers 库汇集了社区构建的多个预训练模型,并向社区开放。目前,该库的 star 量高达 39.3k,transformers 论文获得了 EMNLP 2020 最佳 demo 论文奖。 PyTorch Image Models
项目地址:https://github.com/rwightman/pytorch-image-models 简介:pytorch-image-models 库由热衷于构建 ML 和 AI 系统的加拿大人 Ross Wightman 创建,包含了图像模型、层、实用工具、优化器、调度器、数据加载器 / 扩增、推理训练 / 验证脚本等资源。该库旨在将多种多样的 SOTA 模型整合起来,以复现 ImageNet 数据集上的训练结果。目前,该库的 star 量为 6.6k。 detectron2
项目地址:https://github.com/facebookresearch/detectron2 简介:Detectron2 是 Facebook AI Research 的新一代软件系统,旨在实现 SOTA 目标检测算法。该库在以前版本 Detectron 上进行重新编写,并包含了 maskrcnn-benchmark 库(已被弃用)的所有模型实现。目前,该库的 star 量高达 14.5k。 insightface
项目地址:https://github.com/deepinsight/insightface 简介:insightface 由 Deep Insight 团队创建,是一个开源的 2D 和 3D 深度人脸分析工具箱,主要基于 MXNet 框架构建。该库的主分支(master branch)适用于 MXNet 1.2-1.6 版本以及 Python 3.x 版本。目前,该库的 star 量为 8.4k。 imgclsmob
项目地址:https://github.com/osmr/imgclsmob 简介:imgclsmob 库由高级软件工程师 Oleg Sémery 创建,主要研究计算机视觉任务的卷积网络。该库包含用于训练、评估和转换的各种分类、分割、检测和姿态估计模型和脚本的实现或复现。目前,该库的 star 量为 2k。 DarkNet
项目地址:https://github.com/pjreddie/darknet 简介:darknet 库由专注于计算机视觉研究的 Joseph Redmon 创建,是一个基于 C 语言和 CUDA 编写的开源神经网络框架。它的安装快速且方便,并且支持 CPU 和 GPU 计算。目前,该库的 star 量高达 19.8k。 PyTorchGAN
项目地址:https://github.com/eriklindernoren/PyTorch-GAN 简介:PyTorchGAN 库由 Apple 公司的 ML 工程师 Erik Linder-Norén 创建,收集了论文中各种生成对抗网络(GAN)的 PyTorch 实现。创建者认为模型架构并不总是能够反映论文中提出的观点,所以他聚焦于获取论文的核心理念而不只是确保每个层配置都正确。不过遗憾的是,由于创建者没有时间维护,该库已经过时了。目前,该库的 star 量为 8.4k。 MMDetection