2021 年最佳开源软件榜单|InfoWorld
Posted GitHubDaily
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2021 年最佳开源软件榜单|InfoWorld相关的知识,希望对你有一定的参考价值。
公众号关注 “GitHubDaily”
大家好,我是小 G。
作为一家信息技术媒体公司,InfoWorld 成立于 1978 年,目前隶属于 IDG。
每年。InfoWorld 都会根据软件对开源界的贡献,以及在业界的影响力评选出当年的 “最佳开源软件” (BOSSIE),该奖项评选已经延续了十多年。
本次获奖的 29 个开源项目包括:软件开发、开发、云原生计算、机器学习等类型,下面我们一起来看看,有没有熟悉的面孔!
1、Svelte 和 SvelteKit在众多创新的、开源的、前端的 javascript 框架中,Svelte 及其全栈对应的 SvelteKit 可能是最有野心和远见的。
Svelte 一开始就通过采用编译时策略来颠覆现状,并以出色的性能、持续的发展和卓越的开发者体验向前迈进。
SvelteKit 现已进入公测阶段,它延续了 Svelte 的传统,通过采用最新的工具,并将部署到无服务器环境作为一项内置功能来实现飞跃。
2、Minikube地址:https://github.com/sveltejs/svelte
Minikube 是一个易于在本地运行 Kubernetes 的工具,可在你的笔记本电脑上的虚拟机内轻松创建单机版 Kubernetes 集群。便于尝试 Kubernetes 或使用 Kubernetes 日常开发。
3、Pixie地址:https://github.com/kubernetes/minikube
Pixie 是 Kubernetes 应用的可观察性工具,它可以查看集群的高级状态,如服务地图、集群资源和应用流量;还可以深入到更详细的视图,如 pod 状态、火焰图和单个 full-body 应用请求。
Pixie 使用 eBPF 自动收集遥测数据,它在集群本地收集、存储和查询所有的遥测数据,使用不到 5% 的集群 CPU。Pixie 的用例包括集群内的网络监控、基础设施健康、服务性能和数据库查询剖析。
4、FastAPI地址:https://github.com/pixie-io/pixie
FastAPI 是一个高性能 Web 框架,用于构建 API。主要特性:
快速:非常高的性能,与 NodeJS 和 Go 相当
快速编码:将功能开发速度提高约 200% 至 300%
更少的错误:减少约 40% 的人为错误
直观:强大的编辑器支持,自动补全无处不在,调试时间更少
简易:旨在易于使用和学习,减少阅读文档的时间。
简短:减少代码重复。
稳健:获取可用于生产环境的代码,具有自动交互式文档
基于标准:基于并完全兼容 API 的开放标准 OpenAPI 和 JSON Schema
5、Crystal地址:https://github.com/tiangolo/fastapi
作为一个提供具有 C 语言的速度和 Ruby 语言的表现力的编程语言的项目,Crystal 已经开发了好几年了。随着今年年初 Crystal 1.0 的发布,该语言现在已经足够稳定到可以用于一般工作负载。
Crystal 使用静态类型和 LLVM 编译器来实现高速度,并避免在运行时出现空引用等常见问题。Crystal 可以与现有的 C 代码接口,以进一步提高速度和便利性,它还可以使用编译时宏来扩展基础语言的语法。
6、Windows Terminal地址:https://github.com/crystal-lang/crystal
Windows Terminal 是一个全新的、流行的、功能强大的命令行终端工具。
包含很多来社区呼声很高的特性,例如:多 Tab 支持、富文本、多语言支持、可配置、主题和样式,支持 emoji 和基于 GPU 运算的文本渲染等等。同时该终端依然符合我们的目标和要求,以确保它保持快速、高效,并且不会消耗大量内存和电源。
7、OBS Studio地址:https://github.com/Microsoft/Terminal
OBS Studio 是一款用于实时流媒体和屏幕录制的软件,为高效捕获,合成,编码,记录和流传输视频内容而设计,支持所有流媒体平台。
高性能实时视频 / 音频捕获和混合。创建由多种来源组成的场景,包括窗口捕获、图像、文本、浏览器窗口、网络摄像头、捕获卡等。
设置无限数量的场景,用户可以通过自定义过渡无缝切换。
带有每个源滤波器的直观音频混合器,例如噪声门,噪声抑制和增益。全面控制 VST 插件支持。
强大且易于使用的配置选项。添加新源,复制现有源,并轻松调整其属性。
精简的设置面板使用户可以访问各种配置选项,以调整广播或录制的各个方面。
模块化的 “Dock” UI 允许用户完全根据需要重新排列布局。用户甚至可以将每个单独的 Dock 弹出到自己的窗口中。
8、Shotcut地址:https://github.com/obsproject/obs-studio
Shotcut 是一款跨平台的视频编辑工具,允许人们在应用效果和分层的同时,对音频和视频轨道进行所有的标准修正。Shotcut 有一个非常活跃的社区,并提供大量的操作视频和指导,以帮助新手和高级摄像师。
它可以在 Mac、Linux、BSD 和 Windows 上运行 -- 尽管是跨平台的,但与同类工具相比,它的界面很敏捷,使用起来也相对简单。
9、Weave GitOps Core地址:https://github.com/mltframework/shotcut
Weave GitOps 支持有效的 GitOps 工作流,以将应用程序持续交付到 Kubernetes 集群中。它基于领先的 GitOps 引擎 CNCF Flux。
10、Apache Solr地址:https://github.com/weaveworks/weave-gitops
Apache Solr 是基于 Lucene 的全文搜索服务器,也是最流行的企业级搜索引擎。Apache Lucene 是你所使用的大部分软件的搜索功能背后的基础搜索技术 -- 包括其他搜索引擎,如 Elasticsearch。
与 Elasticsearch 不同的是,Solr 放弃了它的开源许可,不过它仍然是免费的。Solr 是可集群的、可在云端部署的,并且强大到足以建立云端级的搜索服务。它甚至包括 LTR 算法,以帮助自动调整和加权结果。
11、MLflow地址:https://github.com/apache/solr
MLflow 由 Databricks 创建,并由 Linux 基金会托管,是一个 MLOps 平台,可以让人跟踪、管理和维护各种机器学习模型、实验及其部署。它为你提供了记录和查询实验(代码、数据、配置、结果)的工具,将数据科学代码打包成项目,并将这些项目链入工作流程。
12、Orange地址:https://github.com/mlflow/mlflow
Orange 旨在使将数据挖掘 "富有成效且有趣"。Orange 允许用户创建一个数据分析工作流程,执行各种机器学习和分析功能以及可视化。
与 R Studio 和 Jupyter 等程序化或文本工具相比,Orange 是非常直观的。你可以将小部件拖到画布上以加载文件,用模型分析数据并将结果可视化。
13、Flutter地址:https://github.com/biolab/orange3
Flutter 由 Google 的工程师团队打造,用于创建高性能、跨平台的移动应用。Flutter 针对当下以及未来的移动设备进行优化,专注于 android and ios 低延迟的输入和高帧率。
它可以给开发者提供简单、高效的方式来构建和部署跨平台、高性能移动应用;给用户提供漂亮、快速、jitter-free 的 app 体验。
14、Apache Superset地址:https://github.com/flutter
Apache Superset 是 Airbnb (知名在线房屋短租公司)开源的数据探查与可视化平台(曾用名 Panoramix、Caravel ),该工具在可视化、易用性和交互性上非常有特色,用户可以轻松对数据进行可视化分析。Apache Superset 也是一款企业级商业智能 Web 应用程序。
15、Presto地址:https://github.com/apache/superset
Presto 是一个开源的分布式 SQL 引擎,用于在线分析处理,在集群中运行。
Presto 可以查询各种各样的数据源,从文件到数据库,并将结果返回到许多商业智能和分析环境。更重要的是,Presto 允许查询数据所在的地方,包括 Hive、Cassandra、关系型数据库和专有数据存储。
一个 Presto 查询可以结合多个来源的数据。Facebook 使用 Presto 对几个内部数据存储进行互动查询,包括他们的 300PB 数据仓库。
16、Apache Arrow地址:https://github.com/prestodb/presto
Apache Arrow 为平面和分层数据定义了一种独立于语言的柱状内存格式,为现代 CPU 和 GPU 上的高效分析操作而组织。
Arrow 内存格式还支持零拷贝读取,以便在没有序列化开销的情况下进行闪电式的数据访问。Arrow 库可用于 C、C++、C#、Go、Java、JavaScript、Julia、MATLAB、Python、R、Ruby 和 Rust。
17、InterpretML地址:https://github.com/apache/arrow
InterpretML 是一个开源的 Explainable AI(XAI)包,其中包含了几个最先进的机器学习可解释性技术。
InterpretML 让你训练可解释的 glassbox 模型并解释黑盒系统。InterpretML 可帮助你了解模型的全局行为,或了解个别预测背后的原因。
在它的许多功能中,InterpretML 有一个来自 Microsoft Research 的 "glass box" 模型,称为 Explainable Boosting Machine,它支持用黑盒模型的近似值进行 post-hoc 解释的 Lime。
18、Lime地址:https://github.com/interpretml/interpret
Lime(local interpretable model-agnostic explanations 的简称)是一种 post-hoc 技术,通过扰动输入的特征并检查预测结果来解释任何机器学习分类器的预测。
Lime 能够解释任何具有两个或更多类的黑盒分类器,其同时适用于文本和图像领域。Lime 也被包含在 InterpretML 中。
19、Dask地址:https://github.com/marcotcr/lime
Dask 是一个用于并行计算的开源库,可以将 Python 包扩展到多台机器上。Dask 可以将数据和计算分布在多个 GPU 上,无论是在同一个系统中还是在一个多节点集群中。
Dask 与 Rapids cuDF、XGBoost 和 Rapids cuML 集成,用于 GPU 加速的数据分析和机器学习。它还与 NumPy、Pandas 和 Scikit-learn 集成,以并行化其工作流程
20、BlazingSQL地址:https://github.com/dask/dask
BlazingSQL 是一个基于 RAPIDS 生态系统构建的 GPU 加速 SQL 引擎。RAPIDS 基于 Apache Arrow 柱状内存格式,cuDF 是一个 GPU DataFrame 库,用于加载、连接、聚合、过滤和操作数据。它是 cuDF 的 SQL 接口,具有支持大规模数据科学工作流和企业数据集的各种功能。
21、Rapids地址:https://github.com/BlazingDB/blazingsql
Nvidia 的 Rapids 开源软件库和 API 套件让你有能力完全在 GPU 上执行端到端的数据科学和分析管道。
Rapids 使用 Nvidia CUDA 基元进行底层计算优化,并通过用户友好的 Python 接口暴露了 GPU 的并行性和高带宽内存速度。Rapids 依赖于 Apache Arrow 柱状内存格式,包括 cuDF,一个类似 Pandas 的 DataFrame 库;cuML,一个机器学习库集合,提供 Scikit-learn 中大多数算法的 GPU 版本;以及 cuGraph,一个类似 NetworkX 的加速图分析库
22、PostHog地址:https://github.com/rapidsai/cudf
PostHog 是一个为开发人员构建的开源产品分析平台。自动收集你网站或应用程序上的每个事件,无需向第三方发送数据。它在用户级别提供基于事件的分析,捕获你产品的使用数据以查看哪些用户在你的应用程序中执行了哪些操作。它会自动捕获点击次数和综合浏览量,以分析你的用户在做什么,而无需手动推送事件。
23、LakeFS地址:https://github.com/PostHog/posthog
LakeFS 提供了一种 "以管理代码的方式管理你的数据湖" 的方法,为对象存储增加了一层类似于 Git 的版本控制。
这种对 Git 语义的应用让用户可以创建自己的隔离的、零拷贝的数据分支,在上面工作、实验和建模分析,而没有破坏共享对象的风险。LakeFS 为你的数据带来了有用的 commit notes、元数据字段和 rollback 选项,同时也带来了维护数据完整性和质量的验证 hooks-- 在一个未提交的分支被意外地合并回生产中之前,运行格式和模式检查。
通过 LakeFS,管理和保护代码库的熟悉技术可以扩展到现代数据库,如 Amazon S3 和 Azure Blob 存储。
24、Meltano地址:https://github.com/treeverse/lakeFS
Meltano 是今年从 GitLab 中分离出来的,一个免费的开源 DataOps 替代传统 ELT(提取、加载、转换)的工具链。Meltano 的数据仓库框架使得为你的项目建模、提取和转换数据变得容易,并通过内置的分析工具和简化报告的仪表盘来补充集成和转换管道。
Meltano 提供了一个可靠的提取器和加载器库,以及对 Singer 标准的 data extracting taps 和 data loading targets 的支持,Meltano 已经是一个数据编排的动力源。
25、TrinoTrino(原名 PrestoSQL)是一个分布式 SQL 分析引擎,能够对大型分布式数据源运行极快的查询。
Trino 允许你同时对数据湖、关系型存储或多个不同来源执行查询,而不需要复制或移动数据进行处理。而且 Trino 与你的数据科学家可能使用的任何商业智能和分析工具配合得很好,无论是交互式的还是临时性的,最大限度地减少了学习曲线。
随着数据工程师努力支持越来越多的数据源的复杂分析,Trino 提供了一种优化查询执行和加速不同来源的结果的方法。
26、StreamNative地址:https://github.com/trinodb/trino
StreamNative 是一个高度可扩展的消息和事件流平台,大大简化了实时报告和分析工具以及企业应用流的数据管道铺设。
StreamNative 将 Apache Pulsar 强大的分布式流处理架构与 Kubernetes 和混合云支持等企业额外功能、大型数据连接器库、简易认证和授权以及用于健康和性能监控的专用工具相结合,既简化了基于 Pulsar 的实时应用程序的开发,又简化了大规模消息传递背板的部署和管理。
27、Hugging Face地址:https://github.com/streamnative
Hugging Face 提供了最重要的开源深度学习资源库,它本身并不是一个深度学习框架。Hugging Face 的目标是扩展到文本之外,支持图像、音频、视频、物体检测等。Infoworld 指出,深度学习从业者应在未来几年内密切关注这个 repo。
28、EleutherAI地址:https://github.com/huggingface/transformers
EleutherAI 是一个由机器学习研究人员组成的分布式小组,旨在将 GPT-3 带给所有人。
2021 年伊始,EleutherAI 发布了 The Pile,是一个 825 GB 的用于训练的多样化文本数据集;并在 6 月公布了 GPT-J,一个 60 亿参数的模型,大致相当于 OpenAI 的 GPT-3 的 Curie variant。
随着 GPT-NeoX 的出现,EleutherAI 计划将参数一直提高到 1750 亿,以与目前最广泛的 GPT-3 模型竞争。
29、Colab notebooks for generative art地址:https://github.com/EleutherAI/gpt-neo
首先是 OpenAI 的 CLIP(对比语言 - 图像预训练)模型,一个用于生成文本和图像矢量嵌入的多模态模型。虽然 CLIP 是完全开源的,但 OpenAI 的生成性神经网络 DALL-E 却不是。
为了填补这一空白,Ryan Murdoch 和 Katherine Crowson 开发了 Colab notebooks, CLIP 与其他开源模型(如 BigGAN 和 VQGAN)结合起来,制作 prompt-based 生成性艺术作品。
这些 notebooks 基于 MIT 许可,于过去几十年间在互联网上进行了广泛传播,被重新混合、改变、翻译,并被用来生成了惊人的艺术作品。
地址:https://github.com/openai/CLIP
2022 年最佳开源软件榜单|InfoWorld
转自 | OSC 开源社区
本文是 InfoWorld 2022 年公布的《最佳开源软件榜单》翻译稿。
InfoWorld 是一家信息技术媒体公司, 它创刊于 1978 年,从最初的一份月刊发展至今。但更为人熟知的是它的母公司 International Data Group(IDG),IDG 不仅是一家媒体信息技术出版公司还是风险投资公司,所以会出现在各大互联网公司的融资新闻中(以前)。
接着说回这份《最佳开源软件榜单》,每年 InfoWorld 都会根据软件对开源界的贡献,以及在业界的影响力评选出当年的「最佳开源软件 (BOSSIE)」。下面就让我们一起来看看,这份榜单里有没有熟悉的面孔吧!(附:2021 年最佳开源软件榜单,Python 高性能框架 FastAPI 上榜了!)
1、AlmaLinux
AlmaLinux 是由社区驱动的开源项目,由 CloudLinux OS 的创建者打造,一开始是作为 CentOS 的替代品。它是从红帽企业 Linux (RHEL) 的源码编译而来,所以跟 RHEL 8 在二进制上完全兼容。
地址:https://github.com/AlmaLinux
2、podman
Podman 是一个无守护进程的容器引擎,用于在 Linux 系统上开发、管理和运行 OCI 容器。容器既可以用 root 身份运行,也可以在非 root 模式下运行。
作为 Libpod 的一部分,它的定义可以简单地用命令:alias docker=podman 表示。
地址:https://github.com/containers/podman
3、Play with Docker
Play with Docker 是一个 Docker 学习平台,可以在浏览器上免费体验 Alpine Linux 虚拟机。不过需要登录和注册,而且每次登录创建的实例都有有时间限制,到时间还需要重新登录。
你可以在 Play with Docker 中构建和运行 Docker 容器,提升自己操作 Docker 的能力(默认已搭建好环境),甚至在 Docker Swarm 模式下创建集群, Docker-in-Docker (DinD) 用于提供多个 VM/PC 的效果。
地址:https://github.com/play-with-docker/play-with-docker
4、Vaadin
Vaadin 是一个可在 Java 中实现 Web 用户界面的 Web 框架,无需编写任何 HTML 或 JavaScript 代码。它包含一个服务器端,主要的应用逻辑都在服务器端运行,然后浏览器端通过 Ajax 技术跟服务器端进行交互。
地址:https://github.com/vaadin/platform
5、JHipster
JHipster 是一个全栈的 Java 应用程序开发平台,可用来创建基于 Maven+Spring+AngularJS 的项目,提供完全热加载的 Java 和 JavaScript 代码。
它还提供了包含 CLI 工具在内的许多组件,用于处理多种技术栈的脚手架生成,比如用 Vue.js UI 为前端 MongoDB 作为后端,以 React 为前端的 Postgres 等等...
地址:https://github.com/jhipster/generator-jhipster
6、SolidJS
SolidJS 是一个用于构建用户界面的声明式、高效且灵活的 JavaScript 库。它不使用虚拟 DOM。相反,它选择将其模板编译为真实的 DOM 节点,并将更新包装在细粒度的 React 中。
地址:https://github.com/solidjs/solid
7、Redwood
Redwood 是一个全栈 Web 框架,它将 React、GraphQL、Prisma、TypeScript、Jest 和 Storybook 的优点结合在一起。
它采用类似 Rails 的方法来满足数据建模和脚手架等重复性的需求,还解决了安全性和跟踪、集成等需求。Redwood 允许针对各种部署环境,包括 Vercel 和 Netlify 等无服务器平台。
地址:https://github.com/redwoodjs/redwood
8、Next.js
Next.js 是一个用于服务器渲染的通用 JavaScript Web 应用程序的小型框架,该框架基于 React、Webpack 和 Babel 构建,为建立网站提供了强大的支持。
地址:https://github.com/vercel/next.js
9、Wasmtime
Wasmtime 是 WebAssembly 和 WASI 的小型高效运行时库,采用 Rust 编写,构建于编译器 Cranelift 之上。它完全开源,符合 WASI 标准,还支持与 C/C++、Python、.NET、Go 和其他编程语言集成,可运行在 Windows、Linux、macOS 等平台。
地址:https://github.com/bytecodealliance/wasmtime
10、PyScript
PyScript 是一个开发框架,为开发者提供了在标准 HTML 中嵌入编写 Python 代码的能力。使用 Python 调用 JavaScript 函数库,以及创建 Python Web 应用。PyScript 旨在提供“一等公民 (first-class)”的编程语言,它具有一致的风格化规则、易于学习等特点。
地址:https://github.com/pyscript/pyscript
11、Hardhat
Hardhat 是面向专业人士的以太坊开发环境,同时也是一个优秀的开源框架,它简化了在以太坊上编码、测试和部署 Dapps 和开发智能合约的过程。
地址:https://github.com/NomicFoundation/hardhat
12、OpenFGA
OpenFGA 是一种适用于细粒度授权的开源授权解决方案,允许开发人员使用易于阅读的建模语言和友好的 API 构建精细的访问控制系统。
它应用了 ReBAC 的概念,由 Auth0 FGA 团队创建,并受到 Zanzibar 的启发,专为大规模的可靠性和低延迟而设计的授权系统。
地址:https://github.com/openfga/openfga
13、Sentry
Sentry 是一个实时的事件日志和聚合平台,基于 Django 构建。Sentry 可以帮助你将 Python 程序的所有 exception 自动记录下来,然后在一个简单好用的 UI 上呈现和搜索。
地址:https://github.com/getsentry/sentry
14、Appsmith
Appsmith 是一个开源低代码框架,用于构建管理面板、CRUD 应用程序和工作流。它允许拖放组件来构建仪表板、使用 JavaScript 编写逻辑并连接到任何 API、数据库或 GraphQL 源。
地址:https://github.com/appsmithorg/appsmith
15、Spinnaker
Spinnaker 是一个持续交付平台,它定位于将产品快速且持续地部署到多种云平台上。主要特性:配置一次,随时运行;随地部署,集中化管理;
地址:https://github.com/spinnaker/spinnaker
16、Hypertrace
Hypertrace 是一个开源的分布式跟踪和可观察性引擎,能够从庞大的云原生架构中的大量服务中摄取和处理大量实时性能数据。
它可以监控应用程序和微服务,跨多个接触点跟踪分布式事务,并将所有这些信息提炼成服务指标和应用程序流程图,显示在可自由定制的仪表板上。
地址:https://github.com/hypertrace/hypertrace
17、Gravitee
Gravitee API 网关是基于 Vert.X 开发的高性能接口网关,支持 Swagger 导入接口、文档管理、性能分析、操作审计、日志,负载均衡等功能。
地址:https://github.com/gravitee-io/gravitee-api-management
18、OpenTelemetry
OpenTelemetry 是一项高质量的便携式遥测技术,可用于检测、生成、收集和导出遥测数据(指标、日志和跟踪),以帮助分析软件的性能和行为。
它可以跨多种语言使用,且易于与流行的库和框架集成,例如 Spring、 ASP.NET Core、 Express、Quarkus 等。
地址:https://github.com/open-telemetry
19、Grafana
Grafana 是 Graphite 和 InfluxDB 的仪表盘和图形编辑器,同时也是开源的、功能齐全的度量仪表盘和图形编辑器,支持 Graphite,InfluxDB 和 OpenTSDB。
主要特性:灵活丰富的图形化选项;可以混合多种风格;支持白天和夜间模式;多个数据源;支持 Graphite 和 InfluxDB 查询编辑器;
地址:https://github.com/grafana/grafana
20、Dapr
Dapr 是微软新推出的,一种可移植的、serverless 的、事件驱动的运行环境。使开发人员可以轻松构建弹性,无状态和有状态微服务,让这些服务运行在云和边缘上,支持多种语言和开发框架。
地址:https://github.com/dapr/dapr
21、Redpanda
Redpanda 是 Kafka 的插件替代品,无需 ZK 和 JVM。主要用 C++ 编写,使用 Seastar 异步框架和 Raft 共识算法用于其分布式日志。
它可以提供高达 10 倍的平均延迟降低和高达 6 倍的 Kafka 事务速度,同时运行在更少的资源上。
地址:https://github.com/redpanda-data/redpanda
22、Apache lceberg
Iceberg 是一种用于大型分析表的高性能格式。Iceberg 为大数据带来了 SQL 表的可靠性和简单性,同时让 Spark、Trino、Flink、Presto、Hive 和 Impala 等引擎能够同时安全地使用相同的表。
地址:https://github.com/apache/iceberg
23、Apache Druid
Druid 是一个高性能实时分析数据库。它是为大型数据集上实时探索查询的引擎,提供专为 OLAP 设计的开源分析数据存储系统,它的设计意图是在面对代码部署、机器故障以及其他产品系统遇到不测时能保持 100% 正常运行。
地址:https://github.com/apache/druid
24、JAX
JAX 来自 Google,它是一个 TensorFlow 的简化库,结合了 Autograd 和 XLA,专门用于高性能机器学习的研究。
凭借 Autograd,JAX 可以求导循环、分支、递归和闭包函数,并且它可以进行三阶求导。通过 grad,它支持自动模式反向求导(反向传播)和正向求导,且二者可以任何顺序任意组合。
地址:https://github.com/google/jax
25、nbdev
nbdev 是一个 Jupyter Notebooks 驱动的开发平台。只需使用轻量级标记编写 Jupyter Notebooks ,即可获得高质量的文档、测试、持续集成和打包,比起传统编程环境,nbdev 的代码调试和重构容易得多。
地址:https://github.com/fastai/nbdev
26、Accelerate
Accelerate 是一个库,只需添加四行代码,即可在任何分布式配置中运行相同的 PyTorch 代码!简而言之, Accelerate 可以让大规模的训练和推理变得简单、高效和强适应性。
地址:https://github.com/huggingface/accelerate
27、Stable Diffusion
Stable Diffusion 是一种文本到图像的 AI 模型,可以生成质量惊人的图像。
世界各地的爱好者都在围绕这个项目进行改进工作,以加快图像生成速度,支持在内存较低的 GPU 上运行,并添加画内和画外支持,他们甚至在 M1 的 MacBook 上运行了 Stable Diffusione。
地址:https://github.com/CompVis/stable-diffusion
28、EleutherAI
严格来说,EleutherAI 是一群致力于实现开源人工智能研究的 AI 研究人员,旗下有多款预训练模型,包括:
GPT-NeoX-20B:一个与 CoreWeave 合作训练的 200 亿参数模型
GPT-J-6B:在 Pile 上训练的 60 亿参数模型
地址:https://github.com/EleutherAI
Python猫技术交流群开放啦!群里既有国内一二线大厂在职员工,也有国内外高校在读学生,既有十多年码龄的编程老鸟,也有中小学刚刚入门的新人,学习氛围良好!想入群的同学,请在公号内回复『交流群』,获取猫哥的微信(谢绝广告党,非诚勿扰!)~
还不过瘾?试试它们
如果你觉得本文有帮助
请慷慨分享和点赞,感谢啦!
以上是关于2021 年最佳开源软件榜单|InfoWorld的主要内容,如果未能解决你的问题,请参考以下文章
2021 年最佳开源软件榜单,Python 高性能框架 FastAPI 上榜了!