Hugging Face是AI构建者的首选开放平台。他们赋予下一代机器学习工程师、科学家和最终用户合作、创新,并塑造一个开放和道德的AI未来。随着社区的快速增长,一些最常用的开源ML库和工具,以及一个探索技术前沿的才华横溢的科学团队,Hugging Face处于AI革命的核心。
近期,DigitalOcean 宣布,DigitalOcean 现已提供由Hugging Face支持的一键式模型部署服务。这个名为“ HUGS on DO”的新推理解决方案提供了可部署的、流行的、第三方生成式AI模型,这些模型经过优化,已可以在DigitalOcean GPU Droplets云服务器上运行。这个一键式模型部署服务结合了DigitalOcean标志性的简单易用性与Hugging Face,让用户可以比以前更快、更高效地启动AI应用。
开启通往AI创新的捷径
一键式模型部署是一个任何技术水平都能使用的解决方案,几分钟之内你就可以完全上手。由于我们与 HuggingFace 的合作,Hugging Face 的用户现在可以直接在 DigitalOcean 的 GPU Droplet 服务器上部署最受欢迎的模型。只需在Hugging Face上选择一个模型,并从“部署”下拉菜单中选择 DigitalOcean,用户就可以立即在DigitalOcean上开始构建专用的推理。用户还可以直接从DigitalOcean云控制台部署一键式模型,在后台直接选择一个 HuggingFace 上的模型。
如下图所示,用户在登录 DigitalOcean 的控制台后,创建 GPU Droplet 服务器时,即可直接选择一键模型部署功能(1-click Models)。
该功能的主要特点有:
- 一键部署模型:只需点击一次,即可在由 NVIDIA H100 加速计算支持的 GPU 实例上部署像 Meta 的 Llama 3 和 Mistral 这样的流行 AI 模型。
- 简化设置:在 DigitalOcean 上使用一键式模型部署功能,我们会帮你解决复杂的基础设施构建过程,让您能够轻松开始使用模型端点构建自己的项目,无需复杂的设置或软件配置。
- 优化性能:我们已经对一键式模型部署功能进行了端到端的优化,让你可在高性能 GPU 实例上构建项目,确保模型在最尖端的 DigitalOcean 硬件上以最小的开销运行。
- 快速实现价值:与行业中哪些需要大量配置且要等待数天的解决方案相比,使用 DigitalOcean 一键式模型部署功能的客户可以在几分钟内开始接入模型推理端点。
- 与 Hugging Face 深度合作:模型由 Hugging Face 维护和更新,确保客户在创建新的模型端点时能够访问经过全面测试的优化版本,以及最新的功能和特性。
在DigitalOcean上由Hugging Face支持的一键式模型包括:
- meta-llama/Meta-Llama-3.1-8B-Instruct
- meta-llama/Meta-Llama-3.1-70B-Instruct
- meta-llama/Meta-Llama-3.1-405B-Instruct-FP8
- Qwen/Qwen2.5-7B-Instruct
- google/gemma-2-9b-it
- google/gemma-2-27b-it
- mistralai/Mixtral-8x7B-Instruct-v0.1
- mistralai/Mistral-7B-Instruct-v0.3
- mistralai/Mixtral-8x22B-Instruct-v0.1
- NousResearch/Hermes-3-Llama-3.1-8B
- NousResearch/Hermes-3-Llama-3.1-70B
- NousResearch/Hermes-3-Llama-3.1-405B
- NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO
在DigitalOcean上一键部署模型吧
由Hugging Face支持的DigitalOcean上的一键式模型为希望部署流行AI/ML模型的开发者提供了一个更加易用、成本更低的解决方案。只需一键,用户就可以跳过常见的配置难题,直接在 DigitalOcean GPU Droplets服务器上构建AI创新应用。无论您是开发者、AI/ML工程师还是研究人员,一键式模型 部署功能都能为您提供实现创意所需的性能和灵活性。
同时,DigitalOcean 的 GPU Droplet 服务器搭载了 NVIDIA H100 GPU(包括单卡和 8 卡),可为您的 AI 项目提供目前行业内最优的算力支持。而且 GPU Droplet 目前正在进行限时优惠,2024 年 12 月 31 日之前最低仅需 2.5 美元/GPU/小时。