为 Hugging Face 用户带来无服务器 GPU 推理服务

今天，我们非常兴奋地宣布 部署到 Cloudflare Workers AI 功能正式上线，这是 Hugging Face Hub 平台上的一项新服务，它使得通过 Cloudflare 边缘数据中心部署的先进 GPU、轻松使用开放模型作为无服务器 API 成为可能。

从今天开始，我们将把 Hugging Face 上一些最受欢迎的开放模型整合到 Cloudflare Workers AI 中，这一切都得益于我们的生产环境部署的解决方案，例如文本生成推理 (TGI)。

通过 部署到 Cloudflare Workers AI 服务，开发者可以在无需管理 GPU 基础架构和服务器的情况下，以极低的运营成本构建强大的生成式 AI（Generative AI）应用，你只需 为实际计算消耗付费，无需为闲置资源支付费用。

开发者的生成式 AI 工具

这项新服务基于我们去年与 Cloudfalre 共同宣布的战略合作伙伴关系——简化开放生成式 AI 模型的访问与部署过程。开发者和机构们共同面临着一个主要的问题——GPU 资源稀缺及部署服务器的固定成本。

Cloudflare Workers AI 上的部署提供了一个简便、低成本的解决方案，通过按请求计费模式，为这些挑战提出了一个无服务器访问、运行的 Hugging Face 模型的解决方案。

举个具体例子，假设你开发了一个 RAG 应用，每天大约处理 1000 个请求，每个请求包含 1000 个 Token 输入和 100 个 Token 输出，使用的是 Meta Llama 2 7B 模型。这样的 LLM 推理生产成本约为每天 1 美元。

为 Hugging Face 用户带来无服务器 GPU 推理服务

我们很高兴能够这么快地实现这一集成。将 Cloudflare 全球网络中的无服务器 GPU 能力，与 Hugging Face 上最流行的开源模型结合起来，将为我们全球社区带来大量激动人心的创新。

John Graham-Cumming，Cloudflare 首席技术官

使用方法

在 Cloudflare Workers AI 上使用 Hugging Face 模型非常简单。下面是一个如何在 Nous Research 最新模型 Mistral 7B 上使用 Hermes 2 Pro 的逐步指南。

你可以在 Cloudflare Collection 中找到所有可用的模型。

注意：你需要拥有 Cloudflare 账户和 API 令牌。

你可以在所有支持的模型页面上找到“部署到 Cloudflare”的选项，包括如 Llama、Gemma 或 Mistral 等模型。

为 Hugging Face 用户带来无服务器 GPU 推理服务

打开“部署”菜单，选择“Cloudflare Workers AI”，这将打开一个包含如何使用此模型和发送请求指南的界面。

注意：如果你希望使用的模型没有“Cloudflare Workers AI”选项，意味着它目前不支持。我们正与 Cloudflare 合作扩展模型的可用性。你可以通过 api-enterprise@huggingface.co 联系我们，提交你的请求。

为 Hugging Face 用户带来无服务器 GPU 推理服务

当前有两种方式可以使用此集成：通过 Workers AI REST API 或直接在 Workers 中使用 Cloudflare AI SDK。选择你偏好的方式并将代码复制到你的环境中。当使用 REST API 时，需要确保已定义 ACCOUNT_ID 和 API_TOKEN 变量。

就这样！现在你可以开始向托管在 Cloudflare Workers AI 上的 Hugging Face 模型发送请求。请确保使用模型所期望的正确提示与模板。

我们的旅程刚刚开始

我们很高兴能与 Cloudflare 合作，让 AI 技术更加易于开发者访问。我们将与 Cloudflare 团队合作，为你带来更多模型和体验！

随笔

特别提醒: 内容为用户自行发布,如有侵权,请联系我们管理员删除,邮箱:mail@xieniao.com ,在收到您的邮件后我们会在3个工作日内处理。

工程仿真APP用户最爱TOP100

随笔

11个月前

01470

HR必备：国内9大主流人力资源软件比较

随笔

7个月前

0630

ngx-superbindex 项目使用教程

随笔

7个月前

0670

Android StepsView 使用教程

随笔

7个月前

0550

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

为 Hugging Face 用户带来无服务器 GPU 推理服务

开发者的生成式 AI 工具

使用方法

我们的旅程刚刚开始

云原生最佳实践系列 1：如何快速实现kafka性能压测

项目管理软件大对比：2024年10款最佳项目管理工具

相关文章

工程仿真APP用户最爱TOP100

HR必备：国内9大主流人力资源软件比较

ngx-superbindex 项目使用教程

Android StepsView 使用教程

暂无评论

热门网站

NBA直播

爱奇艺

Wicked Backgrounds

好看的韩国漫画_韩漫在线免费阅读-汗汗漫画网

YY影院

吃瓜网 – 吃瓜群众的吃瓜网站

热门文章

Vue+Express全栈开发项目实战技能：‌从0到1打造完整电商项目

一个手机号能否注册两个小红书账号？深度解析与操作指南

[端游] 传奇单机版C#韩版五职业带英雄游戏服务端

盐酸奥洛他定滴眼液（齐必妥）

淘宝店铺可以对外出租吗？有什么手续？ – 淘宝天猫

有谁知道知识产权的图标具体是什么样的？ – 淘宝天猫

立思丁（夫西地酸乳膏）

复方氨酚苯海拉明片（白城亿正）

为 Hugging Face 用户带来无服务器 GPU 推理服务

开发者的生成式 AI 工具

使用方法

我们的旅程刚刚开始

云原生最佳实践系列 1：如何快速实现kafka性能压测

项目管理软件大对比：2024年10款最佳项目管理工具

相关文章

热门网站

NBA直播

爱奇艺

Wicked Backgrounds

好看的韩国漫画_韩漫在线免费阅读-汗汗漫画网

YY影院

吃瓜网 – 吃瓜群众的吃瓜网站

热门文章

标签云