产品 / 面向 AI 开发者
ModelSphere
正式可用您自己的 Hugging Face Hub。改一个环境变量,所有客户端照常工作。
ModelSphere 是部署在您环境内的模型与数据集仓库,在协议层兼容 Hugging Face Hub API。设置 HF_ENDPOINT 后,每个标准客户端——transformers、datasets、diffusers、huggingface-cli,以及带 LFS 的原生 git——都无需补丁即可对接您的仓库。它同时可以作为公共 Hub 的透传缓存:按需懒加载,或为物理隔离机房定时预取;并补齐企业级仓库所需的一切:OIDC SSO、细粒度个人访问令牌、组织与团队、私有仓库、审计日志、Prometheus 指标,以及一个 tar 包搞定的备份恢复。
规格
- 版本
- v1.6.4 — 正式可用
- 协议
- Hugging Face Hub API · git(HTTPS 与 SSH)· git-LFS(> 5 GiB,经 HF 分片)
- 模式
- 主仓库 · 透传缓存 · 定时预取
- 运维
- OIDC · 令牌作用域 · 审计日志 · Prometheus · 单 tar 包备份
- 语言
- English · 简体中文
用实证说话
一段代码看明白。
没有私有 SDK,无需改写—— ModelSphere 在现有工具所在之处完成对接。
$ export HF_ENDPOINT=https://models.intra.example
# 下游一切照常工作——客户端无需任何补丁
from transformers import AutoModelForCausalLM
model = AutoModelForCausalLM.from_pretrained("meta-llama/Llama-3.1-8B")
# 由您的仓库提供;可缓存自上游,也可在物理隔离环境中使用▌ 协议层兼容 Hugging Face Hub API——包括 git clone 与数 GB 级的 LFS 传输。
核心能力
ModelSphere 为您带来什么
协议层兼容 Hub
与 huggingface_hub 协议兼容——transformers、datasets、diffusers、huggingface-cli 设置 HF_ENDPOINT 即可使用。不用 fork,不打补丁,没有需要引入的私有 SDK。
底层是真正的 git
git clone、git lfs pull、git lfs push 原生可用;超过 5 GiB 的对象通过 Hugging Face 分片传输上传。模型版本管理就是 git 版本管理——分支、标签、提交,您早已熟悉。
可浏览的 Hub,而不只是一个 API
除了线缆层协议,ModelSphere 还自带一套 Web UI:可搜索浏览,支持按 tag、pipeline 与 library 过滤;渲染模型卡;浏览器内文件查看器与提交差异历史;讨论与点赞。经 HTTPS 或 SSH 推送;在浏览器里克隆、比对与评审。
公共 Hub 的透传缓存
指向 huggingface.co 后,团队拉取过的内容会被自动缓存——也可以按计划预取,服务于物理隔离机房。一个仓库,同时服务两种环境。
企业级配套齐全
OIDC SSO、带细粒度作用域的个人访问令牌、组织与团队、公私仓库、全量变更审计日志、随 Chart 发布的 Grafana 大盘与 Prometheus 指标,以及单个 tar 包的备份恢复。
工作原理
从依赖公网,到私有仓库。
- 步骤 01
设置 HF_ENDPOINT
一个环境变量。所有标准 Hugging Face 客户端即刻改与您的仓库通信,而非公共 Hub。
- 步骤 02
推送、拉取、克隆
用 huggingface-cli 或 git-lfs 上传微调模型;经内置缓存拉取基础模型——按需懒加载,或为物理隔离环境预取。
- 步骤 03
治理与观测
OIDC 决定可见性,令牌按范围授权。每次变更进入审计日志,每次调用进入 Prometheus。
适用团队
为这些团队而建
- 托管微调模型与内部模型的团队
- 需要 HF 工作流的物理隔离组织
- 统一模型与数据集存储的平台团队
搭配使用
其他开发者产品
ConsoleX
正式可用登录即获得受治理的 Kubernetes 工作空间。无需 kubectl,无需提工单。
用户首次 SSO 登录时,自动获得一个隔离的命名空间:配额、默认拒绝的网络策略、存储与 Web 终端——自动开通,持续收敛。
了解更多DevSpace
正式可用几秒钟内在 GPU 上拉起 Jupyter 或 VS Code。闲置环境自动关停。
一键创建 Jupyter、Marimo、Streamlit、Gradio、VS Code 环境——GPU 就绪、按用户经独立认证代理隔离,支持 SSH,默认闲置自动关停。
了解更多TrainX
正式可用管理员写模板,用户填表单,Kubernetes 跑作业。
自描述的训练模板直接渲染成 UI 表单——提交前实时校验配额,运行中流式日志、解析进度条,一键 TensorBoard。
了解更多