深潮导读:Venice 最近三周的订阅数据显示新增 ARR 增速高达 34%,当前市值下估值仅为未来 12 个月预期收入的 2.5 倍。这位前加密投资者拆解了 Venice 从隐私架构到商业模式的全链条,认为市场严重低估了"隐私 AI 推理"这条赛道的真实规模,以及 Venice 在这条赛道上无可替代的组合拳优势,并看多 $VVV。
Venice 是一个隐私优先的 AI 推理平台,让用户在使用前沿模型和开源模型时无需向底层模型提供商暴露身份。我认为它是目前 AI 市场上最完整的隐私解决方案:匿名代理、开源模型路由、硬件认证的 TEE 推理、端到端加密推理,这四个功能全都整合在一个消费级产品里,隐私模式可以按每次请求选择。没有其他玩家能同时提供这四项。
这门生意一直在显著增长。Crypto Twitter 上关于 Venice 的讨论普遍低估了当前收入、近期增长和未来轨迹。Venice 最近开始公布每日订阅数据,三周的细颗粒度数据显示新增订阅 ARR 明显加速:
持续的增长速度是这篇分析的核心假设。我还认为 API 收入最近一直在与订阅增长同步,这个假设在下文"当前状态与增长"部分有详细解释。以保守的每年 1 亿美元订阅新增速度为锚点(与 4 月下旬的速度持平),假设 API 新增同等金额,未来 12 个月总收入增量约为 2 亿美元。
最近的加速趋势表明,如果这个速度保持住,实际数字会有明显上行空间。
这篇文章会逐一拆解 Venice 的独特之处:
隐私层级:一套隐私架构,深度远超标准的"私密 AI 聊天"说法。
用户类别:Venice 的用户群体是被主流路径挤出来的(内容政策、合规、威胁模型、原则),而不是靠营销吸引来的。
市场规模:一个不断增长的隐私分段推理市场,消费者聊天的框架通常会低估它。
竞争格局:Venice 把隐私深度、无审查模型访问和加密原生分发打包在一起,这个组合在竞争对手中目前是独一无二的。
代币设计与 VVV 估值:VVV 和 DIEM 的机制如何将平台增长转化为代币价值,以及 VVV 的估值倍数与 OpenRouter、Fireworks、Together AI 等隐私推理同行相比如何。
在最近一轮上涨和回调到 14 美元后,VVV 的市值约 6.6 亿美元,完全稀释估值约 11.2 亿美元。当前 ARR 约为 6000 万美元(在下文"当前状态与增长"部分推算),正在以每年约 2 亿美元的速度增加,且还在加速。按当前 ARR 计算,VVV 的市销率约为 11 倍(FDV 约 19 倍),低于隐私推理同行 OpenRouter 的 26 倍。按未来 12 个月 ARR 约 2.6 亿美元计算(当前 6000 万美元基数加上 2 亿美元年化新增),VVV 的市销率约为 2.5 倍(FDV 约 4.3 倍)。
当前状态与增长
Venice 最近开始公布每日新增订阅数据。结合定期的公开注册用户里程碑公告,这两个数据流让我能够构建当前 ARR 估算和未来轨迹。
要估算当前 ARR,我从注册总数入手。根据一段时间内公开公告的节奏,总注册数一直以每月约 30 万的速度增长。最近确认的里程碑是截至 2026 年 5 月 16 日约 300 万注册用户,高于 2 月 1 日的约 200 万,与每月 30 万的速度一致。假设约 5%的终身付费转化率(考虑到每日数据显示新注册用户转化更快,这可能是保守的),这意味着截至 5 月中旬约有 15 万活跃付费订阅用户。直到 4 月中下旬,只有基础的每月 18 美元 Pro 套餐存在;Pro+(每月 68 美元)和 Max(每月 200 美元)套餐的推出已经开始改变结构,但绝大多数付费用户仍停留在 18 美元。加权 ARPPU 约为每月 18-19 美元,意味着当前订阅 MRR 约为 280 万美元,或约 3300 万美元订阅 ARR。这只是订阅部分;API 收入会在本节后面叠加进来,以得出完整的当前 ARR 估算。
在未来轨迹上,新订阅 ARR 的增长速度一直在加速。按 4 月下旬的速度,公司每周新增约 200 万美元订阅 ARR。到最近一周(5 月 10-16 日),这个速度已经跃升至每周约 260 万美元,年化后相当于 1.34 亿美元的订阅新增速度。在这篇分析的核心情景中,我锚定保守的 1 亿美元年化数字,以避免夸大最近的加速。扣除流失后的净增长会略低,但在当前规模下这个差距小到在方向上不重要,毛增长速度构成了本文前瞻性分析的核心。
三周的细颗粒度数据(4 月 26 日 -5 月 16 日)显示出明显的爬坡:
第 1 周到第 3 周,每日 MRR 新增量增长了约 34%。假设 API 收入按 1:1 追踪新订阅 MRR(下文解释),隐含的总年化新增速度已经从约 2 亿美元跃升至约 2.68 亿美元。两个因素似乎在推动这个拐点:Pro+和 Max 套餐的推出给了高支付意愿用户之前没有的选择,提升了加权 ARPPU;付费转化率在套餐扩展后似乎加速了。
API 收入更难衡量,因为没有直接披露。我的基本情景是,最近新增 API 运营收入与新订阅 MRR 的比例约为 1:1,历史新增比例低于这个比率。结果是当前 API ARR 基数虽然可观但略低于订阅 ARR,随着时间推移正在缩小至平价。
大约 50/50 拆分的理由从同行基准开始。在大型闭源模型平台中,ChatGPT 的 API 占比约 25%,订阅占比约 75%,因为庞大的消费者订阅基数使 API 份额较小。Anthropic 的 API 占比约 80%,订阅占比约 20%,因为其用户基础偏向开发者和企业。Venice 在结构上介于两者之间:隐私定位不像 ChatGPT 那样吸引普通消费者,但付费用户基础比 Anthropic 的企业重度混合更广。50/50 的拆分落在这个范围的中间。
这个区间范围得到两条 Venice 特定证据的强化。
首先,Venice 的 API 已经建立了大量开发者分发渠道。OpenRouter 路由 Venice 模型,Fleek 将所有托管代理默认为 Venice 推理,Cursor、Brave Leo(通过 BYOM)和 VSCode 社区扩展都支持 Venice。这些集成在过去一年多时间里积累起来,支撑了 API 是一门真实且重要的业务、拥有规模化生产流量的论点。
其次,最近 token 吞吐量的爬升远超仅订阅增长所能解释的程度。每日 token 吞吐量从 2 月初的 200 亿增长到 5 月初的 600 亿以上,三个月内约 3 倍。在同一窗口期,付费订阅基数增长了约 50%(从约 10 万付费订阅增至约 15 万)。4 月中旬 Pro+/Max 套餐的扩展只让一小部分新注册用户转向了更高 ARPPU 的套餐,即使对这些套餐的单用户 token 消耗量做出慷慨假设,也无法填补这个缺口。token 爬升的大部分似乎来自按使用计费的 API 工作负载:智能体部署、集成合作伙伴扩大生产流量,以及类似的高容量使用场景。
估算当前 API ARR 比订阅 ARR 更难,因为 1:1 的比率似乎是最近才出现的;在 4 月中旬之前,API 份额可能更小。使用一个中点假设,即 API 历史上平均约为订阅的 70-80%,最近才达到 1:1,当前 API ARR 约为 2500-3000 万美元。当前总 ARR 估算:约 5500-6500 万美元,中点约 6000 万美元。
API 部分值得简单说明一下:它基于当前使用运营收入的年化,而不是循环订阅承诺,因此比订阅部分具有更高的内在波动性。一个重度 API 客户减少使用可能导致 API 运营收入显著下降,而订阅基数不会出现类似的流失。
与年初至今收入交叉验证:基于 token 吞吐量从 2 月初的每天 200 亿爬升到 5 月初的每天 600 亿以上,Venice 在 2026 年已经产生了至少 3000 万美元的累计收入。这个数字与当前 ARR 落在 5500-6500 万美元区间一致,这个基数正在快速增长至 2 亿美元的年化新增速度。
重要的是,年化新增速度与未来 12 个月赚取的收入不是一回事。新 ARR 在一年中线性增加,所以 2 亿美元的年化新增速度如果在 2026 年持续,转化为一年内赚取的约 1 亿美元新收入,加上当前 ARR 基数贡献的另外约 6000 万美元。未来 12 个月赚取的总收入应该落在 1.5-2 亿美元区间,该 12 个月窗口结束时的 ARR 约为 2.6 亿美元(扣除流失前)(当前 6000 万美元+新增 2 亿美元 ARR)。
往回看主要是一个注脚。Venice 目前的 ARR 年化新增速度约为 2 亿美元,真正的问题是今天的速度是底线还是起点。重要的变量:订阅增长是否保持,API 使用是否继续比订阅扩张更快,随着队列成熟会出现多少流失,以及可寻址市场能否支撑这个速度的持续增长。
市场规模问题在你理解 Venice 实际做什么之后更容易回答。最清晰的基础是一个 LLM 交互的隐私阶梯,每一级代表一组不同的隐私假设,Venice 的模式嵌入特定层级。
隐私层级
下面的阶梯按一个狭窄但重要的轴对基于云的 AI 使用进行排名:谁可以将明文提示词与用户身份关联起来。它不能解决所有隐私问题。设备入侵、支付痕迹、账户元数据、传票风险和端点安全仍然是独立的问题。但它阐明了当用户从默认聊天机器人转向 Venice 的更高隐私模式时,实际改变了什么。级别编号(0-7)是我的,用于将 Venice 置于更广阔的格局中。Venice 自己的分类法只使用四个命名模式:Anonymous、Private、TEE 和 E2EE,映射到下面的 Level 3、4、6 和 7。
最强的隐私选项根本不在阶梯上。在你拥有的硬件上运行开源模型,没有云参与,打败下游的所有选项。在一台强劲的 Mac 或工作站上运行 GLM 5.1 或 Qwen 3.6,没有网络调用,没有第三方介入。没有什么能比得上"提示词从不离开我的机器",前提是机器本身得到了合理加固。但这不是大多数人会走的路。硬件很贵。能在本地运行的开源模型在最难的任务上仍然落后于闭源实验室的前沿水平。你会失去集成和 24/7 云端运行,而且你要承担维护整个栈的责任。把本地部署放在一边,下面的阶梯覆盖了基于云的推理的现实选项。
详细的逐级分解如下,包括支撑每一层级的比喻:
Level 0:"ChatGPT、Claude 或 Gemini,已登录,默认状态。"
你的提示词会发送到与你账户关联的实验室。他们知道你是谁以及你问了什么。在消费者套餐中,除非你选择退出,否则对话可能被用于改进未来的模型,并且会存储在你的服务器端聊天历史中。这里有真实的承诺(不出售数据、保留期限、删除控制),但你是被识别的、被保留的,在消费者套餐中可能进入训练流程。大多数人都在这一层。从架构上讲,无论提供商位于何处,任何托管 API 消费服务都适用相同的姿态。中国提供商的托管计划(DeepSeek 托管版、GLM/智谱、MiniMax、Qwen 直连)处于相同的架构层级:提供商看到明文,身份与账户关联,保留和训练政策因提供商而异。用户通常因为价格选择这些服务,因为它们往往比 Anthropic 或 OpenAI 便宜得多。你的数据最终受哪个司法管辖区管理,取决于具体提供商、你访问的端点、地区和合同。不要仅仅因为模型便宜就假设你获得了美国或欧盟式的数据处理。
比喻:
你直接去大公司(AI 提供商)找顾问(模型)。他们读你的备忘录,回答你的问题,然后以你的名字归档一份副本。他们可能会使用过往备忘录的匿名版本来培训其他顾问或改进服务。
Level 1:"ChatGPT 临时聊天 / Claude 隐身聊天。"
同样的提供商、同样的身份、同样的明文在他们的服务器上。对话不会出现在你的历史记录中,模型不会将其继续传递,根据政策它被排除在训练之外。对于你不想影响账户的敏感一次性对话很有用。提供商仍然知道是你,仍然看到完整的提示词;他们不能做的是长期保留或用于训练。从你自己的历史中隐藏,但不是从实验室隐藏。
比喻:
与顾问(模型)的直接互动相同,但你要求他们将这份特定备忘录排除在你的主文件之外。他们读了它,回答,然后放进一个临时抽屉(隐身聊天)中,过一段时间会被清除。他们仍然知道是你,也看到了你发送的内容。
Level 2: "Anthropic API、Claude for Work、ChatGPT Enterprise、OpenAI API."
从消费者聊天转向商业条款。合同排除你的数据用于训练。保留期很短,通常约 30 天用于安全审查,有时在企业层级为零。如果违反政策,你有法律追索权。实验室在推理过程中仍然看到明文,并将流量与你的 API 密钥关联,但保障更强且可在合同上执行。这是大多数公司实际使用的隐私姿态,是对消费者聊天的真正升级。但它仍然基于政策,而非架构。继续攀升的理由是真实的:未来的政策变更、强制披露、数据泄露或实验室本身变坏。
比喻:
你与咨询公司(企业/API 条款)签订合同,条款包括不复制、不跨客户、短保留期,并在违反时有法律追索权。与顾问(模型)的直接互动相同,他们读你的备忘录并知道来自你,只是关于备忘录之后会发生什么的规则更严格。
Level 3:"Venice 匿名模式。"
代理位于你和实验室之间,在转发前剥离你的身份。实验室以明文看到提示词内容,但不知道是你。他们看到的是"来自 Venice 的请求"。对于内容中不识别你的提示词,这打破了你的查询与你名字之间的联系,实验室的长期画像变得困难得多。对于内容中确实识别你的提示词(你的公司、你的交易、你的名字),这在很大程度上是表面功夫。内容无论如何都会暴露你。你还添加了 Venice 作为信任方。自己动手做这个不现实。你会是你自己代理的唯一用户,而单用户匿名不是匿名。
比喻:
快递服务(Venice)处理投递。快递在交给顾问(模型)之前从备忘录上剥离你的名字。顾问读内容但不知道是谁发的;快递服务知道双方。
Level 4:"Together AI / Fireworks / Groq 上的开源模型,或 Venice 私密模式。"
切换到开源模型,封闭实验室在该流量中退出。他们不在循环中,因为你没有使用他们的模型。信任转移到托管开源模型的人。不同的供应商,类似的合同保障,通常文化上更注重隐私(尤其是 Venice 私密模式)。你放弃了一些能力,尽管差距已经缩小。GLM 5.1、Qwen 3.6、Minimax M2.7 和 DeepSeek V4 在日常编码、写作和分析方面表现不错。它们是否达到顶级封闭模型的水平很大程度上取决于基准;封闭实验室在长上下文工作、多模态任务和复杂代理工作流上仍然倾向于获胜。你还降低了集中风险,信任的方也更少。这是否严格比 Level 3 更私密?这取决于你关心什么。Level 3 对前沿实验室隐藏你的身份;Level 4 向较小玩家透露你的身份,但完全切断了实验室。不同的优先级,不同的排序。这仅对你实际通过开源路由的流量有帮助。混合使用意味着实验室仍然看到你发送给他们的任何内容。在 Level 4 内部,提供商在 GPU 工作发生的位置上也有所不同:Together、Fireworks 和 Venice 私密模式指定他们的数据中心,而像 OpenRouter 这样的聚合器路由到任何最便宜的底层提供商,这可能包括在你没有选择的司法管辖区运行的提供商。对于关心这一点的用户(避免路由到某些国家的 API 调用),指定主机的选项与路由到最便宜的聚合器有本质区别,后者还增加了一个信任跳点。
比喻:
你直接把备忘录带到不同的咨询公司(开源模型托管方,如 Together AI、Fireworks 或 Venice 私密模式)。原来的公司什么都看不到,因为你已经停止使用它们。新顾问(不同的模型)读你的备忘录并知道来自你,与之前相同的直接互动结构,只是公司不同。
Level 5:"DIY:RunPod / Lambda Labs / AWS 上的 vLLM。"
完全跳过推理即服务层。租用原始 GPU,自己安装 vLLM 或 TGI,加载权重,暴露你自己的端点。没有推理供应商看到你的流量,只有你虚拟机运行所在的云主机的硬件。如果有动机或被强制要求,云主机技术上可以检查你的虚拟机。不过,他们比小型推理供应商有更强的合规姿态、合同保护和审计追踪。权衡是:你从小供应商的政策转移到超大规模云提供商的政策,代价是真正的工程和运维工作。
比喻:
你雇佣自己的顾问(你自己的模型,自托管),他在私人办公室(你从 RunPod、Lambda Labs 或 AWS 等云主机租用的虚拟机)中专门为你工作。中间没有咨询公司,只有你和你亲自聘请的顾问。大楼所有者(云主机)如果有动机可以进行技术访问,但通常比早期层级的小公司有更强的合规姿态。
Level 6:"Venice TEE 模式。"
这里隐私保障改变了性质。TEE 和 E2EE 都对任何付费 Pro 订阅者可用;它们之间的选择是按请求而非按计划。对于 TEE 推理,Venice 路由到运行来自 NEAR AI Cloud 和 Phala Network 的机密计算技术的 GPU 主机,在 NVIDIA H100 和 H200 硬件上。NEAR 和 Phala 提供协议和工具;GPU 本身由使用该技术的第三方主机运营。GPU 上的机密计算功能防止运营商在运行时读取飞地内的内容。远程证明让你的客户端在发送任何内容之前以加密方式验证飞地内运行的代码,所以"这真的是 Venice 发布的代码吗"是一个已解决的问题。尚未解决的是对该代码正确性的正式第三方审计。GPU 运营商不再是可以窥视的一方。Venice 的代理仍然短暂地看到明文,但 GPU 主机看不到。这里的转变是从政策到硬件。信任没有消失;它改变了目标。你现在信任 NVIDIA 的机密计算设计、证明签名链和 Venice 的实现。对实际威胁很稳健,尽管不是防弹的:TEE 设计(Intel SGX、AMD SEV)已经反复发现侧信道漏洞,当前设计并非免疫。对于密切跟踪该漏洞研究的用户,Level 4(在可信运营商数据中心上的 Venice 私密模式)可能是理性的停止点,而不是 Level 6,因为信任 Venice 的运营卫生可能比信任芯片供应商的证明链更舒适。苹果的 Private Cloud Compute 大致属于同一架构系列:具有硬件支持的隐私和可验证性的私有云推理。但与 Venice 的差异是真实的。苹果使用他们控制的 Apple Silicon,只在上面运行 Apple Intelligence,不暴露模型选择。Venice 使用外部 TEE 合作伙伴,支持开源模型,并让用户按请求选择隐私层级。
比喻:
快递服务(Venice)将你的备忘录送到在密封隔音室(NVIDIA 机密计算 GPU 上的 TEE/硬件飞地,由 Venice 的合作伙伴 NEAR AI Cloud 和 Phala Network 运营)内工作的顾问(模型)。快递在途中读备忘录,但里面的顾问无法被任何人观察到,包括大楼所有者(GPU 运营商)。房间在每次会话后被清空。
Level 7:"Venice E2EE 模式。"
TEE 加客户端加密。加密设置在你的客户端和硅飞地之间直接发生。中间的 Venice 代理从未拥有密钥,所以通过它传递的任何内容都是从你的机器发出的密文,直到在硅内被处理的那一刻。GPU 运营商和 Venice 本身都被移除为可以窥视的一方;唯一处理明文的是在飞地内运行的模型,并且是短暂的。这是在他人硬件上可用的最强隐私保障,仅次于完全同态加密(目前还不能以可用速度为 LLM 工作)。Level 6 的所有信任依赖都延续下来,加上一个新的:客户端加密本身需要正确实现。这一层级特有的两个功能权衡。需要 Venice 基础设施读取明文的功能,如网络搜索和持久记忆,被禁用。模型选择也变窄:目前在 TEE/E2EE 基础设施内部署了正好十一个模型:Venice Uncensored 1.2、GLM 5.1、GLM 4.7、GLM 4.7 Flash、Qwen3.5 122B A10B、Qwen 2.5 7B、Qwen3 30B A3B、Qwen3 VL 30B A3B、Gemma 3 27B、GPT OSS 20B 和 GPT OSS 120B。
比喻:
Level 6 的一切仍然适用:顾问(模型)在密封隔音室内工作,外面没有人可以观察,房间在每次会话后被清空。新增的是,你在交给快递(仍然是 Venice)之前自己把备忘录放进锁箱(客户端加密)。快递现在携带一个不透明的盒子,看不到里面,所以唯一能看到你消息的是密封室内的顾问。
关键点:Level 0-2 主要是政策和合同升级。Level 3-4 改变路由和模型/供应商暴露。Level 6-7 通过转向硬件支持和加密推理更根本地改变了信任模型。Venice 的差异化在于它在单一产品内跨越 Level 3、4、6 和 7。
任何给定用户的正确层级来自他们的威胁模型。基于哪种机制听起来在技术上最令人印象深刻来选择是没有抓住要点的。Level 6 和 7 牺牲了一些前沿能力并增加了新的信任依赖。即使有这些成本,这仍然是当今云推理上可用的最有意义的隐私升级。
这就是架构的工作方式。更难的问题是谁真正需要哪个层级,以及该受众有多大。不同的威胁模型将不同的用户推向阶梯的不同部分,通常是被迫而非出于偏好,由此产生的市场比技术宣传所暗示的更大。以下是分解。
用户分类
隐私立场并非一种抽象偏好。Venice 的相当一部分受众是在内容政策、合规团队、威胁模型或原则把他们从默认选项推开后才来到这里的。当用户主动寻找一个无法继续使用的替代品时,营销工作会轻松很多。值得梳理的六个细分群体:
受监管和合规驱动的工作。
处理重大非公开信息的金融团队、受 HIPAA 约束的医疗工作者、处理特权通信的律师、并购和交易流程专业人士。合规团队通常不允许 Level 0。许多似乎停留在 Level 2,因为 Anthropic 和 OpenAI 的企业条款(不训练、短期保留、合同追索权)能通过常见的合规门槛。一部分推进到 Level 6,往往是因为他们在别处被政策变更伤害过,或因为他们处理的数据一旦被强制披露会造成实际损失。Anthropic 似乎已经在服务这个细分市场上建立了可观的企业业务,医疗和金融领域的监管方向一直在朝着更严格的隐私保护计算要求发展。Venice 目前在这里最明显的契合点似乎是出于个人谨慎购买 Pro 的独立从业者,而非企业采购动作。企业采购看的不只是隐私架构。合规团队在签字前需要管理控制、审计日志、SOC2 报告、签署的 DPA、实际 SLA 和集成支持。加密故事很重要但还不够。由采购驱动的企业市场正被 Apple PCC、Microsoft Azure Confidential Computing 以及 Phala 或 NEAR 直接竞争。
基于 Venice API 构建的开发者。
Venice 的 API 在 OpenRouter、Cursor、VSCode、Brave Leo 和 Fleek 等开发者集成中获得了关注。这里最明显的用例是开发者在自己的产品中构建尊重隐私的 AI 功能,他们希望向终端用户保证"你的数据保持私密"。层级映射可能因开发者构建的内容而异:成本敏感的消费者功能用匿名模式(Level 3),默认 OSS 路由用私密模式(Level 4),专门以架构隐私为卖点的产品用 TEE 或 E2EE(Levels 6 到 7)。一个使用 Venice API 的开发者可以服务许多终端用户,无需每个人都购买 Venice 订阅,这使得单位经济效益可能与直接消费者订阅大不相同。
高风险个人使用。
人们可能不希望心理健康和治疗查询留在账户历史中。围绕性取向或性别的身份探索,用户可能还没准备好披露。关于婚姻、分手、就业或家庭动态的讨论,这些查询本身一旦暴露可能造成伤害。这些用户中许多可能停留在 Level 1,认为隐身聊天能隐藏他们。有隐私意识的子集通常在理解它无法完全向实验室隐藏后转向 Level 6。AI 心理健康似乎是一个增长类别,尽管临床和消费者产品的规模和质量各不相同。从 Venice 的角度难以估算规模,因为这个细分市场的许多用户可能不知道要寻找硬件认证隐私,直到尴尬的事情发生在他们或他们认识的人身上。
对抗性环境。
保护信源的记者、所在司法管辖区监控 AI 使用的活动人士、异见人士和政治组织者、研究威胁行为者的安全研究员、代表举报人的律师。这些用户通常需要 Levels 6 和 7。较低层级可能无法在他们的威胁模型下存活。看看 Proton:即使拥有隐私优先的声誉和瑞士法律所在地,它往往会遵守收到的大多数法律请求,常常是因为瑞士法律要求这样做。这是基于政策的隐私在规模化时可能遭遇的失效模式。Venice 的 TEE 和 E2EE 架构属于云设置中提供商不被设计为持有明文的那类,而明文正是遵守此类强制要求所需的。但架构能带你走多远是有限的。Levels 6 和 7 减少了明文暴露,但它们无法修复整体图景。账户元数据、支付轨迹、Venice 记录的使用信息、你的笔记本电脑在做什么,以及法院能从你那里强制获取什么,这些都留在用户身上。对于有真实对抗威胁模型的人来说,这只是更广泛工具包中的一个工具。数字上看这个细分市场很小。为能在传票下存活的工具付费的意愿往往很高。
加密原生和隐私文化用户。
Web3 开发者、注重主权的技术专家、运行自己节点并在原则上重视硬件认证保证的人。这个细分市场可能跨越 Levels 3 到 7,取决于个人威胁模型,有原则的子集往往默认在敏感查询中使用 6 或 7。AI x crypto 已成为更广泛加密生态系统中的一个有意义类别,像 Bittensor 这样的基础设施参与者建立了重要立足点。行业调查常报告在新兴市场中自我托管兴趣更高,那里中心化支付监控是一个担忧。Venice 的立场与这个细分市场的契合方式是封闭实验室竞争者未能匹配的:VVV 计价、无 KYC、Erik Voorhees 的声誉,以及为 VVV 和 MOR 持有者提供的历史免费 Pro 层级帮助孕育了这个群体。可能是 Venice 的天然文化基础和最早付费用户的重要部分。
成人内容和其他被封闭实验室直接拒绝的类别。
OpenAI、Anthropic 和 Google 通常拒绝 NSFW 性内容。其他在 Level 0 遇阻的类别,比如成熟创意写作、关于药物的减害问题,以及一长串被污名化但合法的话题,在不同提供商那里得到不同处理,有时会有宽容。这些类别的用户通常无法从 Level 0 开始;模型通常会拒绝。仅模型选择往往就把他们推向 Levels 4 到 7,因为那通常是无审查开源变体可用的地方。大多数付费用户可能在日常使用中停留在 Level 4,隐私敏感子集推向 6 或 7。这个类别看起来很大:Character.AI 和 Replika 都在有意义的消费者规模上运营,AI 陪伴应用已成长为消费者 AI 的一个显著子集。这些用户可能比普通聊天机器人用户更关心隐私的一个原因是暴露的成本:偏好资料泄露可能会毁掉婚姻、工作或监护案。可能是 Venice 目前按量计算最大的受众。
这些群体中突出的一点是,他们中很少有人似乎处于漏斗顶部。大多数看起来是被内容政策、合规团队、威胁模型或原则强制或推离轻松路径所塑造的。隐私优先 AI 通常不是人们在前门出现的类别;他们往往是在发现无法留在原来的地方后才到达的。同样的逻辑可以解释两个相邻的细分市场,值得标记但不估算规模:所在司法管辖区可能把他们推离中心化支付和 AI 监控的国际用户,以及早期个人 AI 代理群体,他们的编排数据可以从尊重隐私的后端中受益。
市场规模
Venice 的最终上限取决于可触达市场的规模,而非当前执行情况。正确的框架是推理份额:Venice 销售 AI 推理服务,相关市场是全球推理支出,Venice 的收入是该池子的一部分。
对 2027 年推理市场的独立估算在全球范围内趋同于 1400-1600 亿美元,贝恩、IDC 和麦肯锡的预测大致都在这个区间。即使按 Venice 预计的(我的预测,在估值部分展开)2027 年底 4 亿美元年化运行率计算,Venice 也只占该池子的不到 0.3%,按任何合理的市场定义都是微不足道的份额。作为背景,仅 OpenAI 的 API 业务就估计占据了今天推理支出的个位数百分比,Anthropic 的 API 也在类似范围。Venice 目前的位置远低于即使是中型推理平台所占据的份额。
但 Venice 并不是在争夺整个池子。Venice 的目标是隐私细分切片:需要匿名性、硬件认证隐私、无审查访问或推理过程中司法管辖权选择的用户和企业。这个子集更难精确计算规模,但方向性信号很强。
几股力量正在扩大推理的隐私细分部分:欧洲和亚洲部分地区日益收紧的数据驻留法规,企业与默认闭源实验室产品之间日益增长的合规摩擦,以及基于 TEE 的隐私基础设施的成熟。企业调查持续标记出对 AI 驱动的数据暴露的日益担忧。这些力量单独来看都不快,但它们会叠加。
即使隐私细分路径只占 1400-1600 亿美元 2027 年推理市场的 5-15%,那也是 70-230 亿美元的细分市场。低个位数份额就能让 Venice 达到数亿美元收入,远高于今天的运行率且仍有大量增长空间。中个位数份额能让 Venice 进入十亿美元以上范围。
看跌情况有三个维度。首先,隐私细分云推理市场未能达到有意义的规模,因为超大规模云服务商在其现有平台内提供了足够的隐私选项。Apple PCC、Azure Confidential Computing 和 AWS Bedrock 保密推理都在朝这个方向发展。在这种情况下隐私仍然重要,但它被打包进现有的云和消费者平台,独立的隐私优先市场永远不会大到足以支持独立玩家的规模。