日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給趙之齊
發(fā)送

0

PPIO創(chuàng)始人姚欣:閑置率高達(dá)八成的國(guó)產(chǎn)GPU,如何盤活成“真算力”?|智算想象力十人談

本文作者: 趙之齊   2026-01-26 10:16
導(dǎo)語(yǔ):從邊緣云到Agent沙箱,PPIO為什么敢押注每一個(gè)“不被看好”的方向?

PPIO創(chuàng)始人姚欣:閑置率高達(dá)八成的國(guó)產(chǎn)GPU,如何盤活成“真算力”?|智算想象力十人談

作者 | 趙之齊

編輯 | 包永剛

2018年,邊緣算力與CDN(內(nèi)容分發(fā)網(wǎng)絡(luò))市場(chǎng)已白熱化,價(jià)格卷到極致。就在這一年,PPIO成立了。他們毅然切入邊緣云領(lǐng)域,直面紅海的競(jìng)爭(zhēng)。

當(dāng)時(shí),創(chuàng)始人姚欣給天使投資人——百川智能創(chuàng)始人王小川、前微軟Azure中國(guó)總裁申元慶——講的創(chuàng)業(yè)邏輯是:

當(dāng)年P(guān)PTV就是整合閑置的算力和資源,建起來(lái)的一套分布式平臺(tái)。我們二十年前就在做C端的算力整合,現(xiàn)在要去做B端,你想,是整合B端難還是C端難?”

在2005年便創(chuàng)立了PPTV、并在2014年將其出售給蘇寧的姚欣,與當(dāng)時(shí)PPTV的首席架構(gòu)師王聞?dòng)钷D(zhuǎn)戰(zhàn)B端算力領(lǐng)域,顯然是值得被信任的。于是,這個(gè)故事被投資者們接受了。

然而,這一路的起步并不如想象中容易。起初,PPIO在“先找供給”還是“先找需求”間久久徘徊,商業(yè)難以閉環(huán),直到疫情導(dǎo)致線上流量激增,才逐漸跑通了這一增長(zhǎng)曲線。

2023年,當(dāng)疫情帶來(lái)的線上流量紅利逐漸消退,GPU市場(chǎng)也開始利潤(rùn)暴漲,H100的高點(diǎn)價(jià)格甚至一度達(dá)到400萬(wàn)元。GPU貿(mào)易賽道火熱之時(shí),姚欣卻拒絕了這門“穩(wěn)賺不賠”的生意,在那個(gè)基礎(chǔ)大模型訓(xùn)練正盛的年代,提出了要“聚焦推理”。

PPIO創(chuàng)始人姚欣:閑置率高達(dá)八成的國(guó)產(chǎn)GPU,如何盤活成“真算力”?|智算想象力十人談

PPIO聯(lián)合創(chuàng)始人兼CEO 姚欣

如今,短短幾年時(shí)間,PPIO的營(yíng)收已經(jīng)實(shí)現(xiàn)指數(shù)級(jí)增長(zhǎng),2024年?duì)I收已達(dá)5.58億。而在今年7月的WAIC(世界人工智能大會(huì)),PPIO又成了國(guó)內(nèi)首個(gè)推出兼容E2B的Agent沙箱的公司——

Agent沙箱作為專為AI Agent場(chǎng)景設(shè)計(jì)的基礎(chǔ)設(shè)施,能為AI Agent提供隔離運(yùn)行環(huán)境,讓Agent在安全、受限的條件下執(zhí)行代碼。由此,防止Agent訪問或篡改系統(tǒng)之外的資源,避免對(duì)系統(tǒng)造成損害。

在整個(gè)研發(fā)過(guò)程中,姚欣感慨,最難的便是“為看不見的需求做技術(shù)”。

而這,也是PPIO這兩年一直在做的事——比行業(yè)走快一步。

如今,PPIO正在沖刺港股IPO。從邊緣云到GPU推理平臺(tái),再到Agent沙箱,PPIO成為了具備全棧技術(shù)能力的AI云服務(wù)商,這些跨度背后是如何考量?在國(guó)內(nèi)云大廠夾擊下,作為創(chuàng)業(yè)公司的他們?nèi)绾瓮粐?/strong>

以下,是雷峰網(wǎng)與姚欣的對(duì)話。


為看不見的需求做技術(shù)

雷峰網(wǎng):你們從2018年創(chuàng)立做云服務(wù),起初的算力做到現(xiàn)在的沙箱,跨度很大,這條路是怎么走下來(lái)的?

姚欣:我們2022年開始進(jìn)入GPU領(lǐng)域,當(dāng)時(shí)AI大語(yǔ)言模型還沒開始,最開始做的是云游戲和云渲染的GPU,這天生就是一個(gè)分布式架構(gòu)。

2023年大語(yǔ)言模型起來(lái)后,整個(gè)市場(chǎng)開始起來(lái)。當(dāng)時(shí)國(guó)內(nèi)某頭部模型廠商發(fā)布了自己的開源模型,但缺少推理平臺(tái),我們就幫著他們?cè)?023年搭建了第一代推理平臺(tái)服務(wù),這是我們的第一個(gè)推理的Infra客戶。

2024年,PPIO就開始在重點(diǎn)聚焦出海,集成了大量開源的模型,把模型API推出一整套MaaS平臺(tái)。

今年年初,PPIO再往上走一層,Agent其實(shí)就類似于PaaS層,相當(dāng)于我們從底層技術(shù)棧一層層長(zhǎng)上來(lái)。

雷峰網(wǎng):在這之中,挑戰(zhàn)主要是什么?

姚欣:最大的挑戰(zhàn)就是,我們是為看不見的需求在做技術(shù)。

做AI Infra或技術(shù)平臺(tái)現(xiàn)在看起來(lái)已經(jīng)普及了,但在2024年做MaaS、或者現(xiàn)在做AI PaaS Agent,用黃仁勛的話講,就是“Zero/Billion dollar company market”,一個(gè)零/億市場(chǎng),現(xiàn)在是0,也許以后就是10億、20億、百億。要為一個(gè)今天還是0的市場(chǎng),提前做技術(shù)儲(chǔ)備、研發(fā)、投入;但如果看到Manus起來(lái)后再開始做沙箱,其實(shí)就已經(jīng)晚了。

雷峰網(wǎng):在2022年決定切入做算力云的時(shí)候,內(nèi)部是怎么去討論這個(gè)市場(chǎng)的?

姚欣:當(dāng)時(shí)還沒看到GPT,我們更多是從公司要打造第二增長(zhǎng)曲線的角度。

在此之前我們第一增長(zhǎng)曲線是基于CPU做的邊緣云,那會(huì)兒主要是抓住了疫情期間在線流量激增帶來(lái)的業(yè)務(wù)需求。我們當(dāng)時(shí)為很多頭部互聯(lián)網(wǎng)公司提供音視頻處理、邊緣計(jì)算和傳輸服務(wù),都是基于傳統(tǒng)CPU和云架構(gòu)。2022年疫情逐漸結(jié)束了,流量慢慢回落,我們就意識(shí)到要開始找第二增長(zhǎng)曲線了。

雷峰網(wǎng):但如何錨定現(xiàn)在這個(gè)方向的呢?

姚欣:我們作為云服務(wù)商,其實(shí)大的思路就是計(jì)算、存儲(chǔ)、傳輸。半年后,ChatGPT開始風(fēng)靡,國(guó)內(nèi)掀起大模型創(chuàng)業(yè)熱潮,看到大模型類企業(yè)快速融資、擴(kuò)張的態(tài)勢(shì),我們就明確將第二增長(zhǎng)曲線定位為AI賽道做AI Infra,從GPU層逐步向上構(gòu)建到今天的PaaS。

雷峰網(wǎng):當(dāng)時(shí)很多人都想做算力貿(mào)易生意,你們是怎么決定要去做分布式算力的路線?

姚欣:我們選擇避過(guò)熱點(diǎn),沒有參與任何倒算力囤卡,這跟整個(gè)公司的價(jià)值觀都有關(guān)系——我們價(jià)值觀第一條叫“價(jià)值創(chuàng)造”,一定要做有技術(shù)附加值的東西。

我們?cè)贕PU領(lǐng)域的商業(yè)模式是整合匯聚大量閑置的分布式算力,再把它變成某種云服務(wù)。我們技術(shù)附加值的體現(xiàn),主要就是把閑置算力token化。

雷峰網(wǎng):你們是怎么找到這些閑散資源的呢?這些資源的持有方會(huì)是誰(shuí)?

姚欣:2022年看到的都是游戲顯卡,用4090、3090做渲染,甚至最開始Stable Diffusion就在4090上面跑的。后來(lái)看到上一代訓(xùn)練的GPU大量閑置,例如2024年大家都開始拿H100做訓(xùn)練,A100被替換,我們就拿閑置的A100來(lái)跑推理。

再往后又看到很多國(guó)產(chǎn)GPU用不起來(lái),有的國(guó)產(chǎn)GPU智算中心利用率只有10%-20%,我們就又開始做國(guó)產(chǎn)GPU和模型推理加速框架的適配。今年我們平臺(tái)上就有很多頭部廠商的國(guó)產(chǎn)GPU。

雷峰網(wǎng):所以你們一方面是用那些已經(jīng)被時(shí)代選擇淘汰了的算力,另一方面是國(guó)產(chǎn)算力,而且對(duì)標(biāo)推理市場(chǎng),沒有去碰算力訓(xùn)練這一塊。

姚欣:對(duì),因?yàn)橛?xùn)練和推理的任務(wù)指標(biāo)不一樣。一個(gè)模型比別人先推出是很重要的,所以訓(xùn)練永遠(yuǎn)用最先進(jìn)的芯片;但推理不一樣,推理要求極致的成本性價(jià)比,結(jié)合我們獨(dú)特的分布式閑置資源整合的能力,降低創(chuàng)業(yè)者使用算力門檻。


不綁定+開源:AI開發(fā)者的“反鎖定”需求

雷峰網(wǎng):PPIO在WAIC上發(fā)布了沙箱,似乎是國(guó)內(nèi)首發(fā)的Agent沙箱。為什么會(huì)在這個(gè)時(shí)間點(diǎn)上去推呢?

姚欣:要加一個(gè)補(bǔ)充,這是我們“在中國(guó)”首發(fā)E2B兼容的Agent沙箱,在海外已經(jīng)提前發(fā)布了。

我們?cè)?023年選擇出海,在海外優(yōu)先尋找一些戰(zhàn)略客戶或早期的新技術(shù),和他們一起快速打磨和迭代,推動(dòng)底層AI Infra開發(fā)技術(shù)棧的創(chuàng)新。

雷峰網(wǎng):現(xiàn)在沙箱進(jìn)展如何?

姚欣:目前我們?cè)诤M饴涞乇葒?guó)內(nèi)快一些,PPIO推沙箱對(duì)標(biāo)海外E2B,他們?cè)诠韫冉衲暌荒暧昧看蟾艥q了400多倍,從4萬(wàn)多到1600多萬(wàn)。國(guó)內(nèi)過(guò)去的模型合作伙伴像是千問、Kimi、智譜等等,這幾家模型能力基本可以追平年初的Anthropic,所以我判斷未來(lái)幾個(gè)月中國(guó)版的Manus或Cursor可能會(huì)更快速增長(zhǎng)。

雷峰網(wǎng):在你們推出沙箱后,大廠也在跟進(jìn)了,會(huì)擔(dān)心和大廠之間的競(jìng)爭(zhēng)嗎?你們和大廠的差異性在哪里?

姚欣:從我創(chuàng)辦第一天,投資人就開始問我們這個(gè)問題,但現(xiàn)在到了Agent或PaaS這一層,話題就開始有趣起來(lái)了。

之前做云計(jì)算,在IaaS層,說(shuō)白了就是拼資源、拼規(guī)模,是一個(gè)Heavy Capex(資本性支出)的游戲。到PaaS層,雖然巨頭影響力還是巨大的,因?yàn)樗麄冊(cè)瓉?lái)的客戶積累和生態(tài)依然是最強(qiáng)的,但到了Agent Infra這一層,云大廠的影響力和PC以及移動(dòng)時(shí)代相比,是大幅削弱的。

雷峰網(wǎng):為什么有這個(gè)觀察?

姚欣:具體是以下這幾個(gè)原因。

第一,GPU的Infra架構(gòu)是在過(guò)去三年時(shí)間里突然冒出來(lái)的,不像CPU有將近20年發(fā)展,所以大廠很難有很明顯的先發(fā)優(yōu)勢(shì)或很強(qiáng)技術(shù)積累,今天大廠真正做沙箱這件事,跟PPIO可能也在差不多一個(gè)體量。

第二,這波AI成本太高,所以各家公司包括開發(fā)者,第一天設(shè)計(jì)自己的架構(gòu)時(shí)就是跨云、多云或者可以靈活調(diào)用的架構(gòu),追求一整套標(biāo)準(zhǔn)化的接口,不會(huì)跟某家廠商特別綁定。我們就把API能力做好,作為一個(gè)組件;與此同時(shí),也擁抱開源。

這代AI開發(fā)者不像上個(gè)時(shí)代的移動(dòng)互聯(lián)網(wǎng)開發(fā)者,選擇某個(gè)云后就在上面越存越多,慢慢配套一堆私有化的組件調(diào)用、或者專有組件調(diào)用,牢牢被它綁住了。我們?cè)趪?guó)內(nèi)和差不多四五十款主流的開源框架有對(duì)接合作,而且也沒有想把GPU和CPU綁在一起銷售,就是想基于開源和可遷移性去方便開發(fā)者

雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng)):所以現(xiàn)在的沙箱主要目標(biāo)市場(chǎng)就都是開發(fā)者嗎?

姚欣:其實(shí)不光是沙箱,包括提供的API、很多GPU的Serverless等等,我們過(guò)去兩年主要都是為了AI Startup和開發(fā)者兩個(gè)人群提供服務(wù)。

雷峰網(wǎng):這個(gè)群體的市場(chǎng)足夠大嗎?

姚欣:這些開發(fā)者和新應(yīng)用,在用量側(cè)其實(shí)比很多傳統(tǒng)互聯(lián)網(wǎng)巨頭高很多。前段時(shí)間Sam Altman也說(shuō)了,Open AI的Top20消耗里,70%以上都是AI新應(yīng)用,我們想爭(zhēng)取這種全新增量用戶。

而且過(guò)去幾年有個(gè)特點(diǎn),新的AI創(chuàng)業(yè)公司和應(yīng)用公司出來(lái),他們做一件事的token消耗,可能比上個(gè)應(yīng)用直接提升10倍甚至100倍。比如Manus執(zhí)行一個(gè)任務(wù),調(diào)用的token可能是幾十萬(wàn)次.

今年7月,Manus還發(fā)布了個(gè)Wide Research,一個(gè)任務(wù)同時(shí)開100個(gè)Agent在跑,這100個(gè)Agent同時(shí)得出一個(gè)結(jié)果、最后返回一個(gè)最佳解,這個(gè)消耗量就相當(dāng)于再增長(zhǎng)100倍。


AI賭的是下一代

雷峰網(wǎng):你認(rèn)為分布式算力廠商的優(yōu)勢(shì)在哪里?

姚欣:第一是節(jié)點(diǎn)數(shù)量要足夠多、任務(wù)需求也要多。我們的優(yōu)勢(shì)在于技術(shù)棧和傳統(tǒng)云公司完全不一樣:我們從第一天就是在分散、碎片、異構(gòu)的基礎(chǔ)設(shè)施上建立起來(lái)的云服務(wù),所以叫“分布式云”,但傳統(tǒng)大云廠的技術(shù)棧,是建立在集中式、大規(guī)模標(biāo)準(zhǔn)的數(shù)據(jù)中心上做的虛擬化加技術(shù)棧。

很多企業(yè)級(jí)算力也是用這種方式整合起來(lái)。有些互聯(lián)網(wǎng)企業(yè),比如做電商的,旺季在雙十一、618,但上半年利用率其實(shí)很低,周一到周五還會(huì)比周末低,他們就很需要在閑置時(shí)把這些資源用起來(lái)。

雷峰網(wǎng):目前PPIO有4000多個(gè)節(jié)點(diǎn),這些節(jié)點(diǎn)是如何分布的?

姚欣:這些節(jié)點(diǎn)很多是零售型IDC,他們隨時(shí)可以把機(jī)器在閑置期內(nèi)托管到我們平臺(tái)上供調(diào)用,相當(dāng)于有這么多“滴滴司機(jī)”隨時(shí)待命,但不代表他們24小時(shí)都在服務(wù)。

真正要調(diào)用時(shí),就要看客戶場(chǎng)景,有的應(yīng)用場(chǎng)景追求低延時(shí),會(huì)就近調(diào)用;有些比較成本敏感,就可以比如給北京的用戶調(diào)新疆的資源——新疆電費(fèi)是北京的1/3,甚至全球范圍內(nèi),東半球的白天是西半球的凌晨,可以跨更大的區(qū)域調(diào)度。

雷峰網(wǎng):最開始分布式算力云的客戶也是這些開發(fā)者相關(guān)嗎?

姚欣:不是,分布式CPU云是頭部的互聯(lián)網(wǎng)那個(gè)公司。但到了GPU云時(shí)代,主要是以AI創(chuàng)業(yè)者和開發(fā)者為主。

雷峰網(wǎng):為什么有這套策略的轉(zhuǎn)變?

姚欣:我們現(xiàn)在更想和客戶一起聯(lián)合打磨未來(lái)新產(chǎn)品,所以選擇開發(fā)者和AI創(chuàng)業(yè)公司, AI時(shí)代不一樣,AI是賭下一代,下一個(gè)字節(jié)、下一個(gè)抖音在哪里?現(xiàn)在還沒有出來(lái)。

雷峰網(wǎng):那未來(lái)對(duì)分布式算力的挑戰(zhàn)會(huì)在哪里?

姚欣:還是在需求側(cè),技術(shù)側(cè)和供給側(cè)不擔(dān)心,就看需求側(cè)什么時(shí)候能有大規(guī)模爆發(fā),尤其是重視時(shí)延敏感的需求。


創(chuàng)業(yè)成果是認(rèn)知的變現(xiàn)

雷峰網(wǎng):聽起來(lái)是2020年疫情需求起來(lái)后,邊緣CPU才真正利用起來(lái)。但你們?cè)?018年就已經(jīng)開始做這個(gè)業(yè)務(wù),最開始遇到了什么挑戰(zhàn)?

姚欣:最早的挑戰(zhàn)就是“雞生蛋”還是“蛋生雞”的問題,或者說(shuō),所有平臺(tái)生意的第一點(diǎn)都是:先抓供給還是先抓需求。

抓需求吧,大家說(shuō)你技術(shù)不成熟、網(wǎng)絡(luò)覆蓋廣度不夠、沒有全國(guó)節(jié)點(diǎn);但是到處找全國(guó)節(jié)點(diǎn),大家就會(huì)問你需求呢?

當(dāng)年這個(gè)平臺(tái)能冷啟動(dòng),很大原因是2020年疫情爆發(fā),需求超出預(yù)期,我們才能有技術(shù)打磨、鎖定更多供應(yīng)商。到今天GPU這張網(wǎng)絡(luò)也是類似的,過(guò)去一年我們平臺(tái)token消耗增長(zhǎng)了一百倍以上,推理時(shí)代這種極其陡峭的高增長(zhǎng)曲線才能把GPU網(wǎng)絡(luò)拉起來(lái),所以我們現(xiàn)在也在找下一個(gè)更高增長(zhǎng)爆發(fā)的新需求。

雷峰網(wǎng):那當(dāng)時(shí)PPIO成立,在CDN紅海里做邊緣云,是怎么說(shuō)服王小川、申元慶等人投資的?畢竟他們都是很懂云的人。

姚欣:2018年,第一波AI計(jì)算機(jī)視覺很熱,有大量算力需求、也有很多算力被閑置,尤其很多數(shù)字新基建IDC,建完沒用起來(lái)。我跟他們講的故事很簡(jiǎn)單:我們二十年前就在做C端的算力整合(指PPTV),現(xiàn)在要去做B端的算力整合,你們想想是整合B端難還是C端難?

技術(shù)上肯定是C端更難更復(fù)雜,商業(yè)模式上B端也可能更成熟一些,后來(lái)這個(gè)故事大家就聽到了,覺得我們團(tuán)隊(duì)是做PPTV分布式計(jì)算、分布式網(wǎng)絡(luò)出身,調(diào)度能力足夠強(qiáng)。

雷峰網(wǎng):現(xiàn)在回頭看,在PPIO創(chuàng)業(yè)的過(guò)程中,您覺得自己做得很對(duì)的一個(gè)判斷是什么?

姚欣:2023年我們就提出聚焦推理、聚焦開源、海外優(yōu)先,這個(gè)認(rèn)知當(dāng)時(shí)比同行要早很多,當(dāng)時(shí)開源模型還沒幾個(gè)。現(xiàn)在能抓住這波DeepSeek機(jī)會(huì)、以及海外這么多知名開發(fā)者,和三年前這個(gè)判斷非常關(guān)鍵。我們?cè)谡麄€(gè)戰(zhàn)略趨勢(shì)和方向的判斷上,還是比當(dāng)年做PPTV強(qiáng)太多。

雷峰網(wǎng):回頭看,您感覺創(chuàng)業(yè)重要的能力是什么樣的?

姚欣:我覺得最重要的就是認(rèn)知能力,如何不斷學(xué)習(xí)、快速適應(yīng),并不斷提升認(rèn)知能力的上限。我們公司是動(dòng)漫文化,我是海賊王路飛,海賊王里有惡魔果實(shí),如果選一個(gè)果實(shí),我最想吃的是學(xué)習(xí)果實(shí),因?yàn)閷?duì)于一個(gè)創(chuàng)始人來(lái)講,最重要的就是認(rèn)知能力,包括我做投資人的三四年里來(lái)看,最后的成果都是認(rèn)知變現(xiàn)。

這二十年間,技術(shù)的發(fā)展也經(jīng)歷過(guò)多個(gè)周期,我很清楚下一個(gè)周期要發(fā)生什么,加上我總是到處飛,去看最先進(jìn)的模型和技術(shù)生態(tài)、跟全球最新銳的創(chuàng)業(yè)者在一起,我們對(duì)技術(shù)和商業(yè)的結(jié)合、對(duì)全棧的理解可能會(huì)比業(yè)內(nèi)其他競(jìng)爭(zhēng)對(duì)手更快更強(qiáng)。

雷峰網(wǎng):那現(xiàn)在會(huì)有什么新的判斷嗎?

姚欣:Agent Infra會(huì)是下一代的AIOS。

作者長(zhǎng)期關(guān)注半導(dǎo)體、算力上下游等方向,歡迎添加作者微信 Ericazhao23 交流。


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄