“國(guó)產(chǎn)Sora”Vidu全球上線百度百舸提供視頻大模型訓(xùn)練支持

本文作者：董子博

2024-07-31 19:04

導(dǎo)語(yǔ)：中國(guó)的AI視頻賽道，又來(lái)了一個(gè)強(qiáng)力競(jìng)爭(zhēng)者。

7月30日，作為Sora全球首個(gè)挑戰(zhàn)者，且是國(guó)內(nèi)首個(gè)純自研的視頻大模型Vidu（www.vidu.studio）正式上線。生數(shù)科技宣布，目前Vidu無(wú)需申請(qǐng)，用戶(hù)直接用郵箱注冊(cè)即可上手體驗(yàn)。

生數(shù)科技作為國(guó)內(nèi)最早布局多模態(tài)通用大模型的團(tuán)隊(duì)之一，今年4月聯(lián)合清華大學(xué)發(fā)布了國(guó)內(nèi)首款全面對(duì)標(biāo)OpenAI Sora的視頻大模型Vidu。自4月底首次亮相以來(lái)，Vidu憑借媲美Sora的文生長(zhǎng)視頻能力，迅速在國(guó)內(nèi)外引起廣泛關(guān)注。此次Vidu全面開(kāi)放了文生視頻、圖生視頻兩大功能，提供4s和8s兩種時(shí)長(zhǎng)選擇，分辨率最高達(dá)1080P。

在效果上，Vidu不僅延續(xù)了四月份展示的高動(dòng)態(tài)性、高逼真度、高一致性等優(yōu)勢(shì)，還在上線版本中新增了角色一致性（Character To Video）、動(dòng)漫風(fēng)格、文字與特效畫(huà)面生成等特色能力。同時(shí)，在影響用戶(hù)體驗(yàn)的推理速度層面，Vidu實(shí)現(xiàn)了業(yè)界最快的實(shí)測(cè)推理速度，生成一段4秒片段只需30秒。而市面上的主流AI視頻工具在生成4秒左右的視頻片段時(shí)，用戶(hù)通常需要等待1到5分鐘，甚至更長(zhǎng)。 Vidu的高效推理不僅為用戶(hù)帶來(lái)了接近于無(wú)縫的創(chuàng)作體驗(yàn)，更短的處理時(shí)間還意味著它能夠輕松應(yīng)對(duì)大量用戶(hù)的需求，提供個(gè)性化的服務(wù)。

眾所周知，視頻生成產(chǎn)品的開(kāi)發(fā)周期長(zhǎng)且費(fèi)用高昂。而從發(fā)布到上線僅僅三個(gè)月，生數(shù)科技就完成了對(duì)Vidu的快速迭代，實(shí)現(xiàn)了高質(zhì)量的視頻生成效果，這離不開(kāi)Vidu研發(fā)團(tuán)隊(duì)在模型高效訓(xùn)練方面積累的工程化經(jīng)驗(yàn)。密集而快節(jié)奏的模型訓(xùn)練任務(wù)，不僅需要大規(guī)模的算力，還需要從數(shù)據(jù)準(zhǔn)備到模型訓(xùn)練、再到模型推理的全鏈路保障。

Vidu在模型訓(xùn)練層面采用了百度百舸·AI異構(gòu)計(jì)算平臺(tái)。百舸是百度智能云基于過(guò)去多年在 AI 方面的沉淀，以GPU為核心搭建的異構(gòu)計(jì)算平臺(tái)，更適合大模型訓(xùn)練，保障模型訓(xùn)練的穩(wěn)定性和效率。

在提升模型訓(xùn)練效率方面，百舸可以把不同地點(diǎn)、不同規(guī)模、不同集群的算力統(tǒng)一管理起來(lái)，通過(guò)芯片性能優(yōu)化、自動(dòng)芯片選型、潮汐混部這些經(jīng)驗(yàn)和技術(shù)，大幅提升智能算力效能，萬(wàn)卡集群上的模型有效訓(xùn)練時(shí)長(zhǎng)占比超過(guò)98.8%，線性加速比和帶寬有效性均超過(guò)了95%，是業(yè)界領(lǐng)先的算力效能。

在提升模型訓(xùn)練穩(wěn)定性方面，百舸提供了豐富的運(yùn)維和可觀測(cè)工具以及容錯(cuò)保障能力，提升了大規(guī)模集群長(zhǎng)期運(yùn)行的穩(wěn)定性，降低因?yàn)楣收蠈?dǎo)致訓(xùn)推任務(wù)異常終止的概率，減少業(yè)務(wù)損失。

同時(shí)，百舸支持混合多芯，兼容昆侖芯、昇騰、海光DCU、英偉達(dá)、英特爾等國(guó)內(nèi)外主流AI芯片，支持同一智算集群中混合使用不同廠商芯片，最大程度上屏蔽硬件之間差異，幫助企業(yè)擺脫單一芯片依賴(lài)，實(shí)現(xiàn)更優(yōu)的成本，保證更有彈性的供應(yīng)鏈。在多芯混合訓(xùn)練任務(wù)中，百舸能夠?qū)涡酒寐?、芯片間通信效率、集群整體效能發(fā)揮到極致，百卡規(guī)模性能損失不超過(guò)3%，千卡規(guī)模性能損失不超過(guò)5%，均為國(guó)內(nèi)領(lǐng)先水平。

百舸高效、穩(wěn)定、混合多芯等特點(diǎn)能夠幫助生數(shù)科技實(shí)現(xiàn)大模型開(kāi)發(fā)的“快、穩(wěn)、省”，助力生數(shù)科技短時(shí)間低成本完成大模型的業(yè)務(wù)上線。目前，百舸已經(jīng)在互聯(lián)網(wǎng)、教育、汽車(chē)、生命科學(xué)等行業(yè)有了廣泛的落地實(shí)踐，幫助行業(yè)客戶(hù)實(shí)現(xiàn)大模型應(yīng)用的快速落地。

未來(lái)，生數(shù)科技將不斷基于百度百舸·AI異構(gòu)算力計(jì)算平臺(tái)持續(xù)訓(xùn)練、提升模型能力，并逐步通過(guò)百度智能云千帆平臺(tái)開(kāi)放模型服務(wù)。

雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

董子博

編輯

發(fā)私信

當(dāng)月熱門(mén)文章

“國(guó)產(chǎn)Sora”Vidu全球上線 百度百舸提供視頻大模型訓(xùn)練支持

“國(guó)產(chǎn)Sora”Vidu全球上線百度百舸提供視頻大模型訓(xùn)練支持