日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給李梅
發(fā)送

0

打造中國版 ChatGPT,國內(nèi)有哪些學(xué)術(shù)力量能搶灘?

本文作者: 李梅 2023-02-21 14:44
導(dǎo)語:誰有實力打造「中國版ChatGPT」?最終能攻上光明頂?shù)膱F(tuán)隊,其實不多。

打造中國版 ChatGPT,國內(nèi)有哪些學(xué)術(shù)力量能搶灘?

作者 | 李梅

編輯 | 陳彩嫻


OpenAI 現(xiàn)已經(jīng)成為全球人工智能領(lǐng)域的追擊目標(biāo)。

繼谷歌獻(xiàn)上「Bard」后,中國科技圈也開始沸騰,原本苦哈哈的自然語言處理科研團(tuán)隊,如今成了大家的香餑餑。一場關(guān)于資本與人才的競爭已經(jīng)拉開。

「打造中國版 ChatGPT」,在王慧文的英雄帖中傳出,一傳十、十傳百,成為中國 AI 從業(yè)者的共同目標(biāo)。

然而,無論近日來關(guān)于 ChatGPT 的討論有多火熱,我們都要直視一個殘酷的現(xiàn)實:在追擊 OpenAI 的這場競技中,最終能攻上光明頂?shù)膱F(tuán)隊并不多。

一方面是成本高昂,「煉」大模型的資金只是打造 ChatGPT 的入場券;另一方面,則是能訓(xùn)練大模型的人才有限。大模型是 OpenAI 打造 ChatGPT 的技術(shù)基石,能否找到適合的人,也極為關(guān)鍵。

大模型必然是一個產(chǎn)學(xué)研合力的方向,ChatGPT 的入局者要想取勝,不僅要有頂尖科學(xué)家,還需要有對政商環(huán)境有理解、有經(jīng)驗的運(yùn)營團(tuán)隊,也要有在資本市場有號召力、愿意 All in 的明星創(chuàng)業(yè)者加入。

本篇旨在從學(xué)術(shù)研究的角度出發(fā),對國內(nèi)各大潛在力量在這一波 ChatGPT 競賽中的位置進(jìn)行盤點(diǎn)。


—— 1 ——
高校力量:清華一騎絕塵


在一眾高校中,清華大學(xué)的位置當(dāng)屬最前。

清華是國內(nèi)自然語言處理領(lǐng)域(NLP)的學(xué)術(shù)研究重地,其 NLP 的研究歷史深厚, 研究隊伍龐大,有唐杰、孫茂松、劉知遠(yuǎn)、黃民烈等知名學(xué)者坐鎮(zhèn),他們近年在語言大模型領(lǐng)域的工作十分突出。而且,各大廠的大模型領(lǐng)頭人中,也有多位是清華子弟,如京東集團(tuán)副總裁何曉冬、華為云人工智能領(lǐng)域首席科學(xué)家田奇等。

梳理下來,清華系追趕這一波 ChatGPT 的潛在力量主要有三支:一是知識工程實驗室(KEG),由李涓子和唐杰帶隊;二是自然語言處理與社會人文計算實驗室(THUNLP),學(xué)術(shù)帶頭人為孫茂松,團(tuán)隊主力劉知遠(yuǎn)是其門下高徒;三是交互式人工智能課題組(CoAI),由朱小燕及其學(xué)生黃民烈共同領(lǐng)導(dǎo)。

清華唐杰

在上一波煉大模型熱潮中,清華大學(xué)計算機(jī)系教授唐杰是最突出的學(xué)術(shù)代表之一。2020 年,他聚合北京高校,領(lǐng)銜研發(fā)了智源研究院的「悟道」1.0 和 2.0 大模型。

打造中國版 ChatGPT,國內(nèi)有哪些學(xué)術(shù)力量能搶灘?

唐杰

同時,唐杰也是一個十分注重產(chǎn)學(xué)研結(jié)合與大模型生態(tài)建設(shè)的學(xué)者。2019 年,依托明星產(chǎn)品AMnier 和知識工程實驗室的技術(shù)成果,唐杰與李涓子帶領(lǐng)成立了智譜 AI?,F(xiàn)公司團(tuán)隊有唐杰的多位學(xué)生,都是參與「悟道」2.0 的主力。

唐杰是數(shù)據(jù)挖掘方向出身,李涓子則是知識圖譜方向著名學(xué)者,這決定了智譜 AI 做大模型的特色是“數(shù)據(jù)+知識”。去年,智譜 AI 發(fā)布了雙語千億大模型 GLM-130B,并以開源開放的形式供研究機(jī)構(gòu)或個人免費(fèi)下載使用。

打造中國版 ChatGPT,國內(nèi)有哪些學(xué)術(shù)力量能搶灘?

GLM-130B 采用了 KEG 實驗室在 2021 年提出的 GLM 模型架構(gòu),在多個任務(wù)上性能優(yōu)于 OpenAI 的 GPT-3 模型。通過模型量化技術(shù),唐杰團(tuán)隊還提高了模型的易用性,降低了計算成本,GLM-130B 可在一臺 A 100 或 V100 服務(wù)器上進(jìn)行推理。

此外,唐杰團(tuán)隊還與多家大企業(yè)建立交流與聯(lián)系,支持企業(yè)開發(fā)大模型,比如阿里的 M6。唐杰的學(xué)生楊植麟是 NLP 創(chuàng)業(yè)公司循環(huán)智能的聯(lián)合創(chuàng)始人,也參與了華為“盤古”大模型的研發(fā)工作。

據(jù)了解,目前智譜 AI 已經(jīng)在研究類 ChatGPT 產(chǎn)品。

清華孫茂松、劉知遠(yuǎn)

從 NLP 的學(xué)科方向上看,清華系中最為“根正苗紅”的一支是孫茂松、劉知遠(yuǎn)團(tuán)隊。

清華大學(xué)自然語言處理與社會人文計算實驗室(THUNLP),是國內(nèi)最早開展 NLP 研究、且極具影響力的科研單位。實驗室于 20 世紀(jì) 70 年代末成立之初,由中國 NLP 開山人物黃昌寧帶領(lǐng),ACL Fellow 孫茂松是他的學(xué)生,劉知遠(yuǎn)則是孫茂松的學(xué)生。

打造中國版 ChatGPT,國內(nèi)有哪些學(xué)術(shù)力量能搶灘?

孫茂松(左)、劉知遠(yuǎn)(右)

THUNLP 在 NLP 領(lǐng)域積累深厚,曾于 2015 年發(fā)布中文詩歌生成系統(tǒng)「九歌」,基于大量人類創(chuàng)作詩歌進(jìn)行訓(xùn)練,在學(xué)界和業(yè)界引起廣泛關(guān)注。

在語言大模型方面,孫茂松、劉知遠(yuǎn)團(tuán)隊從 2018 年跟進(jìn)預(yù)訓(xùn)練范式,2019 年初發(fā)布了 ERNIE 語言模型(與同時期百度版 ERNIE 同名),之后研發(fā)了 CPM 模型,是智源研究院「悟道·文源」的前身。

孫茂松、劉知遠(yuǎn)及其門下畢業(yè)的學(xué)生,在 NLP 和大模型領(lǐng)域已孵化了多個公司。包括涂存超于 2017 年創(chuàng)立的冪律智能,專注于 NLP 在法律領(lǐng)域的應(yīng)用;豈凡超于 2022 年成立的深言科技,致力于以自研中文大模型構(gòu)建工業(yè)級中文信息處理引擎。

另外還有曾國洋去年創(chuàng)立的面壁智能,專注于大模型加速與應(yīng)用落地,公司團(tuán)隊為「悟道·文源」的主干成員。他們聯(lián)合 THUNLP 與智源研究院語言大模型技術(shù)創(chuàng)新中心發(fā)起了 OpenBMB 開源社區(qū),推出了 CPM-Live 百億中文大模型直播訓(xùn)練項目,以及大模型全流程加速工具。

在 ChatGPT這一波中,THUNLP 一脈的優(yōu)勢在于其 NLP 學(xué)術(shù)成果多,且有大模型的研發(fā)經(jīng)驗,挑戰(zhàn)在于工程化和商業(yè)化。

聆心智能黃民烈

ChatGPT 作為一個聊天機(jī)器人,其背后有對話系統(tǒng)技術(shù)做支撐,在這一方向上,清華大學(xué)交互式人工智(CoAI)課題組的研究十分突出。

CoAI 由朱小燕和她的學(xué)生黃民烈坐鎮(zhèn)。黃民烈是對話式人工智能領(lǐng)域的專家,著有《現(xiàn)代自然語言生成》一書,此前也參與了智源「悟道」大模型的研發(fā)。

打造中國版 ChatGPT,國內(nèi)有哪些學(xué)術(shù)力量能搶灘?

黃民烈

黃民烈也是清華系學(xué)者中下場創(chuàng)業(yè)的一員,他于 2021 年創(chuàng)立了「聆心智能」。基于大模型和對話系統(tǒng)的研究基礎(chǔ),黃民烈選擇了心理咨詢聊天機(jī)器人賽道。2022年,他的團(tuán)隊推出了一個名為「AI 烏托邦」的交互機(jī)器人,用戶可以定制 AI 角色,與機(jī)器人進(jìn)行深入對話。

作為國內(nèi)為數(shù)不多有實力訓(xùn)練大模型的團(tuán)隊之一,黃民烈在近日完成 Pre-A 輪融資后稱,相比 ChatGPT,他們更希望將「聆心智能」定位為「中國的 Character AI」——在文本生成的基礎(chǔ)上,為用戶提供情感的陪伴。據(jù)了解,其團(tuán)隊在心理健康領(lǐng)域已積累海量優(yōu)質(zhì)訓(xùn)練數(shù)據(jù),模型參數(shù)量超 30 億。


—— 2 ——
大廠系


在國內(nèi)互聯(lián)網(wǎng)大廠中,在大模型方面領(lǐng)先的第一梯隊包括百度、阿里、京東與華為。除此之外,這一波宣布入場研發(fā) ChatGPT 的互聯(lián)網(wǎng)公司還有騰訊、字節(jié)跳動、快手、360、科大訊飛、網(wǎng)易等。在軍備競賽般的 ChatGPT 研發(fā)中,大廠的鈔能力無疑占有絕對優(yōu)勢。

有行業(yè)人士評價,目前 360 在內(nèi)的一些大廠在類 ChatGPT 技術(shù)上的各項指標(biāo)只能達(dá)到略強(qiáng)于 GPT-2 的水平,與當(dāng)前的 ChatGPT 相比尚有代差的落后,在語言大模型上屬于赤手空拳上陣(如快手、科大訊飛、網(wǎng)易等),所以,類 ChatGPT 測試版的推出時間以及實際效果均存在重大不確定性。

百度文心大模型

在自然語言處理領(lǐng)域,百度是一眾大廠中技術(shù)積累歷史最長的一個。

百度文心大模型的研發(fā)由 CTO 王海峰帶隊。在「文心一言」項目中,王海峰也是擔(dān)任總指揮,另有核心成員吳甜(百度集團(tuán)副總裁、飛槳平臺研發(fā)領(lǐng)銜人物)與吳華(百度技術(shù)委員會主席、百度翻譯技術(shù)團(tuán)隊創(chuàng)始人之一)。

打造中國版 ChatGPT,國內(nèi)有哪些學(xué)術(shù)力量能搶灘?

王海峰

百度是國內(nèi)最早深耕預(yù)訓(xùn)練模型研發(fā)的團(tuán)隊之一,2019 年就發(fā)布了中文效果超越 BERT 的 ERNIE 1.0 和 2.0 模型;2021 年 7 月發(fā)布的 ERNIE 3.0, 在 SuperGLUE 上超越了GPT-3;同年發(fā)布的“鵬程-百度·文心”(ERNIE 3.0 Titan)則是首個知識增強(qiáng)千億級大模型。

打造中國版 ChatGPT,國內(nèi)有哪些學(xué)術(shù)力量能搶灘?

“知識增強(qiáng)”是文心系列所走的技術(shù)路線,即引入語言知識和世界知識等,從大規(guī)模知識圖譜和海量數(shù)據(jù)中融合學(xué)習(xí),以提升大模型的學(xué)習(xí)效率和可解釋性。

2021 年,百度還推出一款名為 PLATO 的對話機(jī)器人,模型基礎(chǔ)是百億參數(shù)對話生成大模型 PLATO-XL。

百度的優(yōu)勢在于其豐富的搜索語料數(shù)據(jù),深耕 AI 研究多年的用戶數(shù)據(jù),并有百度飛槳深度學(xué)習(xí)平臺、自研芯片加持。

微軟與谷歌激烈開戰(zhàn)之后,百度是國內(nèi)最早宣布其研發(fā)類 ChatGPT 產(chǎn)品(「文心一言」)計劃的團(tuán)隊之一。內(nèi)部人員透露,其產(chǎn)品形態(tài)或為獨(dú)立入口,或效仿微軟 Bing、與百度搜索入口聯(lián)通。

阿里通義大模型

阿里巴巴達(dá)摩院從 2021 年入局大模型,參與了智源研究院「悟道·文匯」大模型的研發(fā),后推出純文本預(yù)訓(xùn)練語言模型 PLUG(270億參數(shù)),完全參照 GPT-3 的架構(gòu),集語言理解與生成能力于一身,水平接近 GPT-3。

達(dá)摩院原智能計算實驗室成員楊紅霞(已于去年離職)與清華唐杰團(tuán)隊合作研發(fā)的 M6 多模態(tài)大模型系列,參數(shù)也從百億升至十萬億。

在現(xiàn)任達(dá)摩院副院長周靖人的主導(dǎo)下,達(dá)摩院于去年 9 月推出了目前阿里大模型成果的集大成之作,即“通義”大模型。

打造中國版 ChatGPT,國內(nèi)有哪些學(xué)術(shù)力量能搶灘?

周靖人

「通義」大模型首次統(tǒng)一了模態(tài)、架構(gòu)和任務(wù),其背后的技術(shù)支撐是統(tǒng)一學(xué)習(xí)范式 OFA。

打造中國版 ChatGPT,國內(nèi)有哪些學(xué)術(shù)力量能搶灘?

去年,為推進(jìn)中文大模型的開源生態(tài)建設(shè),達(dá)摩院還推出了 AI 模型開源社區(qū)「魔搭」(Model Scope),在業(yè)界引起巨大反響。

日前,達(dá)摩院已確認(rèn)其正在研發(fā)基于「通義」大模型的阿里版 ChatGPT,除了文本生成外,還具備繪畫功能。據(jù)了解,其類 ChatGPT 產(chǎn)品將和釘釘深度結(jié)合。

京東言犀大模型

京東從 2020 年開始研究 AI 文本生成,用以支持京東商城商品頁面描述的生成。有消息透露,京東商城頁面中,20% 的產(chǎn)品介紹都是由 AI 團(tuán)隊用 NLP 技術(shù)生成。期間,由于 NLP 技術(shù)的整體消沉,研發(fā)受阻,但后來京東又重新重視,推出了言犀大模型。

2018 年從微軟離開加入京東的何曉冬,是現(xiàn)任京東集團(tuán)副總裁、京東 AI 研究院執(zhí)行院長,也是如今京東大模型研究團(tuán)隊的帶頭人。

打造中國版 ChatGPT,國內(nèi)有哪些學(xué)術(shù)力量能搶灘?

何曉冬

2021 年,他與原京東 AI 掌門人周博文(已于 2021 年 11 月離職)帶隊,在京東言犀篇平臺上研發(fā)了領(lǐng)域性模型 K-PLUG。該模型與京東的電商場景緊密結(jié)合,從電商領(lǐng)域特定知識中學(xué)習(xí),能夠自動生成商品文案。

打造中國版 ChatGPT,國內(nèi)有哪些學(xué)術(shù)力量能搶灘?

京東目前還沒有千億級參數(shù)的大模型,K-PLUG 也只有 10 億參數(shù),但這次京東云言犀平臺也宣布入局,將推出 ChatGPT 產(chǎn)品「ChatJD」,且強(qiáng)調(diào)其“產(chǎn)業(yè)版”色彩。

華為盤古大模型

華為的計算資源為其研究大模型提供了天然優(yōu)勢。

華為從 2020 年開始布局大模型,帶頭人是田奇(IEEE Fellow、國際歐亞科學(xué)院院士)。

打造中國版 ChatGPT,國內(nèi)有哪些學(xué)術(shù)力量能搶灘?

田奇

2020 年 3 月,他加入華為云擔(dān)任華為云人工智能領(lǐng)域首席科學(xué)家,同年夏 GPT-3 問世之后,他就立即組建團(tuán)隊,開始了盤古大模型的研發(fā)。華為因此成為 2020 年最早參與大模型競賽的大廠之一。

基于昇騰 AI,與鵬程實驗室、循環(huán)智能合作,華為于 2021 年 4 月發(fā)布了「盤古」系列大模型,包括 中文語言、視覺、多模態(tài)、科學(xué)計算四個大模型。

盤古 NLP 大模型是業(yè)界首個千億級生成和理解中文大模型。在預(yù)訓(xùn)練階段就學(xué)習(xí)了 40 TB 的中文文本數(shù)據(jù),包括細(xì)分行業(yè)的小樣本數(shù)據(jù)。在模型結(jié)構(gòu)上,盤古采用 Encode 和 Decode 的架構(gòu),保證了其在生成和理解上的性能。

打造中國版 ChatGPT,國內(nèi)有哪些學(xué)術(shù)力量能搶灘?

華為有千億模型的研發(fā)經(jīng)驗,也有強(qiáng)大的計算資源,但這次其發(fā)聲甚少,尚未明確是否會研發(fā)類 ChatGPT 產(chǎn)品。


—— 3 ——
學(xué)術(shù)初創(chuàng)派


ChatGPT 帶來的這一波 AI 商業(yè)化熱潮有著極高的技術(shù)壁壘,同時也給了科學(xué)家們下場創(chuàng)業(yè)的巨大機(jī)遇。

如瀾舟科技創(chuàng)始人周明、IDEA 研究院講席科學(xué)家張家興、西湖心辰藍(lán)振忠、銜遠(yuǎn)科技創(chuàng)始人周伯文等人,都是學(xué)術(shù)初創(chuàng)派的代表。

對他們而言,要在未來的 ChatGPT 商業(yè)戰(zhàn)中取勝,還需要補(bǔ)強(qiáng)工程化和市場運(yùn)營的能力。就像張家興和藍(lán)振忠,已經(jīng)在為他們的研發(fā)團(tuán)隊尋找一個 CEO。

此外,我們還能觀察到兩種入局模式:一種是以強(qiáng)大的技術(shù)能力為基礎(chǔ),去彌補(bǔ)商業(yè)化方面的短板;另一種是商業(yè)化經(jīng)驗豐富的大佬下場,吸引技術(shù)人才來組隊。

最終哪種模式能走得更成功,我們拭目以待。

瀾舟科技周明

在上一輪大模型堆參數(shù)的潮流正當(dāng)火熱之時,周明獨(dú)辟蹊徑,為其初創(chuàng)公司瀾舟科技選擇了一條輕量化大模型的路線。

2021 年 6 月,周明成立瀾舟科技,在緊接著的 7 月,他的團(tuán)隊就發(fā)布了十億參數(shù)的「孟子」模型,效果可比肩千億大模型。

這是周明在學(xué)術(shù)界和產(chǎn)業(yè)界兩開花的結(jié)果。

打造中國版 ChatGPT,國內(nèi)有哪些學(xué)術(shù)力量能搶灘?

周明

周明是 NLP 領(lǐng)域極具影響力的華人科學(xué)家之一。他于 1991 年從哈工大博士畢業(yè),是百度 CTO 王海峰的同門師兄弟,哈爾濱工業(yè)大學(xué)教授、NLP 泰斗李生的高徒。博士期間,周明曾研制出中國第一個中英翻譯系統(tǒng)。

畢業(yè)后,周明先是進(jìn)入清華大學(xué)任職任教,并在 1999 年被微軟亞洲研究院(MSRA)創(chuàng)始院長李開復(fù)挖走,2001 年起擔(dān)任 NLP 組主任,后升任微軟亞研副院長。

在 MSRA 期間,周明在 NLP 技術(shù)的產(chǎn)業(yè)化上成果頗多,他參與帶隊的 ACL 頂會論文超過百篇,相關(guān)技術(shù)還應(yīng)用到了 Windows、Office、Azure、微軟小冰等世界級產(chǎn)品中。

2020 年,周明決心以一種新的方式尋求學(xué)術(shù)界與工業(yè)界的合作,就結(jié)束了在微軟工作的 21 年生涯,加入了李開復(fù)創(chuàng)辦的創(chuàng)新工場人工智能工程院,擔(dān)任首席科學(xué)家,并開始孵化一個創(chuàng)業(yè)團(tuán)隊,最終成立瀾舟科技。

據(jù)官方消息,瀾舟科技將憑借其類 ChatGPT 底層技術(shù)的語言大模型,與擁有海量數(shù)據(jù)的中文在線合作,打造國產(chǎn) ChatGPT。周明團(tuán)隊是會繼續(xù)走輕量化模型路線,還是轉(zhuǎn)向做千億級以上大模型來作為技術(shù)支撐,尚不得知。

銜遠(yuǎn)科技周伯文

2022 年,周伯文回到學(xué)術(shù)界,加盟清華大學(xué),擔(dān)任電子工程系長聘教授、清華大學(xué)惠妍講席教授,以及電子系協(xié)同交互智能研究中心主任。

同時,周伯文還是一個新創(chuàng)業(yè)者。2021 年底,他卸任京東集團(tuán)高級副總裁,離職創(chuàng)立了銜遠(yuǎn)科技。

打造中國版 ChatGPT,國內(nèi)有哪些學(xué)術(shù)力量能搶灘?

周伯文

周伯文是中國科學(xué)大學(xué)少年班畢業(yè),博士在科羅拉多大學(xué)波爾德分校就讀。畢業(yè)后他進(jìn)入 IBM 工作,曾任 IBM Research 人工智能基礎(chǔ)研究院(AI Foundations)院長、IBM Watson Group 首席科學(xué)家、IBM 杰出工程師等。2017 年,周伯文加入京東,出任京東集團(tuán)副總裁,負(fù)責(zé)京東的 AI 研究。

NLP、多模態(tài)、人機(jī)對話等都是周伯文深耕多年的領(lǐng)域。他提出的自注意力融合多頭機(jī)制的自然語言表征機(jī)理后來成為Transformer架構(gòu)的核心思想之一,還提出了 AIGC 領(lǐng)域的兩個自然語言生成模型架構(gòu)與算法。2020 年,他當(dāng)選 IEEE Fellow。

在周伯文看來,ChatGPT 的核心進(jìn)展是人的協(xié)同和交互學(xué)習(xí)的提升而非模型變大,而且,ChatGPT 未來必將演變成多模態(tài),這也正是他領(lǐng)導(dǎo)的協(xié)同交互智能研究中心的重點(diǎn)研究方向。

而在銜遠(yuǎn)科技,周伯文也已經(jīng)實現(xiàn)了一些 AIGC 的應(yīng)用,如使用生成式人工智能加速以消費(fèi)者和市場為中心的實時創(chuàng)新、提升 sku 創(chuàng)新成功率。

IDEA 研究院張家興

粵港澳大灣區(qū),除了鵬城實驗室、騰訊,大模型的玩家還有一個,即 IDEA 研究院(全稱「粵港澳大灣區(qū)數(shù)字經(jīng)濟(jì)研究院」,由沈向洋等知名 AI 科學(xué)家在 2020 年創(chuàng)立。

IDEA 研究院的大模型負(fù)責(zé)人是張家興,他也是一位從 MSRA 走出的 AI 科學(xué)家。

打造中國版 ChatGPT,國內(nèi)有哪些學(xué)術(shù)力量能搶灘?

張家興

張家興于 2006 年從北京大學(xué)電子系博士畢業(yè),師從侯士敏(現(xiàn)北大電子系教授)。畢業(yè)后,他先在百度待了一段時間,后加入微軟的 Bing 搜索團(tuán)隊,與周靖人有過合作。之后在 MSRA ,張家興從事系統(tǒng)方向的研究,并從 2012 年轉(zhuǎn)向深度學(xué)習(xí)。

2014 年,張家興加入阿里 iDST(達(dá)摩院前身)團(tuán)隊,一年后又去往螞蟻金服,帶領(lǐng) NLP 技術(shù)團(tuán)隊,將對話機(jī)器人應(yīng)用到金融場景。2020 年,張家興受 360 數(shù)科 CEO 吳海生的邀請,加入 360 數(shù)科任首席科學(xué)家,只待了一年半便離開。

在 MSRA 院長周禮棟的推薦下,張家興加入了 IDEA研究院,擔(dān)任講席科學(xué)家,負(fù)責(zé)認(rèn)知計算與自然語言研究中心。

張家興團(tuán)隊在 AIGC 這一波中一直較為領(lǐng)先,他主導(dǎo)研發(fā)了「封神榜」開源模型系列,并在去年推出了國內(nèi)第一個中文版 Stable Diffusion 模型「太乙」。

ChatGPT 問世之后,張家興在去年底就迅速將團(tuán)隊的大模型研發(fā)轉(zhuǎn)向了 ChatGPT 的對話任務(wù)路線。據(jù)其透露,其團(tuán)隊研發(fā)的類 ChatGPT 模型效果與 ChatGPT 相當(dāng),且僅有 50 億參數(shù),文本生成速度也很快,目前已在內(nèi)測中,近期將公測。

盡管當(dāng)前 50 億參數(shù)的模型已經(jīng)效果很好,但接下來,張家興計劃研發(fā)千億模型支撐的類 ChatGPT 產(chǎn)品,并推動其商業(yè)化。這也是他最近準(zhǔn)備融資、尋找一位 CEO 的原因。

西湖心辰藍(lán)振忠

同樣在為團(tuán)隊尋找 CEO 的,還有西湖心辰的創(chuàng)始人藍(lán)振忠。

打造中國版 ChatGPT,國內(nèi)有哪些學(xué)術(shù)力量能搶灘?

藍(lán)振忠

去年,在眾多國產(chǎn) AI 作畫產(chǎn)品中脫穎而出的「盜夢師」(現(xiàn)改名為「造夢日記」),正是出自藍(lán)振忠團(tuán)隊。

藍(lán)振忠本科從中山大學(xué)畢業(yè),博士在卡內(nèi)基梅隆大學(xué)就讀,期間研究計算機(jī)視覺,后來去谷歌工作時轉(zhuǎn)到自然語言處理方向,依托谷歌的 TPU 資源研發(fā)了著名的輕量化大模型「ALBERT」。

2020 年 6 月,藍(lán)振忠回國加入西湖大學(xué),創(chuàng)立了深度學(xué)習(xí)實驗室,開啟語言與視覺結(jié)合的多模態(tài)研究。

依托西湖大學(xué)的科研資源與先前加入的智源「青源會」,藍(lán)振忠開啟產(chǎn)學(xué)研模式,創(chuàng)立了西湖心辰,先是依托大模型研發(fā)了心理咨詢聊天機(jī)器人「小天」,然后在 2022 年 8 月的 Stable Diffusion 浪潮中首發(fā)國產(chǎn)作畫產(chǎn)品「盜夢師」。

而在 ChatGPT 出來沒多久,西湖心辰就推出了類似的文本生成產(chǎn)品「心辰 Chat」。不同的是,它可以訪問互聯(lián)網(wǎng),而且是多模態(tài)交互,不僅可以生成文本,還可輸出圖像。

與許多學(xué)者出身、下場創(chuàng)業(yè)的人一樣,藍(lán)振忠也深感團(tuán)隊需要一位具有管理經(jīng)驗、資源整合能力強(qiáng)大的 CEO,來一起打造中國版 OpenAI。敬請關(guān)注 AI 科技評論明天推送:《藍(lán)振忠也發(fā)「英雄帖」,中國版 ChatGPT 明星公司尋找 CEO》。(公眾號:雷峰網(wǎng))

預(yù)告:

下一篇,我們將推出創(chuàng)業(yè)者勢力盤點(diǎn)《ChatGPT 創(chuàng)業(yè)群雄逐鹿:陸奇屠龍,號令天下;小川不出,誰與爭鋒》。

(公眾號:雷峰網(wǎng)(公眾號:雷峰網(wǎng))

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

打造中國版 ChatGPT,國內(nèi)有哪些學(xué)術(shù)力量能搶灘?

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說