日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

<style id="5jkc3"><progress id="5jkc3"><output id="5jkc3"></output></progress></style>

<thead id="wjm5s"><sup id="wjm5s"></sup></thead>

<rt id="wjm5s"><delect id="wjm5s"></delect></rt>

<ruby id="wjm5s"></ruby>

您正在使用IE低版瀏覽器，為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn)，強(qiáng)烈建議使用更快更安全的瀏覽器

此為臨時(shí)鏈接，僅用于文章預(yù)覽，將在時(shí)失效

人工智能正文

發(fā)私信給李梅

發(fā)送

0

打造中國(guó)版 ChatGPT，國(guó)內(nèi)有哪些學(xué)術(shù)力量能搶灘？

本文作者：李梅

2023-02-21 14:44

導(dǎo)語(yǔ)：誰(shuí)有實(shí)力打造「中國(guó)版ChatGPT」？最終能攻上光明頂?shù)膱F(tuán)隊(duì)，其實(shí)不多。

打造中國(guó)版 ChatGPT，國(guó)內(nèi)有哪些學(xué)術(shù)力量能搶灘？

作者 | 李梅

編輯 | 陳彩嫻

OpenAI 現(xiàn)已經(jīng)成為全球人工智能領(lǐng)域的追擊目標(biāo)。

繼谷歌獻(xiàn)上「Bard」后，中國(guó)科技圈也開(kāi)始沸騰，原本苦哈哈的自然語(yǔ)言處理科研團(tuán)隊(duì)，如今成了大家的香餑餑。一場(chǎng)關(guān)于資本與人才的競(jìng)爭(zhēng)已經(jīng)拉開(kāi)。

「打造中國(guó)版 ChatGPT」，在王慧文的英雄帖中傳出，一傳十、十傳百，成為中國(guó) AI 從業(yè)者的共同目標(biāo)。

然而，無(wú)論近日來(lái)關(guān)于 ChatGPT 的討論有多火熱，我們都要直視一個(gè)殘酷的現(xiàn)實(shí)：在追擊 OpenAI 的這場(chǎng)競(jìng)技中，最終能攻上光明頂?shù)膱F(tuán)隊(duì)并不多。

一方面是成本高昂，「煉」大模型的資金只是打造 ChatGPT 的入場(chǎng)券；另一方面，則是能訓(xùn)練大模型的人才有限。大模型是 OpenAI 打造 ChatGPT 的技術(shù)基石，能否找到適合的人，也極為關(guān)鍵。

大模型必然是一個(gè)產(chǎn)學(xué)研合力的方向，ChatGPT 的入局者要想取勝，不僅要有頂尖科學(xué)家，還需要有對(duì)政商環(huán)境有理解、有經(jīng)驗(yàn)的運(yùn)營(yíng)團(tuán)隊(duì)，也要有在資本市場(chǎng)有號(hào)召力、愿意 All in 的明星創(chuàng)業(yè)者加入。

本篇旨在從學(xué)術(shù)研究的角度出發(fā)，對(duì)國(guó)內(nèi)各大潛在力量在這一波 ChatGPT 競(jìng)賽中的位置進(jìn)行盤點(diǎn)。

—— 1 ——
高校力量：清華一騎絕塵

在一眾高校中，清華大學(xué)的位置當(dāng)屬最前。

清華是國(guó)內(nèi)自然語(yǔ)言處理領(lǐng)域（NLP）的學(xué)術(shù)研究重地，其 NLP 的研究歷史深厚，研究隊(duì)伍龐大，有唐杰、孫茂松、劉知遠(yuǎn)、黃民烈等知名學(xué)者坐鎮(zhèn)，他們近年在語(yǔ)言大模型領(lǐng)域的工作十分突出。而且，各大廠的大模型領(lǐng)頭人中，也有多位是清華子弟，如京東集團(tuán)副總裁何曉冬、華為云人工智能領(lǐng)域首席科學(xué)家田奇等。

梳理下來(lái)，清華系追趕這一波 ChatGPT 的潛在力量主要有三支：一是知識(shí)工程實(shí)驗(yàn)室（KEG），由李涓子和唐杰帶隊(duì)；二是自然語(yǔ)言處理與社會(huì)人文計(jì)算實(shí)驗(yàn)室（THUNLP），學(xué)術(shù)帶頭人為孫茂松，團(tuán)隊(duì)主力劉知遠(yuǎn)是其門下高徒；三是交互式人工智能課題組（CoAI），由朱小燕及其學(xué)生黃民烈共同領(lǐng)導(dǎo)。

清華唐杰

在上一波煉大模型熱潮中，清華大學(xué)計(jì)算機(jī)系教授唐杰是最突出的學(xué)術(shù)代表之一。2020 年，他聚合北京高校，領(lǐng)銜研發(fā)了智源研究院的「悟道」1.0 和 2.0 大模型。

打造中國(guó)版 ChatGPT，國(guó)內(nèi)有哪些學(xué)術(shù)力量能搶灘？

唐杰

同時(shí)，唐杰也是一個(gè)十分注重產(chǎn)學(xué)研結(jié)合與大模型生態(tài)建設(shè)的學(xué)者。2019 年，依托明星產(chǎn)品AMnier 和知識(shí)工程實(shí)驗(yàn)室的技術(shù)成果，唐杰與李涓子帶領(lǐng)成立了智譜 AI?，F(xiàn)公司團(tuán)隊(duì)有唐杰的多位學(xué)生，都是參與「悟道」2.0 的主力。

唐杰是數(shù)據(jù)挖掘方向出身，李涓子則是知識(shí)圖譜方向著名學(xué)者，這決定了智譜 AI 做大模型的特色是“數(shù)據(jù)+知識(shí)”。去年，智譜 AI 發(fā)布了雙語(yǔ)千億大模型 GLM-130B，并以開(kāi)源開(kāi)放的形式供研究機(jī)構(gòu)或個(gè)人免費(fèi)下載使用。

打造中國(guó)版 ChatGPT，國(guó)內(nèi)有哪些學(xué)術(shù)力量能搶灘？

GLM-130B 采用了 KEG 實(shí)驗(yàn)室在 2021 年提出的 GLM 模型架構(gòu)，在多個(gè)任務(wù)上性能優(yōu)于 OpenAI 的 GPT-3 模型。通過(guò)模型量化技術(shù)，唐杰團(tuán)隊(duì)還提高了模型的易用性，降低了計(jì)算成本，GLM-130B 可在一臺(tái) A 100 或 V100 服務(wù)器上進(jìn)行推理。

此外，唐杰團(tuán)隊(duì)還與多家大企業(yè)建立交流與聯(lián)系，支持企業(yè)開(kāi)發(fā)大模型，比如阿里的 M6。唐杰的學(xué)生楊植麟是 NLP 創(chuàng)業(yè)公司循環(huán)智能的聯(lián)合創(chuàng)始人，也參與了華為“盤古”大模型的研發(fā)工作。

據(jù)了解，目前智譜 AI 已經(jīng)在研究類 ChatGPT 產(chǎn)品。

清華孫茂松、劉知遠(yuǎn)

從 NLP 的學(xué)科方向上看，清華系中最為“根正苗紅”的一支是孫茂松、劉知遠(yuǎn)團(tuán)隊(duì)。

清華大學(xué)自然語(yǔ)言處理與社會(huì)人文計(jì)算實(shí)驗(yàn)室（THUNLP），是國(guó)內(nèi)最早開(kāi)展 NLP 研究、且極具影響力的科研單位。實(shí)驗(yàn)室于 20 世紀(jì) 70 年代末成立之初，由中國(guó) NLP 開(kāi)山人物黃昌寧帶領(lǐng)，ACL Fellow 孫茂松是他的學(xué)生，劉知遠(yuǎn)則是孫茂松的學(xué)生。

打造中國(guó)版 ChatGPT，國(guó)內(nèi)有哪些學(xué)術(shù)力量能搶灘？

孫茂松（左）、劉知遠(yuǎn)（右）

THUNLP 在 NLP 領(lǐng)域積累深厚，曾于 2015 年發(fā)布中文詩(shī)歌生成系統(tǒng)「九歌」，基于大量人類創(chuàng)作詩(shī)歌進(jìn)行訓(xùn)練，在學(xué)界和業(yè)界引起廣泛關(guān)注。

在語(yǔ)言大模型方面，孫茂松、劉知遠(yuǎn)團(tuán)隊(duì)從 2018 年跟進(jìn)預(yù)訓(xùn)練范式，2019 年初發(fā)布了 ERNIE 語(yǔ)言模型（與同時(shí)期百度版 ERNIE 同名），之后研發(fā)了 CPM 模型，是智源研究院「悟道·文源」的前身。

孫茂松、劉知遠(yuǎn)及其門下畢業(yè)的學(xué)生，在 NLP 和大模型領(lǐng)域已孵化了多個(gè)公司。包括涂存超于 2017 年創(chuàng)立的冪律智能，專注于 NLP 在法律領(lǐng)域的應(yīng)用；豈凡超于 2022 年成立的深言科技，致力于以自研中文大模型構(gòu)建工業(yè)級(jí)中文信息處理引擎。

另外還有曾國(guó)洋去年創(chuàng)立的面壁智能，專注于大模型加速與應(yīng)用落地，公司團(tuán)隊(duì)為「悟道·文源」的主干成員。他們聯(lián)合 THUNLP 與智源研究院語(yǔ)言大模型技術(shù)創(chuàng)新中心發(fā)起了 OpenBMB 開(kāi)源社區(qū)，推出了 CPM-Live 百億中文大模型直播訓(xùn)練項(xiàng)目，以及大模型全流程加速工具。

在 ChatGPT這一波中，THUNLP 一脈的優(yōu)勢(shì)在于其 NLP 學(xué)術(shù)成果多，且有大模型的研發(fā)經(jīng)驗(yàn)，挑戰(zhàn)在于工程化和商業(yè)化。

聆心智能黃民烈

ChatGPT 作為一個(gè)聊天機(jī)器人，其背后有對(duì)話系統(tǒng)技術(shù)做支撐，在這一方向上，清華大學(xué)交互式人工智（CoAI）課題組的研究十分突出。

CoAI 由朱小燕和她的學(xué)生黃民烈坐鎮(zhèn)。黃民烈是對(duì)話式人工智能領(lǐng)域的專家，著有《現(xiàn)代自然語(yǔ)言生成》一書，此前也參與了智源「悟道」大模型的研發(fā)。

打造中國(guó)版 ChatGPT，國(guó)內(nèi)有哪些學(xué)術(shù)力量能搶灘？

黃民烈

黃民烈也是清華系學(xué)者中下場(chǎng)創(chuàng)業(yè)的一員，他于 2021 年創(chuàng)立了「聆心智能」?；诖竽Ｐ秃蛯?duì)話系統(tǒng)的研究基礎(chǔ)，黃民烈選擇了心理咨詢聊天機(jī)器人賽道。2022年，他的團(tuán)隊(duì)推出了一個(gè)名為「AI 烏托邦」的交互機(jī)器人，用戶可以定制 AI 角色，與機(jī)器人進(jìn)行深入對(duì)話。

作為國(guó)內(nèi)為數(shù)不多有實(shí)力訓(xùn)練大模型的團(tuán)隊(duì)之一，黃民烈在近日完成 Pre-A 輪融資后稱，相比 ChatGPT，他們更希望將「聆心智能」定位為「中國(guó)的 Character AI」——在文本生成的基礎(chǔ)上，為用戶提供情感的陪伴。據(jù)了解，其團(tuán)隊(duì)在心理健康領(lǐng)域已積累海量?jī)?yōu)質(zhì)訓(xùn)練數(shù)據(jù)，模型參數(shù)量超 30 億。

—— 2 ——
大廠系

在國(guó)內(nèi)互聯(lián)網(wǎng)大廠中，在大模型方面領(lǐng)先的第一梯隊(duì)包括百度、阿里、京東與華為。除此之外，這一波宣布入場(chǎng)研發(fā) ChatGPT 的互聯(lián)網(wǎng)公司還有騰訊、字節(jié)跳動(dòng)、快手、360、科大訊飛、網(wǎng)易等。在軍備競(jìng)賽般的 ChatGPT 研發(fā)中，大廠的鈔能力無(wú)疑占有絕對(duì)優(yōu)勢(shì)。

有行業(yè)人士評(píng)價(jià)，目前 360 在內(nèi)的一些大廠在類 ChatGPT 技術(shù)上的各項(xiàng)指標(biāo)只能達(dá)到略強(qiáng)于 GPT-2 的水平，與當(dāng)前的 ChatGPT 相比尚有代差的落后，在語(yǔ)言大模型上屬于赤手空拳上陣（如快手、科大訊飛、網(wǎng)易等），所以，類 ChatGPT 測(cè)試版的推出時(shí)間以及實(shí)際效果均存在重大不確定性。

百度文心大模型

在自然語(yǔ)言處理領(lǐng)域，百度是一眾大廠中技術(shù)積累歷史最長(zhǎng)的一個(gè)。

百度文心大模型的研發(fā)由 CTO 王海峰帶隊(duì)。在「文心一言」項(xiàng)目中，王海峰也是擔(dān)任總指揮，另有核心成員吳甜（百度集團(tuán)副總裁、飛槳平臺(tái)研發(fā)領(lǐng)銜人物）與吳華（百度技術(shù)委員會(huì)主席、百度翻譯技術(shù)團(tuán)隊(duì)創(chuàng)始人之一）。

打造中國(guó)版 ChatGPT，國(guó)內(nèi)有哪些學(xué)術(shù)力量能搶灘？

王海峰

百度是國(guó)內(nèi)最早深耕預(yù)訓(xùn)練模型研發(fā)的團(tuán)隊(duì)之一，2019 年就發(fā)布了中文效果超越 BERT 的 ERNIE 1.0 和 2.0 模型；2021 年 7 月發(fā)布的 ERNIE 3.0，在 SuperGLUE 上超越了GPT-3；同年發(fā)布的“鵬程-百度·文心”（ERNIE 3.0 Titan）則是首個(gè)知識(shí)增強(qiáng)千億級(jí)大模型。

打造中國(guó)版 ChatGPT，國(guó)內(nèi)有哪些學(xué)術(shù)力量能搶灘？

“知識(shí)增強(qiáng)”是文心系列所走的技術(shù)路線，即引入語(yǔ)言知識(shí)和世界知識(shí)等，從大規(guī)模知識(shí)圖譜和海量數(shù)據(jù)中融合學(xué)習(xí)，以提升大模型的學(xué)習(xí)效率和可解釋性。

2021 年，百度還推出一款名為 PLATO 的對(duì)話機(jī)器人，模型基礎(chǔ)是百億參數(shù)對(duì)話生成大模型 PLATO-XL。

百度的優(yōu)勢(shì)在于其豐富的搜索語(yǔ)料數(shù)據(jù)，深耕 AI 研究多年的用戶數(shù)據(jù)，并有百度飛槳深度學(xué)習(xí)平臺(tái)、自研芯片加持。

微軟與谷歌激烈開(kāi)戰(zhàn)之后，百度是國(guó)內(nèi)最早宣布其研發(fā)類 ChatGPT 產(chǎn)品（「文心一言」）計(jì)劃的團(tuán)隊(duì)之一。內(nèi)部人員透露，其產(chǎn)品形態(tài)或?yàn)楠?dú)立入口，或效仿微軟 Bing、與百度搜索入口聯(lián)通。

阿里通義大模型

阿里巴巴達(dá)摩院從 2021 年入局大模型，參與了智源研究院「悟道·文匯」大模型的研發(fā)，后推出純文本預(yù)訓(xùn)練語(yǔ)言模型 PLUG（270億參數(shù)），完全參照 GPT-3 的架構(gòu)，集語(yǔ)言理解與生成能力于一身，水平接近 GPT-3。

達(dá)摩院原智能計(jì)算實(shí)驗(yàn)室成員楊紅霞（已于去年離職）與清華唐杰團(tuán)隊(duì)合作研發(fā)的 M6 多模態(tài)大模型系列，參數(shù)也從百億升至十萬(wàn)億。

在現(xiàn)任達(dá)摩院副院長(zhǎng)周靖人的主導(dǎo)下，達(dá)摩院于去年 9 月推出了目前阿里大模型成果的集大成之作，即“通義”大模型。

打造中國(guó)版 ChatGPT，國(guó)內(nèi)有哪些學(xué)術(shù)力量能搶灘？

周靖人

「通義」大模型首次統(tǒng)一了模態(tài)、架構(gòu)和任務(wù)，其背后的技術(shù)支撐是統(tǒng)一學(xué)習(xí)范式 OFA。

打造中國(guó)版 ChatGPT，國(guó)內(nèi)有哪些學(xué)術(shù)力量能搶灘？

去年，為推進(jìn)中文大模型的開(kāi)源生態(tài)建設(shè)，達(dá)摩院還推出了 AI 模型開(kāi)源社區(qū)「魔搭」（Model Scope），在業(yè)界引起巨大反響。

日前，達(dá)摩院已確認(rèn)其正在研發(fā)基于「通義」大模型的阿里版 ChatGPT，除了文本生成外，還具備繪畫功能。據(jù)了解，其類 ChatGPT 產(chǎn)品將和釘釘深度結(jié)合。

京東言犀大模型

京東從 2020 年開(kāi)始研究 AI 文本生成，用以支持京東商城商品頁(yè)面描述的生成。有消息透露，京東商城頁(yè)面中，20% 的產(chǎn)品介紹都是由 AI 團(tuán)隊(duì)用 NLP 技術(shù)生成。期間，由于 NLP 技術(shù)的整體消沉，研發(fā)受阻，但后來(lái)京東又重新重視，推出了言犀大模型。

2018 年從微軟離開(kāi)加入京東的何曉冬，是現(xiàn)任京東集團(tuán)副總裁、京東 AI 研究院執(zhí)行院長(zhǎng)，也是如今京東大模型研究團(tuán)隊(duì)的帶頭人。

打造中國(guó)版 ChatGPT，國(guó)內(nèi)有哪些學(xué)術(shù)力量能搶灘？

何曉冬

2021 年，他與原京東 AI 掌門人周博文（已于 2021 年 11 月離職）帶隊(duì)，在京東言犀篇平臺(tái)上研發(fā)了領(lǐng)域性模型 K-PLUG。該模型與京東的電商場(chǎng)景緊密結(jié)合，從電商領(lǐng)域特定知識(shí)中學(xué)習(xí)，能夠自動(dòng)生成商品文案。

打造中國(guó)版 ChatGPT，國(guó)內(nèi)有哪些學(xué)術(shù)力量能搶灘？

京東目前還沒(méi)有千億級(jí)參數(shù)的大模型，K-PLUG 也只有 10 億參數(shù)，但這次京東云言犀平臺(tái)也宣布入局，將推出 ChatGPT 產(chǎn)品「ChatJD」，且強(qiáng)調(diào)其“產(chǎn)業(yè)版”色彩。

華為盤古大模型

華為的計(jì)算資源為其研究大模型提供了天然優(yōu)勢(shì)。

華為從 2020 年開(kāi)始布局大模型，帶頭人是田奇（IEEE Fellow、國(guó)際歐亞科學(xué)院院士）。

打造中國(guó)版 ChatGPT，國(guó)內(nèi)有哪些學(xué)術(shù)力量能搶灘？

田奇

2020 年 3 月，他加入華為云擔(dān)任華為云人工智能領(lǐng)域首席科學(xué)家，同年夏 GPT-3 問(wèn)世之后，他就立即組建團(tuán)隊(duì)，開(kāi)始了盤古大模型的研發(fā)。華為因此成為 2020 年最早參與大模型競(jìng)賽的大廠之一。

基于昇騰 AI，與鵬程實(shí)驗(yàn)室、循環(huán)智能合作，華為于 2021 年 4 月發(fā)布了「盤古」系列大模型，包括中文語(yǔ)言、視覺(jué)、多模態(tài)、科學(xué)計(jì)算四個(gè)大模型。

盤古 NLP 大模型是業(yè)界首個(gè)千億級(jí)生成和理解中文大模型。在預(yù)訓(xùn)練階段就學(xué)習(xí)了 40 TB 的中文文本數(shù)據(jù)，包括細(xì)分行業(yè)的小樣本數(shù)據(jù)。在模型結(jié)構(gòu)上，盤古采用 Encode 和 Decode 的架構(gòu)，保證了其在生成和理解上的性能。

打造中國(guó)版 ChatGPT，國(guó)內(nèi)有哪些學(xué)術(shù)力量能搶灘？

華為有千億模型的研發(fā)經(jīng)驗(yàn)，也有強(qiáng)大的計(jì)算資源，但這次其發(fā)聲甚少，尚未明確是否會(huì)研發(fā)類 ChatGPT 產(chǎn)品。

—— 3 ——
學(xué)術(shù)初創(chuàng)派

ChatGPT 帶來(lái)的這一波 AI 商業(yè)化熱潮有著極高的技術(shù)壁壘，同時(shí)也給了科學(xué)家們下場(chǎng)創(chuàng)業(yè)的巨大機(jī)遇。

如瀾舟科技創(chuàng)始人周明、IDEA 研究院講席科學(xué)家張家興、西湖心辰藍(lán)振忠、銜遠(yuǎn)科技創(chuàng)始人周伯文等人，都是學(xué)術(shù)初創(chuàng)派的代表。

對(duì)他們而言，要在未來(lái)的 ChatGPT 商業(yè)戰(zhàn)中取勝，還需要補(bǔ)強(qiáng)工程化和市場(chǎng)運(yùn)營(yíng)的能力。就像張家興和藍(lán)振忠，已經(jīng)在為他們的研發(fā)團(tuán)隊(duì)尋找一個(gè) CEO。

此外，我們還能觀察到兩種入局模式：一種是以強(qiáng)大的技術(shù)能力為基礎(chǔ)，去彌補(bǔ)商業(yè)化方面的短板；另一種是商業(yè)化經(jīng)驗(yàn)豐富的大佬下場(chǎng)，吸引技術(shù)人才來(lái)組隊(duì)。

最終哪種模式能走得更成功，我們拭目以待。

瀾舟科技周明

在上一輪大模型堆參數(shù)的潮流正當(dāng)火熱之時(shí)，周明獨(dú)辟蹊徑，為其初創(chuàng)公司瀾舟科技選擇了一條輕量化大模型的路線。

2021 年 6 月，周明成立瀾舟科技，在緊接著的 7 月，他的團(tuán)隊(duì)就發(fā)布了十億參數(shù)的「孟子」模型，效果可比肩千億大模型。

這是周明在學(xué)術(shù)界和產(chǎn)業(yè)界兩開(kāi)花的結(jié)果。

打造中國(guó)版 ChatGPT，國(guó)內(nèi)有哪些學(xué)術(shù)力量能搶灘？

周明

周明是 NLP 領(lǐng)域極具影響力的華人科學(xué)家之一。他于 1991 年從哈工大博士畢業(yè)，是百度 CTO 王海峰的同門師兄弟，哈爾濱工業(yè)大學(xué)教授、NLP 泰斗李生的高徒。博士期間，周明曾研制出中國(guó)第一個(gè)中英翻譯系統(tǒng)。

畢業(yè)后，周明先是進(jìn)入清華大學(xué)任職任教，并在 1999 年被微軟亞洲研究院（MSRA）創(chuàng)始院長(zhǎng)李開(kāi)復(fù)挖走，2001 年起擔(dān)任 NLP 組主任，后升任微軟亞研副院長(zhǎng)。

在 MSRA 期間，周明在 NLP 技術(shù)的產(chǎn)業(yè)化上成果頗多，他參與帶隊(duì)的 ACL 頂會(huì)論文超過(guò)百篇，相關(guān)技術(shù)還應(yīng)用到了 Windows、Office、Azure、微軟小冰等世界級(jí)產(chǎn)品中。

2020 年，周明決心以一種新的方式尋求學(xué)術(shù)界與工業(yè)界的合作，就結(jié)束了在微軟工作的 21 年生涯，加入了李開(kāi)復(fù)創(chuàng)辦的創(chuàng)新工場(chǎng)人工智能工程院，擔(dān)任首席科學(xué)家，并開(kāi)始孵化一個(gè)創(chuàng)業(yè)團(tuán)隊(duì)，最終成立瀾舟科技。

據(jù)官方消息，瀾舟科技將憑借其類 ChatGPT 底層技術(shù)的語(yǔ)言大模型，與擁有海量數(shù)據(jù)的中文在線合作，打造國(guó)產(chǎn) ChatGPT。周明團(tuán)隊(duì)是會(huì)繼續(xù)走輕量化模型路線，還是轉(zhuǎn)向做千億級(jí)以上大模型來(lái)作為技術(shù)支撐，尚不得知。

銜遠(yuǎn)科技周伯文

2022 年，周伯文回到學(xué)術(shù)界，加盟清華大學(xué)，擔(dān)任電子工程系長(zhǎng)聘教授、清華大學(xué)惠妍講席教授，以及電子系協(xié)同交互智能研究中心主任。

同時(shí)，周伯文還是一個(gè)新創(chuàng)業(yè)者。2021 年底，他卸任京東集團(tuán)高級(jí)副總裁，離職創(chuàng)立了銜遠(yuǎn)科技。

打造中國(guó)版 ChatGPT，國(guó)內(nèi)有哪些學(xué)術(shù)力量能搶灘？

周伯文

周伯文是中國(guó)科學(xué)大學(xué)少年班畢業(yè)，博士在科羅拉多大學(xué)波爾德分校就讀。畢業(yè)后他進(jìn)入 IBM 工作，曾任 IBM Research 人工智能基礎(chǔ)研究院（AI Foundations）院長(zhǎng)、IBM Watson Group 首席科學(xué)家、IBM 杰出工程師等。2017 年，周伯文加入京東，出任京東集團(tuán)副總裁，負(fù)責(zé)京東的 AI 研究。

NLP、多模態(tài)、人機(jī)對(duì)話等都是周伯文深耕多年的領(lǐng)域。他提出的自注意力融合多頭機(jī)制的自然語(yǔ)言表征機(jī)理后來(lái)成為Transformer架構(gòu)的核心思想之一，還提出了 AIGC 領(lǐng)域的兩個(gè)自然語(yǔ)言生成模型架構(gòu)與算法。2020 年，他當(dāng)選 IEEE Fellow。

在周伯文看來(lái)，ChatGPT 的核心進(jìn)展是人的協(xié)同和交互學(xué)習(xí)的提升而非模型變大，而且，ChatGPT 未來(lái)必將演變成多模態(tài)，這也正是他領(lǐng)導(dǎo)的協(xié)同交互智能研究中心的重點(diǎn)研究方向。

而在銜遠(yuǎn)科技，周伯文也已經(jīng)實(shí)現(xiàn)了一些 AIGC 的應(yīng)用，如使用生成式人工智能加速以消費(fèi)者和市場(chǎng)為中心的實(shí)時(shí)創(chuàng)新、提升 sku 創(chuàng)新成功率。

IDEA 研究院張家興

粵港澳大灣區(qū)，除了鵬城實(shí)驗(yàn)室、騰訊，大模型的玩家還有一個(gè)，即 IDEA 研究院（全稱「粵港澳大灣區(qū)數(shù)字經(jīng)濟(jì)研究院」，由沈向洋等知名 AI 科學(xué)家在 2020 年創(chuàng)立。

IDEA 研究院的大模型負(fù)責(zé)人是張家興，他也是一位從 MSRA 走出的 AI 科學(xué)家。

打造中國(guó)版 ChatGPT，國(guó)內(nèi)有哪些學(xué)術(shù)力量能搶灘？

張家興

張家興于 2006 年從北京大學(xué)電子系博士畢業(yè)，師從侯士敏（現(xiàn)北大電子系教授）。畢業(yè)后，他先在百度待了一段時(shí)間，后加入微軟的 Bing 搜索團(tuán)隊(duì)，與周靖人有過(guò)合作。之后在 MSRA ，張家興從事系統(tǒng)方向的研究，并從 2012 年轉(zhuǎn)向深度學(xué)習(xí)。

2014 年，張家興加入阿里 iDST（達(dá)摩院前身）團(tuán)隊(duì)，一年后又去往螞蟻金服，帶領(lǐng) NLP 技術(shù)團(tuán)隊(duì)，將對(duì)話機(jī)器人應(yīng)用到金融場(chǎng)景。2020 年，張家興受 360 數(shù)科 CEO 吳海生的邀請(qǐng)，加入 360 數(shù)科任首席科學(xué)家，只待了一年半便離開(kāi)。

在 MSRA 院長(zhǎng)周禮棟的推薦下，張家興加入了 IDEA研究院，擔(dān)任講席科學(xué)家，負(fù)責(zé)認(rèn)知計(jì)算與自然語(yǔ)言研究中心。

張家興團(tuán)隊(duì)在 AIGC 這一波中一直較為領(lǐng)先，他主導(dǎo)研發(fā)了「封神榜」開(kāi)源模型系列，并在去年推出了國(guó)內(nèi)第一個(gè)中文版 Stable Diffusion 模型「太乙」。

ChatGPT 問(wèn)世之后，張家興在去年底就迅速將團(tuán)隊(duì)的大模型研發(fā)轉(zhuǎn)向了 ChatGPT 的對(duì)話任務(wù)路線。據(jù)其透露，其團(tuán)隊(duì)研發(fā)的類 ChatGPT 模型效果與 ChatGPT 相當(dāng)，且僅有 50 億參數(shù)，文本生成速度也很快，目前已在內(nèi)測(cè)中，近期將公測(cè)。

盡管當(dāng)前 50 億參數(shù)的模型已經(jīng)效果很好，但接下來(lái)，張家興計(jì)劃研發(fā)千億模型支撐的類 ChatGPT 產(chǎn)品，并推動(dòng)其商業(yè)化。這也是他最近準(zhǔn)備融資、尋找一位 CEO 的原因。

西湖心辰藍(lán)振忠

同樣在為團(tuán)隊(duì)尋找 CEO 的，還有西湖心辰的創(chuàng)始人藍(lán)振忠。

打造中國(guó)版 ChatGPT，國(guó)內(nèi)有哪些學(xué)術(shù)力量能搶灘？

藍(lán)振忠

去年，在眾多國(guó)產(chǎn) AI 作畫產(chǎn)品中脫穎而出的「盜夢(mèng)師」（現(xiàn)改名為「造夢(mèng)日記」），正是出自藍(lán)振忠團(tuán)隊(duì)。

藍(lán)振忠本科從中山大學(xué)畢業(yè)，博士在卡內(nèi)基梅隆大學(xué)就讀，期間研究計(jì)算機(jī)視覺(jué)，后來(lái)去谷歌工作時(shí)轉(zhuǎn)到自然語(yǔ)言處理方向，依托谷歌的 TPU 資源研發(fā)了著名的輕量化大模型「ALBERT」。

2020 年 6 月，藍(lán)振忠回國(guó)加入西湖大學(xué)，創(chuàng)立了深度學(xué)習(xí)實(shí)驗(yàn)室，開(kāi)啟語(yǔ)言與視覺(jué)結(jié)合的多模態(tài)研究。

依托西湖大學(xué)的科研資源與先前加入的智源「青源會(huì)」，藍(lán)振忠開(kāi)啟產(chǎn)學(xué)研模式，創(chuàng)立了西湖心辰，先是依托大模型研發(fā)了心理咨詢聊天機(jī)器人「小天」，然后在 2022 年 8 月的 Stable Diffusion 浪潮中首發(fā)國(guó)產(chǎn)作畫產(chǎn)品「盜夢(mèng)師」。

而在 ChatGPT 出來(lái)沒(méi)多久，西湖心辰就推出了類似的文本生成產(chǎn)品「心辰 Chat」。不同的是，它可以訪問(wèn)互聯(lián)網(wǎng)，而且是多模態(tài)交互，不僅可以生成文本，還可輸出圖像。

與許多學(xué)者出身、下場(chǎng)創(chuàng)業(yè)的人一樣，藍(lán)振忠也深感團(tuán)隊(duì)需要一位具有管理經(jīng)驗(yàn)、資源整合能力強(qiáng)大的 CEO，來(lái)一起打造中國(guó)版 OpenAI。敬請(qǐng)關(guān)注 AI 科技評(píng)論明天推送：《藍(lán)振忠也發(fā)「英雄帖」，中國(guó)版 ChatGPT 明星公司尋找 CEO》。（公眾號(hào)：雷峰網(wǎng)）

預(yù)告：

下一篇，我們將推出創(chuàng)業(yè)者勢(shì)力盤點(diǎn)《ChatGPT 創(chuàng)業(yè)群雄逐鹿：陸奇屠龍，號(hào)令天下；小川不出，誰(shuí)與爭(zhēng)鋒》。

（公眾號(hào)：雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))）

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

1人收藏

分享：

相關(guān)文章

李梅

編輯

發(fā)私信

當(dāng)月熱門文章

最新文章

熱門搜索

智能手機(jī) Apple Watch 科技新能源操作系統(tǒng) Xbox One 量子計(jì)算陌陌 AI教育數(shù)據(jù)科學(xué) 劉強(qiáng)東

為了您的賬戶安全，請(qǐng)驗(yàn)證郵箱

您的郵箱還未驗(yàn)證,完成可獲20積分喲！

重發(fā)郵箱修改郵箱

請(qǐng)驗(yàn)證您的郵箱

立即驗(yàn)證

完善賬號(hào)信息

您的賬號(hào)已經(jīng)綁定，現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄

立即設(shè)置 以后再說(shuō)

<li id="eccl1"></li>

<li id="eccl1"></li>