日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能開發(fā)者 正文
發(fā)私信給汪思穎
發(fā)送

0

上交大 Acemap 團隊發(fā)布學術知識圖譜 AceKG,涵蓋 1 億多個學術實體

本文作者: 汪思穎 2018-03-15 11:59
導語:將近 100G 的數(shù)據(jù)集,即刻下載吧

雷鋒網(wǎng) AI 研習社消息,日前,上海交通大學王新兵教授和張偉楠教授指導的 Acemap 團隊知識圖譜小組發(fā)布了學術知識圖譜 AceKG。從官網(wǎng)可以看到,Acemap知識圖譜(AceKG)描述了超過 1 億個學術實體、22 億條三元組信息,包含六千多萬篇論文、五千多萬位學者、五萬多個研究領域、將近兩萬個學術研究機構等,數(shù)據(jù)集將近 100G。

知識圖譜(Knowledge Graph)是顯示知識發(fā)展進程與結構關系的一系列各種不同的圖形,用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪制和顯示知識及它們之間的相互聯(lián)系。通過將應用數(shù)學、圖形學、信息可視化技術、信息科學等學科的理論與方法與計量學引文分析、共現(xiàn)分析等方法結合,并利用可視化的圖譜形象地展示學科的核心結構、發(fā)展歷史、前沿領域以及整體知識架構,揭示知識領域的動態(tài)發(fā)展規(guī)律,為研究和決策提供切實的、有價值的參考。

目前,隨著機器學習和自然語言處理技術的不斷發(fā)展,在大數(shù)據(jù)的推動下,知識圖譜受到學界和業(yè)界的廣泛關注。但目前它的發(fā)展還存在著不少阻礙,例如從數(shù)據(jù)中挖掘出高質量的知識需要大量的數(shù)據(jù)處理工作,構建垂直領域知識圖譜的代價很大,很多研究工作都不具備實用性等等。 

而 AceKG 究竟有何優(yōu)勢?據(jù)發(fā)布團隊介紹,與現(xiàn)有學術知識圖譜相比,AceKG 主要有如下三個特點:

  • AceKG 提供學術異構圖譜,包含多樣的學術實體與相應的屬性,可以支持多樣的學術大數(shù)據(jù)挖掘課題,例如現(xiàn)階段異構網(wǎng)絡向量化的諸多課題。

  • AceKG 從更高的角度統(tǒng)覽整個學術圈,提供了近 100G 大小的數(shù)據(jù)集,包括論文、作者、領域、機構、期刊、會議、聯(lián)盟,支持權威和實用的學術研究。

  • AceKG 以結構化的 Turtle 文件格式給出(具體格式見下表),致力于減少數(shù)據(jù)預處理的不便,同時更易于機器處理,支持全部 Apache Jena API。

上交大 Acemap 團隊發(fā)布學術知識圖譜 AceKG,涵蓋 1 億多個學術實體

上交大 Acemap 團隊發(fā)布學術知識圖譜 AceKG,涵蓋 1 億多個學術實體

上交大 Acemap 團隊發(fā)布學術知識圖譜 AceKG,涵蓋 1 億多個學術實體

上交大 Acemap 團隊發(fā)布學術知識圖譜 AceKG,涵蓋 1 億多個學術實體

上交大 Acemap 團隊發(fā)布學術知識圖譜 AceKG,涵蓋 1 億多個學術實體

下圖是 AceKG 的結構框架??梢钥吹剑珹ceKG 為每個實體提供了豐富的屬性信息,在網(wǎng)絡拓撲結構的基礎上加上語義信息,可以為眾多學術大數(shù)據(jù)挖掘項目提供全面支持。

上交大 Acemap 團隊發(fā)布學術知識圖譜 AceKG,涵蓋 1 億多個學術實體

以下是一些示例文件,大家可以點擊如下鏈接http://acemap.sjtu.edu.cn/app/Datasets/KG/example.zip,來了解和使用該知識圖譜。

此外,AceKG 使用 Apache Jena 框架驅動。Apache Jena(http://jena.apache.org)使用 TDB 數(shù)據(jù)庫存儲數(shù)據(jù),并且提供 SPARQL 引擎進行數(shù)據(jù)查詢。它還為 Web 客戶端提供 FusekiHTTP 服務,并提供完整的 Java API 查詢數(shù)據(jù)。架構如下圖:

上交大 Acemap 團隊發(fā)布學術知識圖譜 AceKG,涵蓋 1 億多個學術實體

值得一提的是,AceKG 并不是雷鋒網(wǎng) AI 研習社報道的第一個學術知識圖譜。此前,清華大學教授、Arnetminer 創(chuàng)始人唐杰博士公開億級學術圖譜——Open Academic Graph。此圖譜集成了兩個最大的公開學術圖譜:微軟學術圖譜(MAG)和 AMiner 學術圖譜。開發(fā)團隊通過集成 MAG 中 1.66 億學術論文和 AMiner 中 1.55 億學術論文的元數(shù)據(jù)信息,生成了這兩個學術圖譜之間近 6500 萬對鏈接(匹配)關系。

據(jù)唐杰教授介紹,公開 Open Academic Graph 目的如下:一是集成豐富的學術知識數(shù)據(jù),二是數(shù)據(jù)共享,三是服務共享。簡言之,他們希望能夠造福學術界對知識圖譜、學者合作關系、學術主題挖掘等領域的研究,設計更加智能的學術圖譜連接系統(tǒng),以方便更多人使用服務以及加入開放學術社區(qū)。

在雷鋒網(wǎng) AI 研習社看來,這些學術知識圖譜的發(fā)布,不管對學界還是對業(yè)界來說都有極大的意義。一方面能助力大家當前的研究,另一方面也能吸引更多人來進行學術知識圖譜相關的研究。相信隨著越來越多學術知識圖譜的公開,將促進學術大數(shù)據(jù)挖掘項目的持續(xù)發(fā)展。

AceKG 詳細信息,參見:http://acemap.sjtu.edu.cn/app/AceKG/index.html

雷峰網(wǎng)版權文章,未經(jīng)授權禁止轉載。詳情見轉載須知。

上交大 Acemap 團隊發(fā)布學術知識圖譜 AceKG,涵蓋 1 億多個學術實體

分享:
相關文章

編輯

關注AI學術,例如論文
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說