
特別鳴謝(按拼音排序)

報告摘要
面向業(yè)務(wù)場景,知識圖譜應(yīng)用趨勢分析
· 知識圖譜面向業(yè)務(wù)場景,強調(diào)行業(yè)知識與知識圖譜的結(jié)合,實現(xiàn)在業(yè)務(wù)場景中的落地應(yīng)用;
· 知識圖譜的核心優(yōu)勢體現(xiàn)在對于實體、屬性等客觀世界事物的關(guān)聯(lián)關(guān)系分析,尤其是隱性關(guān)系識別,可應(yīng)用于輔助決策;
· 基于知識圖譜構(gòu)建的領(lǐng)域知識庫應(yīng)用,有效沉淀行業(yè)知識,賦能多業(yè)務(wù)場景;
· 注重行業(yè)知識圖譜和關(guān)系挖掘,是人工智能在行業(yè)中更深層的落地應(yīng)用。
最佳實踐案例,對于知識圖譜構(gòu)建有重要指導(dǎo)意義
· 知識圖譜已經(jīng)在垂直領(lǐng)域內(nèi)有一定的成功應(yīng)用案例,本報告總結(jié)在金融行業(yè)、醫(yī)療與醫(yī)藥行業(yè)、政府與公共服務(wù)行業(yè)以及能源與工業(yè)行業(yè)中六個應(yīng)用場景的最佳實踐案例;
· 最佳實踐案例對于知識圖譜落地有重要的指導(dǎo)意義,企業(yè)可根據(jù)同行業(yè)內(nèi)最佳實踐案例制定符合自身業(yè)務(wù)需求的知識圖譜解決方案,實現(xiàn)快速落地、及時應(yīng)用。
從感知智能到認知智能,知識圖譜是關(guān)鍵一步
· 認知智能時代的到來,是在感知智能之上,提高了AI的理解分析能力。知識圖譜起到重要的支撐作用。在認知智能階段,機器能夠通過知識圖譜挖掘隱性關(guān)系,洞察難以發(fā)現(xiàn)的關(guān)系和邏輯,用于最終的業(yè)務(wù)決策。
目錄
一. 知識圖譜技術(shù)概覽
二. 知識圖譜應(yīng)用分析與落地挑戰(zhàn)
三. 知識圖譜最佳實踐案例
四. 知識圖譜未來展望
結(jié)語
關(guān)于愛分析
法律聲明
1.知識圖譜技術(shù)概覽
1.1 知識圖譜概述
1.1.1知識圖譜定義
知識圖譜即Knowledge Graph,以結(jié)構(gòu)化的方式描述客觀世界中實體、概念、事件以及之間的關(guān)系。其中,實體是指客觀世界的具體事物;概念是指人類對于客觀事物的概念化描述表示;事件是指發(fā)生在客觀世界的活動,而關(guān)系則指實體、概念、事件之間客觀存在的關(guān)聯(lián)。
知識圖譜技術(shù)是指在建立知識圖譜中使用的技術(shù),是融合認知計算、知識表示與推理、信息檢索與抽取、自然語言處理與語義Web、數(shù)據(jù)挖掘與機器學(xué)習(xí)等技術(shù)的交叉研究。知識圖譜技術(shù)包括知識表示、知識圖譜構(gòu)建和知識圖譜應(yīng)用三方面的研究內(nèi)容:
知識表示研究客觀世界知識的建模,以方便機器識別和理解,既要考慮知識的表示與存儲,又要考慮知識的使用和計算;
知識圖譜構(gòu)建解決如何建立計算機算法從客觀世界或者互聯(lián)網(wǎng)的各種數(shù)據(jù)資源中獲取客觀世界的知識,主要研究使用何種數(shù)據(jù)和方法抽取何種知識;
知識圖譜應(yīng)用主要研究如何利用知識圖譜建立基于知識的智能服務(wù)系統(tǒng),更好地解決實際應(yīng)用問題。
1.1.2知識圖譜發(fā)展歷程
谷歌于2012年正式提出知識圖譜(Knowledge Graph)概念,并應(yīng)用在智能搜索領(lǐng)域。知識圖譜(Knowledge Graph)本質(zhì)是以圖的形式表現(xiàn)實體(概念、事物、人)及其關(guān)系的知識庫,可看作有向圖結(jié)構(gòu)的網(wǎng)絡(luò)。目前,知識圖譜技術(shù)已在智能搜索、智能問答、網(wǎng)絡(luò)分析、決策輔助、推薦系統(tǒng)等領(lǐng)域廣泛應(yīng)用。
通過知識圖譜的發(fā)展歷程可以看出,知識圖譜是知識工程不斷發(fā)展衍生出的新一代知識工程技術(shù)。2012年谷歌知識圖譜項目之后,知識圖譜技術(shù)快速發(fā)展,目前已形成在多垂直領(lǐng)域的行業(yè)應(yīng)用。

1.1.3知識圖譜的構(gòu)建體系
知識圖譜構(gòu)建過程主要分為自頂向下(top-down)與自底向上(bottom-up)兩種方式。兩種方式的主要區(qū)別在于,在構(gòu)建的過程中是否先定義本體與數(shù)據(jù)模式。目前,大多數(shù)知識圖譜采用自底向上的方式進行構(gòu)建。
在知識圖譜的構(gòu)建過程中,存在幾項關(guān)鍵步驟,即知識抽取、知識表示、知識融合、知識推理、知識存儲以及知識圖譜應(yīng)用等。
其中,知識抽取與知識融合環(huán)節(jié)是知識圖譜構(gòu)建的基礎(chǔ)。通過客戶數(shù)據(jù)庫或公開網(wǎng)絡(luò)獲取到多源異構(gòu)數(shù)據(jù)具有冗余、噪聲、不確定性等特征,前期的數(shù)據(jù)清洗工作并不能實際解決這些問題,需要對相關(guān)數(shù)據(jù)抽取后進行融合操作并對質(zhì)量進行評估,以便及時知識更新,保證知識圖譜的準確性。同時,已有知識構(gòu)建數(shù)據(jù)模型形成數(shù)據(jù)規(guī)范作用于知識表示的過程可以及時對數(shù)據(jù)模型進行修訂,保證數(shù)據(jù)模型針對特定數(shù)據(jù)的實時性與有效性。
知識圖譜的前期構(gòu)建過程即知識抽取與知識融合,各廠商在技術(shù)層面大致趨同,更多的是基于人力與時間的投入。知識圖譜發(fā)展至今,決定應(yīng)用效果的更多是應(yīng)用模型,即特定應(yīng)用場景下相對應(yīng)的應(yīng)用模型。

1.1.4知識圖譜應(yīng)用特性

知識圖譜技術(shù)源于語義網(wǎng)絡(luò),經(jīng)過半個世紀的發(fā)展,融合本體論、群體智能使得知識圖譜又形成自身特點。在實際業(yè)務(wù)應(yīng)用中,知識圖譜技術(shù)有以下特征:
可視化:知識圖譜作為圖類型知識庫,本身具備可視化特性。知識圖譜可以將多實體間的關(guān)系通過圖形的方式進行顯示。目前,通過知識圖譜技術(shù)分析展示實體間關(guān)聯(lián)關(guān)系已在多領(lǐng)域有廣泛的應(yīng)用;
準確性:知識圖譜構(gòu)建的語義網(wǎng)絡(luò)中具有多種語義關(guān)系,多角度挖掘信息,保證相關(guān)信息的準確性;
關(guān)聯(lián)分析:知識圖譜本身具備“邊”的概念,強調(diào)實體間的關(guān)聯(lián)與屬性。在實際業(yè)務(wù)場景中,利用知識圖譜技術(shù)能快速有效地發(fā)現(xiàn)無關(guān)實體間的隱性關(guān)聯(lián)關(guān)系。目前,關(guān)聯(lián)分析在金融行業(yè)的營銷與風(fēng)控,政府與公共服務(wù)行業(yè)智能刑偵、智能經(jīng)偵、治安管理、政務(wù)數(shù)字化等多領(lǐng)域有廣泛應(yīng)用;

拓展性:知識圖譜本身的構(gòu)建方式?jīng)Q定其本身具有良好的拓展性,當形成某細分領(lǐng)域知識圖譜后可在此領(lǐng)域內(nèi)快速拓展。同時,不同領(lǐng)域間知識圖譜也有一定的拓展性,本身知識抽取與知識融合階段對領(lǐng)域業(yè)務(wù)知識依賴有限,決定知識圖譜領(lǐng)域內(nèi)應(yīng)用效果的關(guān)鍵因素是上層業(yè)務(wù)模型;
可解釋性:彌補機器學(xué)習(xí)的不足,知識圖譜本身與人類認知類似,通過實體、關(guān)系、屬性去認知世界,同時知識圖譜目前均為大規(guī)模知識庫,語義豐富,將搜索問題與答案相連接,提供解釋性的來源;
知識學(xué)習(xí):通過推理、標注、糾錯等具有反饋能力的學(xué)習(xí)機制,快速積累沉淀行業(yè)知識,形成領(lǐng)域知識庫,降低行業(yè)經(jīng)驗的依賴性。
2.知識圖譜應(yīng)用分析與落地挑戰(zhàn)
2.1知識圖譜應(yīng)用分析
知識圖譜可為多領(lǐng)域客戶在數(shù)據(jù)管理、關(guān)聯(lián)分析、營銷與風(fēng)控、反欺詐等應(yīng)用場景提供技術(shù)賦能。知識圖譜技術(shù)為用戶提供了一種更為有效的方式表達、組織、管理以及利用多源、異構(gòu)、動態(tài)的數(shù)據(jù)。通過對于各領(lǐng)域內(nèi)應(yīng)用場景的分析,可以看出目前知識圖譜應(yīng)用場景的共性特點:
圖譜的核心優(yōu)勢體現(xiàn)在對于實體、屬性等客觀世界事物的關(guān)聯(lián)關(guān)系分析,包括顯性關(guān)系與隱性關(guān)系識別?;谥R圖譜此項特性,銀行營銷與風(fēng)控、公安刑偵等較多業(yè)務(wù)場景都有應(yīng)用。也是目前知識圖譜技術(shù)應(yīng)用最為廣泛的功能點。構(gòu)建實體關(guān)系網(wǎng)絡(luò),察覺實體關(guān)系,并發(fā)現(xiàn)信息(包括:風(fēng)險消息、商機線索、關(guān)系事件)的傳導(dǎo)路徑,也會在其他行業(yè)中逐漸獲得廣泛應(yīng)用;同時,關(guān)系網(wǎng)絡(luò)的搭建結(jié)合目前數(shù)據(jù)可視化(二維以及三維展示)的技術(shù),將會更好地給用戶呈現(xiàn)實體關(guān)系網(wǎng)絡(luò);

領(lǐng)域知識庫的應(yīng)用也在各行業(yè)內(nèi)廣泛推廣,相較于傳統(tǒng)知識工程,利用知識圖譜技術(shù)搭建領(lǐng)域知識庫的實際應(yīng)用效果更好;由于傳統(tǒng)知識工程知識相對分散,關(guān)聯(lián)性低,要求使用者對于知識應(yīng)用的匹配度較高,同時無法延伸知識的應(yīng)用場景,所以傳統(tǒng)知識工程往往應(yīng)用效果一般。在搭建領(lǐng)域知識庫的過程中,知識圖譜實現(xiàn)了知識的建模、抽取、融合、存儲、應(yīng)用,同時將相關(guān)知識進行關(guān)聯(lián),達到智能化的知識應(yīng)用水平;

自然語言處理(NLP)技術(shù)與知識圖譜技術(shù)之間存在較大交叉,面對復(fù)雜語義,可以利用知識圖譜技術(shù)與自然語言處理相結(jié)合的應(yīng)用,更好的服務(wù)與長文本處理;傳統(tǒng)自然語言處理對于短文本有較好的處理效果,但面對長文本,尤其前后具備邏輯關(guān)系的語言,往往處理較差。知識圖譜技術(shù)的應(yīng)用解決長文本與長語句處理問題,使得智能客服、機器翻譯、文本處理等應(yīng)用有長足的發(fā)展。

2.2知識圖譜落地應(yīng)用場景
愛分析基于對國內(nèi)知識圖譜廠商的調(diào)研,準確定義了23個知識圖譜技術(shù)的應(yīng)用場景,涵蓋金融、政府與公共服務(wù)、電信、醫(yī)療與醫(yī)藥、零售、能源與工業(yè)等六大行業(yè)。本報告應(yīng)用場景只選取具有較強行業(yè)屬性的應(yīng)用場景進行研究分析,并沒有窮舉知識圖譜所有應(yīng)用場景。
知識圖譜應(yīng)用場景地圖如下圖所示:

2.3知識圖譜各場景應(yīng)用分析
通過知識圖譜應(yīng)用場景地圖可以看出,目前在六大行業(yè)中,金融行業(yè)以及政府與公共服務(wù)行業(yè)知識圖譜落地場景較多,其中主要以金融行業(yè)內(nèi)的營銷與風(fēng)控場景和公共安全行業(yè)的業(yè)務(wù)場景居多。本章節(jié)將結(jié)合各行業(yè)具體落地場景分析目前知識圖譜的應(yīng)用現(xiàn)狀。
2.3.1金融行業(yè)知識圖譜應(yīng)用場景分析
(1)金融行業(yè)營銷與風(fēng)控業(yè)務(wù)場景應(yīng)用分析:
在對公業(yè)務(wù)的激烈競爭中,銀行需要增強對企業(yè)關(guān)聯(lián)關(guān)系網(wǎng)中產(chǎn)生的商機事件的洞察能力,及時抓住營銷窗口期;
隨著宏觀經(jīng)濟環(huán)境不確定性的增加,銀行需要增強對企業(yè)關(guān)聯(lián)關(guān)系網(wǎng)中傳導(dǎo)的行業(yè)景氣度波動、重大負面事件等風(fēng)險事件的洞察能力,建立重大風(fēng)險事件快速響應(yīng)和應(yīng)急處置機制,及時發(fā)現(xiàn)潛在風(fēng)險,提高風(fēng)險監(jiān)測與預(yù)警能力;
知識圖譜可以為銀行對公業(yè)務(wù)實現(xiàn)跨行業(yè)和跨企業(yè)的關(guān)系網(wǎng)絡(luò)的構(gòu)建,重塑對公業(yè)務(wù)營銷與風(fēng)控的過程,提升風(fēng)險管理和營銷管理的效率,特別是在反洗錢、反欺詐、輿情風(fēng)控等環(huán)節(jié)中,知識圖譜可以起到關(guān)鍵作用;
國內(nèi)銀行目前正在積極進行線上零售轉(zhuǎn)型,大力發(fā)展個貸、微貸業(yè)務(wù),需要增強對零售客戶的數(shù)據(jù)洞察能力,挖掘客戶的真實需求,實現(xiàn)千人千面,從而實現(xiàn)精準觸達;
伴隨著業(yè)務(wù)的發(fā)展,背后隱藏的風(fēng)險也日益凸顯,“薅羊毛”、親友集中借貸、“壘大戶“等問題頻發(fā),因此,貸前審查和貸后管理中對于客戶之間關(guān)聯(lián)關(guān)系的識別非常重要;
通過構(gòu)建關(guān)聯(lián)圖譜,打通零售業(yè)務(wù)場景下客戶從申請到貸后的全流程數(shù)據(jù),建立零售客戶全業(yè)務(wù)周期畫像、客戶關(guān)系畫像,可以使銀行在縮短營銷周期、降低營銷成本的同時確保風(fēng)險可控。
(2)金融行業(yè)構(gòu)建金融領(lǐng)域知識庫業(yè)務(wù)場景應(yīng)用分析:
金融機構(gòu)內(nèi)部在業(yè)務(wù)運行過程中累積了大量的知識與經(jīng)驗,這些知識與經(jīng)驗存在于領(lǐng)域?qū)<夷X中或技術(shù)文檔中,難以得到有效利用,很多金融機構(gòu)嘗試使用知識管理系統(tǒng),但知識管理系統(tǒng)中的知識與知識之間存在信息孤島,沒有建立知識之間的聯(lián)系,知識的管理維護、更新升級等也都存在問題;基于知識圖譜,可以有效將知識與業(yè)務(wù)進行關(guān)聯(lián),有效管理知識體系的同時更好地賦能業(yè)務(wù);
在將知識圖譜技術(shù)應(yīng)用于營銷、風(fēng)控等業(yè)務(wù)環(huán)節(jié)的過程中,本質(zhì)上是建立了營銷領(lǐng)域和風(fēng)控領(lǐng)域的知識庫,隨著知識圖譜技術(shù)在金融行業(yè)的滲透,金融機構(gòu)開始想要打造全公司級別的知識庫或知識中臺,將全公司的數(shù)據(jù)進行關(guān)聯(lián),滿足不同業(yè)務(wù)部門的需求,更好的推動業(yè)務(wù)運行。
?。?)金融行業(yè)在智能客服業(yè)務(wù)場景應(yīng)用分析:
隨著人工客服成本的逐年上漲,客服機器人在金融領(lǐng)域已經(jīng)開始廣泛使用,但在金融領(lǐng)域使用的客服機器人不同于一般的聊天機器人,對回答準確率的要求較高,現(xiàn)階段,客服機器人只能作為人工客服的輔助和補充,主要應(yīng)用在人工客服人手不足或是對服務(wù)質(zhì)量要求不高的場景上;
金融機構(gòu)對客服機器人的智能化水平要求不斷增加,需要客服機器人對問題中模糊的部分通過上下文對話的關(guān)聯(lián)進行意圖識別,給客戶帶來更好的服務(wù)體驗;
基于知識圖譜技術(shù)的客服機器人,可以理解用戶意圖,實現(xiàn)上下文交互的對話流程。
2.3.2政府與公共服務(wù)行業(yè)知識圖譜應(yīng)用場景分析
(1)公共安全行業(yè)刑偵、經(jīng)偵、反恐、治安管理等業(yè)務(wù)應(yīng)用分析:
目前公共安全行業(yè)的智能化應(yīng)用主要停留在感知智能,強調(diào)前端數(shù)據(jù)的采集以及后端視頻解析能力,認知智能的應(yīng)用推廣有限,導(dǎo)致公安數(shù)據(jù)信息規(guī)模龐大、數(shù)據(jù)復(fù)雜。辦案人員需要將海量數(shù)據(jù)快速抽取成知識,發(fā)現(xiàn)有用信息;
違法犯罪活動本身具備隱蔽性、團伙性等特征,在技術(shù)高速發(fā)展的背景下,又呈現(xiàn)出網(wǎng)絡(luò)化、智能化、復(fù)雜化等新特征,增加了公安人員的辦案難度。面對當前的公安業(yè)務(wù)新挑戰(zhàn),公安部門推動公安系統(tǒng)智能化改造,打破系統(tǒng)原有信息孤島,挖掘潛在隱藏信息,分析關(guān)聯(lián)關(guān)系,形成知識網(wǎng)絡(luò),通過技術(shù)手段支撐“人、事、地、物、組織”等刑偵關(guān)鍵要素;
案件的核心是“人”,在經(jīng)濟犯罪過程中,關(guān)鍵人員一定會留痕于關(guān)系網(wǎng)絡(luò),但關(guān)鍵在于,面對錯綜復(fù)雜的海量數(shù)據(jù),經(jīng)偵部門需要梳理脈絡(luò),利用知識圖譜,形成人員、企業(yè)等要素的關(guān)系網(wǎng)絡(luò),搜尋關(guān)鍵線索,挖掘深層次信息;
由于暴恐事件具有團伙性、隱蔽性以及線上與線下關(guān)聯(lián)性等特征,公安機關(guān)需對重點人員布控,基于知識圖譜利用車輛與人員軌跡、同行人等數(shù)據(jù)建立風(fēng)險預(yù)測模型,發(fā)掘隱性重點人員,形成團伙關(guān)系網(wǎng)絡(luò),通過團伙聚集度、活躍度、危險度等多維度信息對團伙進行布控設(shè)防;
治安事件發(fā)生具有突然性,當團伙發(fā)生案件時,若不能現(xiàn)場及時抓捕,后期可通過涉案人員關(guān)系圖譜發(fā)掘潛在嫌疑人;針對有一定犯罪企圖的重點人員,利用智能手段,建立重點人員預(yù)警模型,并通過關(guān)系圖譜與軌跡信息,及時發(fā)現(xiàn)違法活動,阻止治安事件發(fā)生。
(2)交通行業(yè)業(yè)務(wù)場景應(yīng)用分析:
面對城市交通擁堵問題,利用知識圖譜技術(shù),將前端感知設(shè)備采集數(shù)據(jù)形成人、車、道理的大交通關(guān)系圖譜,通過交通業(yè)務(wù)模型,利用路口信號燈實時調(diào)度城市交通系統(tǒng);
針對突發(fā)情況導(dǎo)致的道路無法通行,交通部門需要快速響應(yīng)進行路徑規(guī)劃,合理指揮車輛規(guī)避風(fēng)險路段,將影響降到最小。將時空概念引入,利用動態(tài)知識圖譜技術(shù),更快速的進行道路規(guī)劃;
電警、卡口、人臉抓拍攝像機的廣泛應(yīng)用使得交通大數(shù)據(jù)中具有海量車牌與人臉照片,通過知識圖譜技術(shù)可以快速構(gòu)建人、車關(guān)系圖譜,交管部門可以快速檢索居民與同行人的軌跡信息。
(3)政務(wù)數(shù)字化業(yè)務(wù)場景應(yīng)用分析:
在政務(wù)數(shù)字化的建設(shè)過程中,政府各部門主導(dǎo)建立業(yè)務(wù)系統(tǒng),導(dǎo)致系統(tǒng)之間形成“信息孤島”,不能有效的統(tǒng)一調(diào)度。采用知識圖譜等新興技術(shù),平臺將部門壁壘與信息孤島現(xiàn)象打破,形成統(tǒng)一的數(shù)據(jù)標準規(guī)范服務(wù)業(yè)務(wù)應(yīng)用;
目前各級政府部門已形成海量數(shù)據(jù)資源池,但真正能服務(wù)于業(yè)務(wù)的數(shù)據(jù)應(yīng)用卻較少。采用知識圖譜技術(shù),平臺將各部門數(shù)據(jù)抽取融合形成知識,搭建政務(wù)領(lǐng)域知識中臺,為上層各業(yè)務(wù)部門工作提供知識支持;
政府對于社會的宏觀調(diào)控需要多維數(shù)據(jù)支撐,需要挖掘社會關(guān)鍵要素之間的隱性關(guān)系,輔助政府部門決斷。知識圖譜技術(shù)具有較強的關(guān)聯(lián)關(guān)系分析能力,通過社會要素的關(guān)聯(lián)分析與模型推算,在宏觀調(diào)控、社會管控、政策實施、災(zāi)害防控等多方面為政府決策提供數(shù)據(jù)支撐。
2.3.3醫(yī)療與醫(yī)藥行業(yè)知識圖譜應(yīng)用場景分析
(1)藥企業(yè)務(wù)場景應(yīng)用分析:
從藥物研發(fā)到臨床試驗再到上市推廣,醫(yī)學(xué)翻譯貫穿于藥企的整個業(yè)務(wù)生命周期中,醫(yī)療的特殊性使得藥企對醫(yī)學(xué)翻譯的專業(yè)性提出極高的要求;
基于知識圖譜的機器翻譯,通過構(gòu)建專業(yè)領(lǐng)域的知識體系,可以極大提高醫(yī)學(xué)翻譯的專業(yè)性和準確性,使翻譯結(jié)果更加符合醫(yī)學(xué)邏輯,保證翻譯質(zhì)量;
“4+7”帶量采購使得跨國藥企面臨藥價下調(diào)的壓力,產(chǎn)品的覆蓋力度和頻率下降,亟需快速挖掘新市場以及提高對原有覆蓋客戶的精準營銷;在醫(yī)藥營銷“合規(guī)”的背景下,“帶金銷售”的醫(yī)藥代表模式走不通,數(shù)字化營銷成為藥企實現(xiàn)合規(guī)、高效、低成本的營銷手段;
藥企通過搭建自己的知識體系平臺或問答平臺,構(gòu)建產(chǎn)品知識圖譜、疾病知識圖譜、用藥知識圖譜等,可以精準地為醫(yī)生推送其感興趣的內(nèi)容,幫助醫(yī)生正確用藥、正確做治療,提高醫(yī)生對藥企產(chǎn)品的認可度。
?。?)醫(yī)院業(yè)務(wù)場景應(yīng)用分析:
患者去醫(yī)院就診時,經(jīng)常會遇到“知癥不知病”、“知病不知科”的問題,現(xiàn)有的導(dǎo)診方式一般為人工導(dǎo)診或基于關(guān)鍵詞的導(dǎo)診系統(tǒng),導(dǎo)診的效率和效果有待提升;為患者提供精準的智能導(dǎo)診服務(wù),不僅可以為患者快速找到合適的科室和合適的醫(yī)生,減少患者就診時間,同時可以緩解醫(yī)務(wù)人員工作壓力、促進醫(yī)療資源合理配置;
基于知識圖譜的智能導(dǎo)診系統(tǒng),借助知識圖譜的推理能力,患者只需描述癥狀或疾病,就可以為患者提供智能導(dǎo)診服務(wù),匹配科室和醫(yī)生,緩解醫(yī)院導(dǎo)診服務(wù)的壓力,提高醫(yī)院的智能化管理水平。
2.3.4能源與工業(yè)行業(yè)知識圖譜應(yīng)用場景分析
國內(nèi)工業(yè)水平發(fā)展參差不齊,長期的行業(yè)不景氣導(dǎo)致企業(yè)信息化發(fā)展較慢,目前大部分企業(yè)數(shù)據(jù)粗放式管理,可用性與易用性較差,難以形成知識積累。隨著競爭加劇,以電力、石化、工業(yè)、水務(wù)為代表的資源密集型企業(yè)加速向技術(shù)密集型與數(shù)字密集型企業(yè)轉(zhuǎn)型,提高企業(yè)數(shù)字化能力;
面對能源與工業(yè)行業(yè)的業(yè)務(wù)挑戰(zhàn),企業(yè)需求將數(shù)據(jù)形成知識,創(chuàng)建支持上層業(yè)務(wù)應(yīng)用的領(lǐng)域知識庫,在輔助業(yè)務(wù)應(yīng)用的同時進行相應(yīng)的知識積累。員工可通過知識庫快速獲取知識,降低培訓(xùn)與研發(fā)成本。
2.3.5電信行業(yè)知識圖譜應(yīng)用場景分析
市場已經(jīng)趨近于飽和的電信行業(yè),提高服務(wù)質(zhì)量是運營商爭取客戶的重要舉措。由于人工客服的培訓(xùn)流程較長且人員流動性較強,建立運營商領(lǐng)域知識庫是快速提高客服人員服務(wù)質(zhì)量的有效方法??头藛T通過檢索知識庫獲取知識,快速、準確地回答客戶問題;
5G時代的到來,運營商更注重下沉市場。但對下沉市場的運營需要大量資源投入。建立運營商領(lǐng)域知識庫,一線工作人員可以通過檢索知識庫的方式快速獲取知識;
運營商利用知識圖譜技術(shù)通過對購買人的關(guān)聯(lián)關(guān)系圖譜分析,可以快速獲取潛在客戶群體,發(fā)掘隱性商機。
2.3.6零售行業(yè)知識圖譜應(yīng)用場景分析
在零售數(shù)字化的進程中,零售商獲取了大量消費者、商品以及門店的數(shù)據(jù),但數(shù)據(jù)的價值在于發(fā)現(xiàn)三者的關(guān)聯(lián)關(guān)系。通過知識圖譜技術(shù),零售商構(gòu)建商品知識圖譜,以商品為核心,發(fā)掘三者的隱性關(guān)系,輔助商品營銷;
門店選址時,品牌商要高效、準確的選擇新區(qū)域內(nèi)最佳位置。通過大量的門店數(shù)據(jù),基于知識圖譜技術(shù),可快速構(gòu)建門店領(lǐng)域知識庫,幫助企業(yè)根據(jù)產(chǎn)品類型快速發(fā)現(xiàn)區(qū)域內(nèi)的空白市場點位,輔助決策人完成門店選址工作。
2.4 知識圖譜的落地關(guān)鍵舉措及挑戰(zhàn)
2.4.1知識圖譜落地的關(guān)鍵步驟
由1.1.3節(jié)可以看出,知識圖譜的關(guān)鍵步驟包括知識抽取、知識融合、知識推理、知識存儲與知識應(yīng)用等關(guān)鍵五步。其中,知識抽取與知識融合環(huán)節(jié)共同完成知識構(gòu)建,在知識構(gòu)建的構(gòu)建的過程,從海量數(shù)據(jù)中抽取概念、實體、關(guān)系和屬性,并進行消歧、對齊和融合。

知識抽?。好鎸A康臄?shù)據(jù)源,在構(gòu)建知識圖譜的過程中,需要自動化的技術(shù)抽取可用的知識單元,其中知識單元包含實體、屬性與關(guān)系三個要素。并通過不斷形成的知識單元,形成知識表達,為上層的構(gòu)建提供基礎(chǔ)能力;
可以看出,知識抽取即可拆分為實體抽取、關(guān)系抽取以及屬性抽取的技術(shù)。其中由于屬性抽取主要針對實體可以看成是實體與屬性值之間的關(guān)系抽取問題,所以屬性抽取技術(shù)可以借鑒使用關(guān)系抽取技術(shù)的相關(guān)思想。實體抽取也可認為是命名實體的學(xué)習(xí)與識別,即從原始的語料中自動識別出命名實體;
實體是知識圖譜中的最基本元素,其抽取的完整性、準確率、召回率等將直接影響到知識庫的質(zhì)量。因此,實體抽取是知識抽取中最為基礎(chǔ)與關(guān)鍵的一步。

知識融合:知識融合是針對于知識質(zhì)量問題,進行高層次的知識組織,使來自不同知識源的知識在同一框架規(guī)范下進行異構(gòu)數(shù)據(jù)整合、消歧、加工、推理驗證、更新等步驟,達到數(shù)據(jù)、經(jīng)驗以及人的思想的融合,形成高質(zhì)量的知識庫;
知識融合技術(shù)主要包括實體對齊、知識加工、知識更新。其中實體對齊也稱為實體匹配或?qū)嶓w解析,主要是用于消除異構(gòu)數(shù)據(jù)中的實體沖突、指代不明等問題。在通過實體對齊后,已形成知識的雛形,但未形成知識體系,需要通過知識加工進行構(gòu)建。知識更新主要作用于知識體系,進行不斷的迭代更新,拓展知識。

知識推理:知識推理也為知識計算,是結(jié)合行業(yè)Know-How,計算知識中的顯性與隱性關(guān)系和拓展屬性;是在知識庫的基礎(chǔ)上進一步挖掘隱含的知識,豐富知識庫。目前行業(yè)內(nèi)的隱性關(guān)系挖掘,如銀行業(yè)零售與營銷業(yè)務(wù)場景、公安智能刑偵、公安智能經(jīng)偵場景中的隱性關(guān)系挖掘,風(fēng)險傳導(dǎo)識別都是基于知識圖譜的知識推理能力。知識推理的方法主要有三種,其中基于邏輯的推理方法以及基于圖的推理是最主要的兩種類別的方法。同時,行業(yè)內(nèi)正在研究跨知識庫的推理方法。

知識存儲:知識存儲保障知識圖譜平臺順利運行,是關(guān)鍵的知識圖譜基礎(chǔ)。目前行業(yè)內(nèi)主流的存儲模式有三種:RDF(Resource Description Framework),即資源描述框架、關(guān)系型數(shù)據(jù)庫以及圖數(shù)據(jù)庫。由于關(guān)系型數(shù)據(jù)庫存儲圖數(shù)據(jù)可以很好的解決單條數(shù)據(jù)查詢的問題,在存儲效率和查詢效率上都有很大的優(yōu)勢。同時,關(guān)系型數(shù)據(jù)庫是目前最成熟也應(yīng)用最廣的數(shù)據(jù)庫。但對于關(guān)系的實時查詢以及深度關(guān)聯(lián)查詢時,關(guān)系型數(shù)據(jù)庫不能做好很好的支持。圖數(shù)據(jù)庫相對而言有著高性能的表現(xiàn),在數(shù)據(jù)靈活性以及開發(fā)敏捷性方面,圖數(shù)據(jù)庫有較大優(yōu)勢。RDF本質(zhì)上為數(shù)據(jù)模型,提供統(tǒng)一標準描述實體,能夠較好的用圖描述,但存在設(shè)計不夠靈活、存儲空間大等問題;
在實際項目中,要實際根據(jù)數(shù)據(jù)特點進行數(shù)據(jù)存儲結(jié)構(gòu)選擇與設(shè)計,而且目前沒有任何一種通用的存儲方式可以解決所有的問題,每一種存儲方式都存在自身的局限性,所以在項目中要靈活配置使用數(shù)據(jù)存儲結(jié)構(gòu)。

知識應(yīng)用:在2.1節(jié)可以看到,目前知識圖譜技術(shù)在垂直行業(yè)已有較多應(yīng)用場景。目前,知識圖譜的構(gòu)建和使用是以應(yīng)用場景為導(dǎo)向。在行業(yè)內(nèi)尋求應(yīng)用場景,理解用戶核心需求,判斷是否能應(yīng)用知識圖譜后,再根據(jù)應(yīng)用場景構(gòu)建知識圖譜;
在整個知識圖譜的知識應(yīng)用過程中;有兩個核心關(guān)鍵點:1)找到業(yè)務(wù)與知識圖譜技術(shù)的結(jié)合點,結(jié)合點的選取將直接影響實際應(yīng)用效果。2)知識圖譜的schema的設(shè)計,不同行業(yè)的知識體系不完全一樣,具有較強的領(lǐng)域性,在設(shè)計schema的過程要求業(yè)務(wù)專家與技術(shù)人員協(xié)作完成,這也是知識圖譜構(gòu)建的難點;
知識圖譜技術(shù)作為感知智能向認知智能跨進的關(guān)鍵技術(shù),在行業(yè)內(nèi)的應(yīng)用場景會逐步地增加,相較于其他人工智能技術(shù),知識圖譜技術(shù)需要與行業(yè)Know-How有深度結(jié)合,更多的業(yè)務(wù)專家參與知識圖譜的構(gòu)建過程,會更有利于知識圖譜的落地,

2.4.2知識圖譜落地的“一核兩翼”
上一小節(jié)可以看到,知識圖譜技術(shù)落地的關(guān)鍵步驟為:知識構(gòu)建(知識抽取與知識融合)、知識推理、知識存儲與知識應(yīng)用。其中,針對上一節(jié)中關(guān)鍵步驟中影響因素進行提煉總結(jié),可得到?jīng)Q定知識圖譜技術(shù)落地效果好壞的三大關(guān)鍵因素,本報告總結(jié)為“一核兩翼”,即專業(yè)團隊、數(shù)據(jù)與算法模型。
“一核兩翼”中“一核”指的專業(yè)團隊,這里的專業(yè)團隊指行業(yè)專家與技術(shù)專家和用戶共同組成的團隊。行業(yè)專家與技術(shù)專家配合構(gòu)建專業(yè)領(lǐng)域知識圖譜,客戶與技術(shù)專家完成知識圖譜后期的運營與知識更新,讓知識圖譜“跑起來”。在“兩翼”能力越來越接近的今天,專業(yè)團隊對于項目應(yīng)用的影響是決定性的。
“兩翼”指數(shù)據(jù)與算法模型,知識圖譜是連接數(shù)據(jù)知識與業(yè)務(wù)場景的關(guān)鍵技術(shù),數(shù)據(jù)在整個知識圖譜構(gòu)建的過程中起到?jīng)Q定性作用,但由于數(shù)據(jù)來源廣泛、各行業(yè)數(shù)據(jù)質(zhì)量參差不齊,對于數(shù)據(jù)的治理、標注與知識圖譜構(gòu)建中的知識抽取加工的工作是老生常談的難題,后面應(yīng)用過程中的數(shù)據(jù)查詢、分類也存在挑戰(zhàn)。
算法模型則是支撐知識圖譜自動化應(yīng)用的核心,算法模型涵蓋知識圖譜構(gòu)建的全流程工作,從最開始的數(shù)據(jù)治理到最終的應(yīng)用查詢,是知識圖譜廠商技術(shù)實力與行業(yè)Know-How能力的體現(xiàn)。數(shù)據(jù)與算法模型的配合應(yīng)用支撐知識圖譜的行業(yè)落地。

2.4.3知識圖譜技術(shù)落地挑戰(zhàn)
實際應(yīng)用過程中,知識圖譜在落地中會出現(xiàn)很多挑戰(zhàn)與困難,而其實知識圖譜落地出現(xiàn)的困難正是由于廠商與用戶在構(gòu)建“一核兩翼”能力過程中出現(xiàn)問題,典型挑戰(zhàn)與困難可以歸納為“數(shù)據(jù)不精、業(yè)務(wù)不專、技術(shù)不強、配合不暢”。
數(shù)據(jù)不精:問題的核心是在部分信息化發(fā)展較緩慢的行業(yè),行業(yè)數(shù)據(jù)整體治理水平較差,甚至部分關(guān)鍵數(shù)據(jù)仍未進行有效管控,需要知識圖譜廠商進行合理的規(guī)劃建設(shè)。但知識圖譜廠商并非數(shù)據(jù)中臺廠商,知識圖譜廠商更強調(diào)基于有效的數(shù)據(jù)進行上層應(yīng)用的建設(shè)。對于海量數(shù)據(jù)的治理工作能力有限,造成項目工期延長或適當降低項目功能預(yù)期等情況。隨著各行業(yè)信息化以及數(shù)字化建設(shè)的推廣,數(shù)據(jù)中臺產(chǎn)品也將得到較好的推廣,未來基于數(shù)據(jù)中臺產(chǎn)品之上進行知識圖譜建設(shè),將有效的緩解數(shù)據(jù)不精的問題;
業(yè)務(wù)不專:業(yè)務(wù)不專的核心在于廠商理解用戶需求,尋找知識圖譜與業(yè)務(wù)的結(jié)合點,有效的賦能業(yè)務(wù)場景。前面幾節(jié)已經(jīng)多次強調(diào)業(yè)務(wù)專家以及行業(yè)知識對于知識圖譜搭建的重要性;
知識圖譜schema的設(shè)計是需要業(yè)務(wù)專家的深度參與。由于不同行業(yè)、不同領(lǐng)域?qū)τ谥R的需求天差萬別,所以很難出現(xiàn)跨行業(yè)通用的知識圖譜搭建工具。同時,知識圖譜的搭建過程本身也是一個行業(yè)知識的封裝過程,只有業(yè)務(wù)專家的參與,才能更好的形成真實契合行業(yè)需求的知識圖譜;
技術(shù)不強:知識圖譜在應(yīng)用的過程中,針對算法模型的封裝、智能推理、搜索推薦、智能問答等多應(yīng)用環(huán)節(jié)都存在一定的技術(shù)壁壘。同時,由于不同行業(yè)場景的需求不同,知識圖譜普遍在各行業(yè)落地過程中存在較大的定制工作量,需要廠商不斷的積累產(chǎn)品能力才能提高產(chǎn)品率,降低定制量;
配合不暢:知識圖譜作為一項無自身單獨使用場景的底層技術(shù),需要技術(shù)人員與業(yè)務(wù)專家以及用戶方進行有效配合。知識圖譜項目很難單獨依靠廠商自身能力單獨完成項目。在落地的過程中,業(yè)務(wù)專家與技術(shù)專家對于甲方用戶需求的理解、應(yīng)用場景的選擇,都來源于項目實施過程中的配合。用戶、業(yè)務(wù)專家與技術(shù)專家良好的配合將有效促進項目落地的使用效果。
3.知識圖譜最佳實踐案例
知識圖譜已經(jīng)在垂直領(lǐng)域內(nèi)有一定的成功應(yīng)用案例,本報告總結(jié)在金融行業(yè)、醫(yī)療與醫(yī)藥行業(yè)、政府與公共服務(wù)行業(yè)以及能源與工業(yè)行業(yè)中的六個最佳實踐案例。
最佳實踐案例對于知識圖譜落地有重要的指導(dǎo)意義,企業(yè)可根據(jù)同行業(yè)內(nèi)最佳實踐案例制定符合自身業(yè)務(wù)需求的知識圖譜解決方案,做到快速落地、及時應(yīng)用。
3.1金融行業(yè)最佳實踐案例
3.1.1銀行對公業(yè)務(wù)營銷與風(fēng)控場景最佳實踐案例
對公業(yè)務(wù)營銷與風(fēng)控是銀行的核心業(yè)務(wù)場景之一,但對公業(yè)務(wù)競爭激烈,銀行需要增強事件驅(qū)動的商機洞察能力,及時抓住營銷窗口期。同時,國內(nèi)存在大量由企業(yè)連環(huán)擔保形成的“擔保圈”,潛在傳導(dǎo)風(fēng)險大,隨著宏觀經(jīng)濟不確定性因素的增加,銀行需要增強對“擔保圈”企業(yè)關(guān)聯(lián)關(guān)系的洞察能力,從而及時預(yù)知和抵御風(fēng)險。
知識圖譜技術(shù)目前已在銀行對公業(yè)務(wù)營銷與風(fēng)控場景有成功應(yīng)用。在幫助銀行構(gòu)建知識圖譜的過程中,知識圖譜廠商應(yīng)具備以下能力:
銀行數(shù)據(jù)量巨大,需要廠商具備大規(guī)模知識圖譜構(gòu)建能力;
快速融合銀行內(nèi)外部相關(guān)數(shù)據(jù),快速構(gòu)建銀行內(nèi)部的知識圖譜平臺;
以知識圖譜技術(shù)為核心,同時具備開發(fā)業(yè)務(wù)模型、構(gòu)建客戶標簽體系等能力;
兼容性強,既可以作為獨立的知識圖譜平臺,又可以與其他平臺相對接,對外輸出知識。
星環(huán)科技拓展知識圖譜能力,賦能銀行對公風(fēng)控與營銷場景
風(fēng)險管理涉及銀行核心業(yè)務(wù)板塊,但傳統(tǒng)風(fēng)控體系依靠專家規(guī)則與巴賽爾協(xié)議的各項指標,指標對于先驗的專家規(guī)則存在較強的依賴性,對于未發(fā)現(xiàn)的異常點無從下手。
同時,各業(yè)務(wù)子系統(tǒng)中存在海量數(shù)據(jù),如何在海量數(shù)據(jù)中挖掘有價值的信息,并進行有效的關(guān)聯(lián)融合,打破各業(yè)務(wù)子系統(tǒng)的數(shù)據(jù)孤島問題,亟待行方解決。
知識圖譜能夠用數(shù)據(jù)做一系列的衍生類操作,賦能銀行具體業(yè)務(wù)的營銷與風(fēng)控。某股份制商業(yè)銀行信息科技部負責(zé)人表示:“知識圖譜在金融方面的應(yīng)用主要是在拓客以及風(fēng)險識別和反欺詐等領(lǐng)域,這些領(lǐng)域呈現(xiàn)的特點就是對數(shù)據(jù)大規(guī)模的應(yīng)用,除此之外就是對圖譜圖算法時效性以及深層次推理能力有更高的要求。”
星環(huán)科技專注于企業(yè)級容器云計算、大數(shù)據(jù)和人工智能核心平臺的產(chǎn)品研發(fā),為用戶提供一站式、交互式的知識圖譜構(gòu)建工具,支持圖譜構(gòu)建、知識存儲、分布式圖譜計算以及圖譜案例分析。

某股份制商業(yè)銀行從2018年開始與星環(huán)科技合作建設(shè)知識圖譜分析應(yīng)用體系,整體項目建設(shè)主要分為三個階段:圖譜構(gòu)建、風(fēng)險傳導(dǎo)算法研發(fā)、3D可視化分析。
第一步:完成對公企業(yè)客戶的知識圖譜構(gòu)建;
第二步:基于已構(gòu)建的對公企業(yè)知識圖譜,進行風(fēng)險傳導(dǎo)算法研發(fā)與應(yīng)用;
第三步:實現(xiàn)知識圖譜的3D可視化分析,對接各業(yè)務(wù)應(yīng)用平臺。
知識圖譜平臺功能主要包括圖譜存儲、圖譜分析、圖譜可視化和圖譜應(yīng)用四個方面,用于客戶精準營銷、風(fēng)險防控、運營優(yōu)化以及管理決策。特別在風(fēng)險防控方面,借助知識圖譜平臺快速建立不同場景風(fēng)控圖譜,借助圖算法分析異常行為;同時,知識圖譜平臺支持信息動態(tài)更新以及風(fēng)險計算的實時調(diào)用。

整體知識圖譜平臺由存儲計算層、自動化建模層以及決策層組成:
存儲計算層:在存儲計算層強調(diào)多模態(tài)數(shù)據(jù)的應(yīng)用,目前是包含四類的數(shù)據(jù)庫,其中最主要就是圖數(shù)據(jù)庫,來支持知識圖譜的存儲和計算;
自動化建模層:在自動化建模層主要提供四大能力的支撐,第一項能力是搭建金融領(lǐng)域的本體庫,第二項能力是在自動化建模平臺上進行有效圖譜的融合,實現(xiàn)圖數(shù)據(jù)和本體進行有效的連接。第三項能力是圖算法的分析能力。第四項能力是提供整個知識圖譜模型的調(diào)度以及監(jiān)控的能力;
決策層:重點是往四個方向去輸出知識圖譜的應(yīng)用:精準營銷、風(fēng)險防控、業(yè)務(wù)優(yōu)化以及管理決策。
知識圖譜平臺的價值體現(xiàn)在四個方面:
平臺構(gòu)建完成企業(yè)關(guān)聯(lián)關(guān)系圖譜,涵蓋銀行客戶千萬個實體與實體之間的關(guān)系,并提供八大類關(guān)系檢索(法人、實控、集團、任職、擔保、投資、股東、交易關(guān)系)。目前平臺此項功能應(yīng)用于新客的拓展以及集團關(guān)系認定等業(yè)務(wù)場景中;
實際計算中,單個風(fēng)險點出發(fā)計算全局的風(fēng)險值時間控制在1~4min;
平臺實現(xiàn)基于自然語言查詢的3D交互知識圖譜應(yīng)用,支持用戶以自然語言輸出查詢的方式進行圖上檢索,降低圖數(shù)據(jù)的應(yīng)用門檻,方便總行業(yè)務(wù)人員以及分行的分析人員使用;
平臺實現(xiàn)企業(yè)風(fēng)險傳導(dǎo)的3D圖譜應(yīng)用,實現(xiàn)企業(yè)風(fēng)險在集團內(nèi)部或者企業(yè)內(nèi)部的動態(tài)穿透的分析能力。同時,對于分析人員,3D圖譜相較于2D平面圖譜有高幾十倍的點邊展示能力,且具有較強的解釋性,既可以展示企業(yè)風(fēng)險分又可展示動態(tài)風(fēng)險傳播路徑。
3.1.2銀行零售業(yè)務(wù)營銷與風(fēng)控場景最佳實踐案例
零售業(yè)務(wù)營銷與風(fēng)控是銀行的核心業(yè)務(wù)場景之一。在實際的業(yè)務(wù)場景中,用戶需求日益?zhèn)€性化、多元化,銀行需要增強用戶群體的數(shù)據(jù)洞察能力,挖掘用戶真實需求,并需要基于數(shù)據(jù)分析進行產(chǎn)品設(shè)計、渠道選擇和營銷策劃,實現(xiàn)千人千面,從而精準觸達用戶;同時,零售業(yè)務(wù)是存量市場的競爭,銀行需要批量拓展消費端場景,增強場景獲客能力;在零售信貸申請、交易、支付等環(huán)節(jié)中,對欺詐風(fēng)險的抵御至關(guān)重要。
知識圖譜技術(shù)目前已在銀行零售業(yè)務(wù)營銷與風(fēng)控場景有成功應(yīng)用。在幫助銀行構(gòu)建知識圖譜的過程中,知識圖譜廠商應(yīng)具備以下能力:
零售業(yè)務(wù)線眾多,包含信用卡、貸款、理財、儲蓄等,要求廠商具備跨渠道、跨業(yè)務(wù)打通數(shù)據(jù)的能力,不僅對各個業(yè)務(wù)線有高度的理解,還要具備良好的服務(wù)意識;
以知識圖譜技術(shù)為核心,同時具備開發(fā)業(yè)務(wù)模型、構(gòu)建客戶標簽體系等能力;
在項目實施過程中需要配備經(jīng)驗豐富的業(yè)務(wù)專家、算法專家和數(shù)據(jù)專家;
兼容性強,既可以作為獨立的知識圖譜平臺,又可以與其他平臺相對接,對外輸出知識。
以知識圖譜為動能,海致星圖賦能零售風(fēng)控與營銷
某股份制商業(yè)銀行作為國內(nèi)金融科技實踐的先驅(qū),為提升數(shù)據(jù)價值不斷進行積極的探索。 目前已取得一定應(yīng)用成果。
某股份制商業(yè)銀行信用卡中心客戶經(jīng)理需要每天關(guān)注手上數(shù)十家客戶的風(fēng)險信息,更需要不斷的挖掘轄區(qū)內(nèi)優(yōu)質(zhì)潛在客戶的營銷機會。而這些風(fēng)險和營銷的信號散落在行內(nèi)外以及互聯(lián)網(wǎng)各處,靠客戶經(jīng)理個人能力不僅很難覆蓋,而且成本越來越高。
同時,由于企業(yè)間的復(fù)雜關(guān)系網(wǎng)絡(luò),營銷機會與風(fēng)險信息的傳導(dǎo)更難以捕獲。營銷機會流失的同時背后的風(fēng)險也日益凸顯。
某股份制商業(yè)銀行信用卡中心通過構(gòu)建知識圖譜平臺,打通零售業(yè)務(wù)場景下客戶從申請到貸后的全流程數(shù)據(jù),建立零售客戶全業(yè)務(wù)周期畫像、客戶關(guān)系畫像,可以使銀行在縮短營銷周期、降低營銷成本的同時確保風(fēng)險可控。
海致星圖是一家致力于利用機器學(xué)習(xí)、知識圖譜等人工智能前沿技術(shù),為金融領(lǐng)域提供專屬的數(shù)據(jù)、技術(shù)及業(yè)務(wù)解決方案的大數(shù)據(jù)公司,在金融行業(yè)大數(shù)據(jù)與人工智能應(yīng)用領(lǐng)域,有著豐富的經(jīng)驗與廣泛的成功案例。
某股份制商業(yè)銀行信用卡中心與海致星圖合作,構(gòu)建卡中心級支持多場景應(yīng)用的知識圖譜平臺。平臺基于數(shù)據(jù)處理,實現(xiàn)關(guān)系圖譜的實時可視化事務(wù)查詢、基于知識圖譜的各類標簽輸出與圖挖掘功能。
同時,知識圖譜平臺與各業(yè)務(wù)系統(tǒng)對接以支撐業(yè)務(wù)部門應(yīng)用,各部門在平臺上構(gòu)建專屬圖模型,包括社群檢測、親密度評分、貸后失聯(lián)修復(fù)、社交網(wǎng)絡(luò)特征提取等,進一步實現(xiàn)客戶關(guān)系挖掘營銷與風(fēng)險控制。

某股份制商業(yè)銀行信用卡中心在構(gòu)建知識圖譜平臺過程中,對接全行30億+實體數(shù)據(jù)與120億+條關(guān)系邊數(shù)據(jù),涉及16類實體、18種基礎(chǔ)關(guān)系和28種挖掘類關(guān)系。平臺整合內(nèi)外部數(shù)據(jù),構(gòu)建企業(yè)間錯綜復(fù)雜的業(yè)務(wù)、控制、擔保等關(guān)系,實現(xiàn)風(fēng)險與營銷信號在關(guān)系網(wǎng)絡(luò)傳導(dǎo)識別,服務(wù)業(yè)務(wù)應(yīng)用。
某股份制銀行信用卡中心與海致星圖合作的知識圖譜平臺價值體現(xiàn)在四個方面:
銀行信用卡催收中心日常催收搜尋工作時長縮短25%,有效挖掘并修復(fù)的失聯(lián)客戶數(shù)提高23%;偽冒偵測中心有效識別了疑似欺詐團伙800余起,環(huán)比提升超過20%;
信用卡中心基于平臺進行批量發(fā)卡營銷部門的客戶觸達數(shù)環(huán)比提高18%;
信用卡中心基于平臺進行了關(guān)聯(lián)營銷潛客名單挖掘、行業(yè)營銷價值評估、上下游企業(yè)商機傳導(dǎo)等業(yè)務(wù)實踐,并進行了集團派系的構(gòu)建和劃分;
信用卡中心基于平臺的算法與業(yè)務(wù)模型,先后進行了互保企業(yè)違約傳導(dǎo)分析、授信資金異常形態(tài)識別、擔保(圈、鏈、網(wǎng)絡(luò))高風(fēng)險節(jié)點識別、擔保違約風(fēng)險預(yù)測等應(yīng)用。

3.1.3金融行業(yè)領(lǐng)域知識庫最佳實踐案例
金融機構(gòu)內(nèi)部在業(yè)務(wù)運行過程中累積了大量的知識與經(jīng)驗,這些知識與經(jīng)驗存在于領(lǐng)域?qū)<夷X中或技術(shù)文檔中,難以得到有效利用,很多金融機構(gòu)嘗試使用知識管理系統(tǒng),但知識管理系統(tǒng)中的知識與知識之間存在信息孤島,沒有建立知識之間的聯(lián)系,知識的管理維護、更新升級等也都存在問題。
在實際的業(yè)務(wù)場景中,將領(lǐng)域知識庫與實際業(yè)務(wù)相結(jié)合,可以有效的降低業(yè)務(wù)的上手難度,提高工作效率,同時將工作人員在重復(fù)的勞動中解放。知識圖譜技術(shù)目前已在金融領(lǐng)域知識庫的業(yè)務(wù)場景有成功應(yīng)用。在幫助銀行構(gòu)建知識圖譜的過程中,知識圖譜廠商應(yīng)具備以下能力:
搭建全公司級別的知識庫或知識中臺涉及到的數(shù)據(jù)量巨大,需要廠商具備大規(guī)模知識圖譜平臺搭建能力;
知識庫或知識中臺要支撐上層多業(yè)務(wù)部門的應(yīng)用,要求廠商搭建的知識圖譜平臺組件足夠靈活;
在項目實施過程中廠商需要配備經(jīng)驗豐富的業(yè)務(wù)專家、算法專家和數(shù)據(jù)專家;
兼容性強,既可以作為獨立的知識圖譜平臺,又可以與其他平臺相對接,對外輸出知識;
各個金融機構(gòu)對知識庫或知識中臺的需求存在差異,廠商需具備定制化改造的能力,同時具備良好的服務(wù)意識;
除了知識圖譜技術(shù)以外,廠商還需要具備自然語言處理、圖計算等技術(shù)能力。
一覽群智助力某國有銀行上線智能審單專家系統(tǒng)
某大型國有銀行是國內(nèi)領(lǐng)先的銀行業(yè)機構(gòu)。單證業(yè)務(wù)中心是銀行重要的業(yè)務(wù)部門。但實際銀行單證業(yè)務(wù)是一個對專業(yè)性要求較高的復(fù)雜繁瑣工作,由于日常工作量較大,導(dǎo)致單證業(yè)務(wù)中心工作人員壓力較大、單證業(yè)務(wù)中心運營成本較高等諸多問題。
傳統(tǒng)單證業(yè)務(wù)痛點可總結(jié)為以下四方面:
成本高:例如跟單信用證、托收等具體的業(yè)務(wù)都涉及到對客戶交單的處理。在信用證的業(yè)務(wù)流程中,單證審核員都要對單據(jù)進行人工審核。由于單證都為英文、且專業(yè)性很強,所以對單證審核員要求較高,導(dǎo)致單證中心運營成本較高;
經(jīng)驗要求高:業(yè)務(wù)方面的人才培養(yǎng)周期長,對于業(yè)務(wù)不熟練的新手不但審單效率更低,而且難免會出現(xiàn)各種錯誤,需要有經(jīng)驗的審單員協(xié)助與復(fù)查。
效率低:在單據(jù)方面由于種類較多,審核過程復(fù)雜,所以一個訓(xùn)練有素的單證審核人員一天也只能處理幾筆業(yè)務(wù),效率低下;
工作壓力大:單證業(yè)務(wù)中心作為單證的集中處理中心,日常工作量大,同時由于審核流程較復(fù)雜等諸多原因,導(dǎo)致工作人員日常工作壓力大。
面對業(yè)務(wù)中的痛點需求,某大型國有銀行選擇與一覽群智進行合作,基于知識圖譜等人工智能技術(shù),共同打造智能審單專家系統(tǒng)。

一覽群智以自然語言處理和知識圖譜等認知智能技術(shù)為基礎(chǔ),為客戶提供一站式AI產(chǎn)品和行業(yè)解決方案,滿足企業(yè)在超大規(guī)模多源異構(gòu)情況下的數(shù)據(jù)治理融合、不同場景下的AI建模和復(fù)雜決策分析需求。
一覽群智打造的智能審核專家系統(tǒng)通過ICR識別票據(jù)并結(jié)構(gòu)化業(yè)務(wù)信息;通過機器學(xué)習(xí)和自然語言處理進行業(yè)務(wù)分類并理解其含義;利用知識圖譜構(gòu)建自動審核引擎。系統(tǒng)具備完整的功能及流程。
在實際的業(yè)務(wù)場景中,將領(lǐng)域知識庫與實際業(yè)務(wù)相結(jié)合,可以有效的降低業(yè)務(wù)的上手難度,提高工作效率,同時將工作人員在重復(fù)的勞動中解放。
某大型國有銀行與一覽群智進行合作構(gòu)建的智能審單專家系統(tǒng)優(yōu)勢體現(xiàn)為:
業(yè)務(wù)系統(tǒng)信息自動填寫:系統(tǒng)將自動識別業(yè)務(wù)信息并在業(yè)務(wù)系統(tǒng)填寫,免除人工操作;
智能預(yù)審+多層級人機協(xié)同機制:機器自動給出單據(jù)及業(yè)務(wù)不符點和免查點,大幅提升人員效率,減輕審單壓力;
創(chuàng)新的審核知識圖譜構(gòu)架:發(fā)揚圖譜可視化、強關(guān)系表示的優(yōu)點,全面理解并監(jiān)控審核動作;
線下工作轉(zhuǎn)線上:將原本線下的審核工作轉(zhuǎn)移到系統(tǒng)中進行約束,統(tǒng)一審核標準,保證審核質(zhì)量,加強合規(guī)性管理;
數(shù)據(jù)資產(chǎn)增值:將原本無法存留的發(fā)票信息、合同信息等進行結(jié)構(gòu)化,通過挖掘數(shù)據(jù)價值,為營銷/運營/風(fēng)控等領(lǐng)域提供決策支撐。
3.2能源與工業(yè)行業(yè)最佳實踐案例
能源與工業(yè)行業(yè)領(lǐng)域知識庫最佳實踐案例
作為勞動密集型企業(yè),能源企業(yè)吸收大量勞動資源,但能源行業(yè)業(yè)務(wù)復(fù)雜,諸多環(huán)節(jié)積累大量知識,面臨知識難以積累、人員培訓(xùn)難度大等痛點。能源企業(yè)需要快速建立領(lǐng)域知識庫;同時,面對能源行業(yè)的業(yè)務(wù)挑戰(zhàn),企業(yè)需求將數(shù)據(jù)形成知識,創(chuàng)建支持上層業(yè)務(wù)應(yīng)用的領(lǐng)域知識庫,在輔助業(yè)務(wù)應(yīng)用的同時進行相應(yīng)的知識積累。員工可通過知識庫快速獲取知識,降低培訓(xùn)與研發(fā)成本;利用知識圖譜技術(shù),企業(yè)可打通底層數(shù)據(jù),將行業(yè)知識整合,建立領(lǐng)域知識庫,形成企業(yè)知識中臺,賦能上層業(yè)務(wù)應(yīng)用。
知識圖譜技術(shù)目前已在能源與工業(yè)行業(yè)領(lǐng)域知識庫的業(yè)務(wù)場景有成功應(yīng)用。在幫助能源與工業(yè)企業(yè)構(gòu)建知識圖譜的過程中,知識圖譜廠商應(yīng)具備以下能力:
能源與工業(yè)行業(yè)具有海量數(shù)據(jù),需要廠商具備大規(guī)模知識圖譜構(gòu)建能力;
能源與工業(yè)行業(yè)模型計算復(fù)雜度較高,需要廠商在行業(yè)內(nèi)有一定模型積累;
企業(yè)針對生產(chǎn)與加工流程等場景構(gòu)造與業(yè)務(wù)相關(guān)的復(fù)雜關(guān)系網(wǎng)絡(luò)時,需要知識圖譜廠商具備較強技術(shù)能力以及具有一定行業(yè)知識積累;
由于能源行業(yè)發(fā)展時間較早,系統(tǒng)部署情況復(fù)雜,要求廠商的知識圖譜平臺應(yīng)具備較好的兼容性,能夠快速完成平臺對接工作。
明略科技助力國內(nèi)某省電力數(shù)據(jù)中臺創(chuàng)新應(yīng)用
國網(wǎng)某省電力公司,是國家電網(wǎng)有限公司的全資子公司,擔負某省電力供應(yīng)的重大責(zé)任。公司積極開展智能電網(wǎng)建設(shè),將人工智能與大數(shù)據(jù)技術(shù)賦能實際業(yè)務(wù)場景。
智能電網(wǎng)建設(shè)是智慧城市建設(shè)的重要組成部分,但由于電力行業(yè)屬性較強,在數(shù)字化以及智能化轉(zhuǎn)型的過程中,在數(shù)據(jù)層面存在諸多問題:
各部門形成數(shù)據(jù)孤島,在應(yīng)用建設(shè)過程中難以進行有效的數(shù)據(jù)互聯(lián);
各部門數(shù)據(jù)無統(tǒng)一數(shù)據(jù)標準,包括用戶數(shù)據(jù)、營銷部門和設(shè)備部門數(shù)據(jù),存在數(shù)據(jù)收集困難和分類不統(tǒng)一等問題;
各部門數(shù)據(jù)對接存在不對應(yīng)問題:如用戶數(shù)據(jù)和設(shè)備需要對接,但會存在數(shù)據(jù)和設(shè)備不對應(yīng)問題;
電力行業(yè)作為技術(shù)密集型行業(yè),在各環(huán)節(jié)存在大量知識,需要有效途徑對各場景內(nèi)知識進行管理;
海量復(fù)雜數(shù)據(jù)情況下,數(shù)據(jù)實時性、數(shù)據(jù)打通以及更便捷地提取數(shù)據(jù)就會成為問題。
針對諸多的業(yè)務(wù)挑戰(zhàn),國網(wǎng)某省電力公司與明略科技合作建立統(tǒng)一的數(shù)據(jù)中臺,先做好數(shù)據(jù)治理與關(guān)聯(lián)工作,再將數(shù)據(jù)中臺的成果服務(wù)于業(yè)務(wù)應(yīng)用環(huán)節(jié)。
明略科技是中國領(lǐng)先的數(shù)據(jù)中臺和企業(yè)智能決策平臺提供商,致力于通過大數(shù)據(jù)分析挖掘和認知智能技術(shù),推動知識和管理復(fù)雜度高的大中型企業(yè)進行數(shù)字化轉(zhuǎn)型。
國網(wǎng)某省電力公司與明略科技對數(shù)據(jù)中臺項目進行有效的拆解,進行“三步走”戰(zhàn)略:
第一步,完成基于數(shù)倉的基本模型建立;
第二步,初步實現(xiàn)數(shù)據(jù)中臺與主要業(yè)務(wù)系統(tǒng)的系統(tǒng)對接、數(shù)據(jù)共享與數(shù)據(jù)服務(wù),同時探索在某些業(yè)務(wù)場景(設(shè)備故障知識圖譜、配網(wǎng)調(diào)度機器人)等領(lǐng)域進行業(yè)務(wù)應(yīng)用建設(shè);
第三步,完成數(shù)據(jù)中臺建設(shè),實現(xiàn)公司整體的數(shù)據(jù)管理、數(shù)據(jù)分析與數(shù)據(jù)分享。
國網(wǎng)某省電力公司數(shù)據(jù)中臺的建設(shè)核心主要體現(xiàn)在七大方面:數(shù)據(jù)匯聚、數(shù)據(jù)加工處理、數(shù)據(jù)治理管控、數(shù)據(jù)存儲、數(shù)據(jù)分析、數(shù)據(jù)共享與數(shù)據(jù)應(yīng)用。國網(wǎng)某省電力公司在構(gòu)建中臺的過程中,先實現(xiàn)數(shù)據(jù)中臺基礎(chǔ)能力,搭建整個企業(yè)的設(shè)備知識與業(yè)務(wù)模型中心。在搭建完中臺能力后,在此基礎(chǔ)上進行業(yè)務(wù)應(yīng)用開發(fā),循序漸進地推動項目向前。數(shù)據(jù)中臺架構(gòu)如下圖所示:

國網(wǎng)某省電力公司與明略科技合作搭建的數(shù)據(jù)中臺價值體現(xiàn)在四個方面:
數(shù)據(jù)匯聚層面:基于數(shù)據(jù)中臺的搭建,實現(xiàn)線上數(shù)據(jù)實時采集、線下數(shù)據(jù)上傳及導(dǎo)入,并監(jiān)控、優(yōu)化數(shù)據(jù)流轉(zhuǎn)與工作鏈路;其中,針對電網(wǎng)類數(shù)據(jù),完成生產(chǎn)管理、電力調(diào)度管理等15套業(yè)務(wù)系統(tǒng)數(shù)據(jù)采集;針對營銷類數(shù)據(jù),營銷業(yè)務(wù)應(yīng)用、用電信息采集等20套業(yè)務(wù)系統(tǒng)數(shù)據(jù)采集;針對經(jīng)營類數(shù)據(jù),完成財務(wù)管控、規(guī)劃計劃、電網(wǎng)建設(shè)、全員績效、員工報銷等118套業(yè)務(wù)系統(tǒng)數(shù)據(jù)采集;
核心資源標準庫層面:結(jié)合CIM模型與維度建模方法,基于9大數(shù)據(jù)域(人員域、財務(wù)域、物資域、客戶域、設(shè)備域、供應(yīng)商域、項目域、合同域、公共域)完成企業(yè)級數(shù)據(jù)倉庫建設(shè),建立數(shù)據(jù)資源目錄,形成數(shù)據(jù)共享能力;
數(shù)據(jù)共享層面:基于核心資源標準庫,向下屬地市公司和科研單位,高質(zhì)量共享數(shù)據(jù)資源,支撐各類業(yè)務(wù)快速構(gòu)建、敏捷創(chuàng)新;
數(shù)據(jù)應(yīng)用層面:基于數(shù)據(jù)中臺,完成設(shè)備故障知識圖譜、配網(wǎng)調(diào)度機器人等應(yīng)用建設(shè),并繼續(xù)探索在實際業(yè)務(wù)場景中的應(yīng)用。在基于故障知識圖譜的維修助手場景中,明略科 技幫助客戶將故障信息搜索匯總時間從10分鐘降低到1分鐘內(nèi),且能實現(xiàn)遠程技術(shù)支持。
同時,在項目的構(gòu)建過程中,國網(wǎng)某省電力公司與明略科技積極配合,總結(jié)兩點關(guān)鍵成功要素,對其他用戶有一定的參考價值:
由于電力行業(yè)的特殊性,其他行業(yè)知識圖譜廠商或者大數(shù)據(jù)廠商難以在電力行業(yè)有效地復(fù)制其他行業(yè)的成功案例。甲方用戶在考察廠商時,應(yīng)注重廠商在電力行業(yè)的案例背書和復(fù)雜電力數(shù)據(jù)場景下的治理、分析能力;
電力行業(yè)知識圖譜以及數(shù)據(jù)中臺的建設(shè)難以一蹴而就,需要較長期的投入,在項目進行之前,需對各階段項目目標進行合理預(yù)期。
3.3醫(yī)療與醫(yī)藥行業(yè)最佳實踐案例
醫(yī)院智能導(dǎo)診最佳實踐案例
患者去醫(yī)院就診時,經(jīng)常會遇到“知癥不知病”、“知病不知科”的問題,現(xiàn)有的導(dǎo)診方式一般為人工導(dǎo)診或基于關(guān)鍵詞的導(dǎo)診系統(tǒng),導(dǎo)診的效率和效果有待提升;智能導(dǎo)診雖然是診療過程中的一個輔助環(huán)節(jié),但對強化醫(yī)院內(nèi)部管理、協(xié)調(diào)醫(yī)療資源、提升患者就醫(yī)體驗、提高醫(yī)療質(zhì)量,具有明顯的優(yōu)化作用;為患者提供精準的智能導(dǎo)診服務(wù),不僅可以為患者快速找到合適的科室和合適的醫(yī)生,減少患者就診時間,同時可以緩解醫(yī)務(wù)人員工作壓力、促進醫(yī)療資源合理配置;
知識圖譜技術(shù)目前已在智能導(dǎo)診的業(yè)務(wù)場景有成功應(yīng)用。在幫助醫(yī)院構(gòu)建知識圖譜的過程中,知識圖譜廠商應(yīng)具備以下能力:
醫(yī)療是典型以多源異構(gòu)數(shù)據(jù)為主的行業(yè),數(shù)據(jù)融合在醫(yī)療應(yīng)用場景中更加復(fù)雜,需要廠商具備較強的數(shù)據(jù)治理能力;
醫(yī)院對智能導(dǎo)診系統(tǒng)的疾病判斷準確率、醫(yī)生推薦準確率和體驗度的要求較高,要求廠商不但技術(shù)實力強,在醫(yī)療領(lǐng)域know-how的積累更加重要;
各個醫(yī)院科室劃分、職能劃分和醫(yī)生資源分布情況不同,要求廠商的定制化能力較強,具備良好的服務(wù)意識。
基于知識圖譜,深睿醫(yī)療創(chuàng)新“肝膽胰睿助” 智能問診服務(wù)
中國人民解放軍總醫(yī)院是一家集醫(yī)療、保健、教學(xué)、科研為一體的大型三甲醫(yī)院,日接待患者量巨大,醫(yī)護人員工作繁忙。
中國人民解放軍總醫(yī)院肝膽胰腫瘤外科包括肝膽病區(qū)和胰腺病區(qū),是以肝膽胰腫瘤的診斷、手術(shù)治療和科研為主要方向的科室。肝膽胰腫瘤外科作為醫(yī)院重要的科室,具有日常問診量大、手術(shù)量大、復(fù)診量大,同時部分患者長期住院接受治療等特點,導(dǎo)致肝膽胰腫瘤外科醫(yī)護人員工作壓力較大。
深睿醫(yī)療聯(lián)合鵬城實驗室、解放軍總醫(yī)院劉榮主任、哈爾濱工業(yè)大學(xué)、北京大學(xué)、道子科技、云孚科技等機構(gòu)共同推出“肝膽胰睿助”(簡稱:小睿)產(chǎn)品?;诤A繑?shù)據(jù)、構(gòu)建醫(yī)療知識圖譜,為醫(yī)生和患者提供覆蓋診前、診中、診后的數(shù)字化、智能化服務(wù),旨在有效降低醫(yī)護人員工作壓力,提高診斷效率,同時為患者提供疾病知識,讓患者了解相關(guān)病情。
深睿醫(yī)療通過計算機視覺、知識圖譜等AI技術(shù)以及自主研發(fā)的核心算法,為國內(nèi)外醫(yī)療服務(wù)機構(gòu)提供基于人工智能和互聯(lián)網(wǎng)醫(yī)療的解決方案。

實際使用過程中,患者掃描報到機旁的二維碼,打開小程序“肝膽胰睿助”,通過一問一答的人機對話,完成自己病情的陳述,“肝膽胰睿助”則根據(jù)人機對話生成電子病歷,以便醫(yī)生查看?;颊唠x開診室后,還能向這位“肝膽胰睿助”咨詢疾病問題。
“肝膽胰睿助” 基于海量的數(shù)據(jù)、構(gòu)建醫(yī)療知識圖譜,結(jié)合人工智能技術(shù),建立虛擬醫(yī)生問診模型,根據(jù)患者癥狀進行鑒別問診追問,最終生成一份符合門診病歷要求的病情總結(jié),將醫(yī)生從撰寫病歷的時間解脫出來,從而與病患進行更為深入的病情溝通,整體提升問診效率及質(zhì)量。
“肝膽胰睿助”在研發(fā)階段收集互聯(lián)網(wǎng)肝膽胰腫瘤患者數(shù)十萬的提問,整理出患者最關(guān)心的問題,利用哈爾濱工業(yè)大學(xué)的語言技術(shù)平臺LTP和大詞林等技術(shù)將問題進行聚類,形成相關(guān)問題簇,最終交由中國人民解放軍總醫(yī)院肝膽胰腫瘤外科劉榮主任團隊進行編輯對應(yīng)回答,耗時2個月,從而達到95%問題覆蓋率,從而保證了患者能搜其想看,并且保證能回答的準確性。

中國人民解放軍總醫(yī)院肝膽胰腫瘤外科應(yīng)用“肝膽胰睿助”的價值主要體現(xiàn)在以下三大方面:
提高問診效率,在患者候診時進行鑒別問診,有效減少醫(yī)生撰寫病歷時間;
“肝膽胰睿助”支持患者答疑,解決患者問診后咨詢難的問題。同時,提供患者更多醫(yī)學(xué)知識,包括解答術(shù)前、術(shù)后、不良反應(yīng)等問題,加深患者病情了解,降低患者恐懼感,提高患者依從性;
支持隨訪功能,醫(yī)生了解患者健康情況,同時患者向醫(yī)生報告身體狀況的可疑變化,及時防范病癥復(fù)發(fā)。
3.4政府與公共服務(wù)行業(yè)最佳實踐案例
公安行業(yè)最佳實踐案例
目前公安行業(yè)的智能化應(yīng)用主要停留在感知智能,強調(diào)前端數(shù)據(jù)的采集以及后端視頻解析能力,認知智能的應(yīng)用推廣有限,導(dǎo)致公安數(shù)據(jù)信息規(guī)模龐大、數(shù)據(jù)復(fù)雜。辦案人員需要將海量數(shù)據(jù)快速抽取成知識,發(fā)現(xiàn)有用信息;違法犯罪活動本身具備隱蔽性、團伙性等特征,在技術(shù)高速發(fā)展的背景下,又呈現(xiàn)出網(wǎng)絡(luò)化、智能化、復(fù)雜化等新特征,增加了公安人員的辦案難度。面對當前的公安業(yè)務(wù)新挑戰(zhàn),公安部門推動公安系統(tǒng)智能化改造,打破系統(tǒng)原有信息孤島,挖掘潛在隱藏信息,分析關(guān)聯(lián)關(guān)系,形成知識網(wǎng)絡(luò),通過技術(shù)手段支撐“人、事、地、物、組織”等刑偵關(guān)鍵要素。
知識圖譜技術(shù)已應(yīng)用在公安領(lǐng)域,通過知識圖譜技術(shù)搭建公安領(lǐng)域知識圖譜,針對多業(yè)務(wù)場景,實現(xiàn)重點人員關(guān)聯(lián)分析、異常事件挖掘、重點場所關(guān)聯(lián)分析、物品關(guān)聯(lián)分析、團伙關(guān)系分析、相似案件推理等一系列智能輔助功能,提高公安機關(guān)辦案效率。在幫助公安行業(yè)構(gòu)建知識圖譜的過程中,知識圖譜廠商應(yīng)具備以下能力:
公安機關(guān)具有海量數(shù)據(jù),需要廠商具備大規(guī)模知識圖譜構(gòu)建能力;
各地公安機關(guān)具備自身特點,在構(gòu)建知識圖譜的過程中,需要較多定制化服務(wù),要求廠商定制化能力較強,具備較好的服務(wù)意識;
公安實戰(zhàn)經(jīng)驗需要轉(zhuǎn)換為公安知識圖譜中的應(yīng)用模型,需要廠商具備一定公安行業(yè)模型積累;
公安領(lǐng)域內(nèi)對于知識檢索有一定需求,要求廠商具備一定自然語言處理能力;
公安領(lǐng)域存在大量的非結(jié)構(gòu)化、半結(jié)構(gòu)化信息,廠商在構(gòu)建知識圖譜的過程中需要較強的數(shù)據(jù)治理能力。
百分點助力某市政府構(gòu)建治安防控大數(shù)據(jù)分析研判平臺
某市地理位置特殊,多山且與港口城市接壤,是電信詐騙、跨境網(wǎng)絡(luò)賭博等案件高發(fā)的城市。該市公安局下轄200多個派出所,希望能在網(wǎng)絡(luò)詐騙專項治理行動中,使用新技術(shù)、新思路,解決當?shù)鼐W(wǎng)絡(luò)詐騙、網(wǎng)絡(luò)賭博等案件的發(fā)現(xiàn)難、取證難、抓補難等問題。
隨著信息技術(shù)的快速發(fā)展,社會信息化程度的不斷加深,犯罪活動呈現(xiàn)出復(fù)雜化、動態(tài)化、智能化的特征。如何利用大數(shù)據(jù)、人工智能等先進技術(shù),分析數(shù)字世界并發(fā)現(xiàn)犯罪線索,實現(xiàn)對犯罪行為的早發(fā)現(xiàn)、早識別、早打擊,已成為公安業(yè)務(wù)系統(tǒng)構(gòu)建中最為核心的挑戰(zhàn)。
尤其在疫情后,該市電信網(wǎng)絡(luò)詐騙案頻發(fā),想通過貸款、兼職來獲取資金的群眾增多,犯罪分子利用這一點瘋狂作案。該市公安機關(guān)迫切需要利用大數(shù)據(jù)與人工智能等新一代信息技術(shù),對海量的多源異構(gòu)數(shù)據(jù)進行整合治理,并深度結(jié)合當?shù)貥I(yè)務(wù)場景和歷史辦案經(jīng)驗構(gòu)建數(shù)據(jù)模型,有效提升該市的案件處置能力與公安綜合防控水平。
百分點是中國領(lǐng)先的數(shù)據(jù)智能技術(shù)企業(yè),在數(shù)字政府領(lǐng)域構(gòu)建了完善的技術(shù)產(chǎn)品和解決方案體系,擁有豐富的海外國家級和國內(nèi)省市級數(shù)字政府建設(shè)經(jīng)驗。
針對該市業(yè)務(wù)特點,該市政府與百分點構(gòu)建了一體化的大數(shù)據(jù)綜合分析平臺,利用動態(tài)知識圖譜等技術(shù),將公安的人、地、事、物、組織、虛擬標識等要素按照實體、事件及其之間的關(guān)系進行數(shù)據(jù)融合匯聚治理,打破原有治安業(yè)務(wù)系統(tǒng)數(shù)據(jù)壁壘,提升治安數(shù)據(jù)融合治理、分析研判、智能應(yīng)用和風(fēng)險防控能力。
同時,該市政府與百分點構(gòu)建了分析研判平臺、戰(zhàn)法模型平臺、融合動態(tài)管控三個數(shù)據(jù)分析應(yīng)用體系,實現(xiàn)社會治安風(fēng)險的提前防范、精準打擊和動態(tài)管控。治安防控大數(shù)據(jù)分析研判平臺將知識圖譜、NLP、戰(zhàn)法模型等技術(shù)融入到治安綜合平臺建設(shè)中?;跀?shù)據(jù)資源統(tǒng)一服務(wù)平臺,對治安信息進行全面整合、深度挖掘和研判分析,建立多種服務(wù)為上層各類治安業(yè)務(wù)應(yīng)用提供支撐。

治安防控大數(shù)據(jù)分析研判平臺解決方案的核心要素主要體現(xiàn)在以下四個方面:
公安大數(shù)據(jù)融合治理:利用百分點公安大數(shù)據(jù)治理平臺,高效整合集成了當?shù)亟兕悢?shù)據(jù)資源、幾十億條數(shù)據(jù),并依托“動態(tài)知識圖譜”技術(shù),對每天新增千萬條數(shù)據(jù)進行動態(tài)融合,實現(xiàn)對當?shù)毓踩財?shù)據(jù)的高效整合治理;
多維度綜合分析研判電信詐騙事件:針對電信網(wǎng)絡(luò)詐騙已有線索,通過聯(lián)合搜素、事件查詢、全息檔案、關(guān)聯(lián)分析、軌跡分析等多維分析功能,對文本、圖片的檢索分析,以及信息搜索,快速實現(xiàn)對線索的分析研判,展示線索的全貌;
結(jié)合實際業(yè)務(wù)構(gòu)建預(yù)警戰(zhàn)法模型:圍繞“掃黃打非”專項業(yè)務(wù)流程,通過平臺自定義算法,進行模型開發(fā)、模型分析,為用戶提供低門檻、靈活易用的模型應(yīng)用體驗,深度挖掘潛在關(guān)聯(lián)關(guān)系,快速發(fā)現(xiàn)高價值線索;
融合動態(tài)管控:境外賭場在國內(nèi)發(fā)展大力代理機構(gòu),以“免費旅游、無息貸款“的幌子拉攏國內(nèi)人員到東南亞國家或澳門賭場賭博。針對當?shù)刂伟簿S穩(wěn)、風(fēng)險防控、偵查破案等實戰(zhàn)需求,基于動態(tài)知識圖譜,對各類軌跡信息進行實時接入和融合拉通,實現(xiàn)對人、車、物等重點目標的多維分析和智能管控。
該市政府與百分點構(gòu)建的治安防控大數(shù)據(jù)分析研判平臺的價值主要體現(xiàn)在以下三個方面:
覆蓋全市200余個派出所,通過對潛在風(fēng)險的主動感知預(yù)警,減輕了民警工作量,主動化解社會風(fēng)險。打造了從案件線索發(fā)現(xiàn)、分析研判、偵查打擊到風(fēng)險預(yù)警的數(shù)字化偵查模式,對多起網(wǎng)絡(luò)詐騙違法犯罪活動及可疑團伙準確識別和打擊;
充分利用大數(shù)據(jù)、人工智能等信息技術(shù)將海量公安數(shù)據(jù)做融合治理,并結(jié)合資深干警的破案經(jīng)驗并沉淀為數(shù)據(jù)模型,打造了研判分析智慧大腦,使新任警員也能夠快速獲取經(jīng)驗知識,高效提升了辦案業(yè)務(wù)能力和處置效率;
通過多維數(shù)據(jù)融合優(yōu)化分析、碰撞關(guān)聯(lián),實現(xiàn)了一個窗口查詢、各警種綜合應(yīng)用、多維度分級管控、預(yù)警信息主動推送和扁平化指揮調(diào)度,成功破獲危害國家及群眾財產(chǎn)安全的跨境網(wǎng)絡(luò)賭博案件。

4.知識圖譜未來展望
4.1 新機會:感知智能向認知智能時代跨進,知識圖譜將駛向快車道
4.1.1感知智能定義
感知智能是指將物理世界的數(shù)據(jù)通過攝像頭、麥克風(fēng)或者其他傳感器等方式進行采集,借助語音識別、圖像識別等技術(shù),映射到數(shù)字世界,并做標準化、結(jié)構(gòu)化處理,一方面實現(xiàn)在特定場景的應(yīng)用落地;另一方面可將數(shù)據(jù)提升至可認知的層次,即將信息翻譯成及人類可理解、并用于分析和決策的數(shù)據(jù),為認知智能提供數(shù)據(jù)基礎(chǔ)。

4.1.2知識圖譜是認知智能關(guān)鍵技術(shù)
人工智能分為感知智能、認知智能和行動智能三個階段。當前正處于認知智能的起步階段。
從感知智能到認知智能,知識圖譜是關(guān)鍵一步。
認知智能是感知智能的進階,需要在感知智能的基礎(chǔ)上,結(jié)合行業(yè)知識,理解數(shù)據(jù)之間的邏輯關(guān)系以及代表的業(yè)務(wù)意義,并在此基礎(chǔ)上進行分析決策。
感知智能階段,更強調(diào)人工智能在信息獲取上的應(yīng)用創(chuàng)新,如計算機視覺領(lǐng)域的人臉識別算法應(yīng)用。但隨著人工智能與大數(shù)據(jù)技術(shù)的不斷深化演進,業(yè)務(wù)場景數(shù)字化需求不斷深化,同時大量無關(guān)聯(lián)的數(shù)據(jù)使得管理變復(fù)雜,不利于用戶數(shù)據(jù)管控,“數(shù)據(jù)孤島”問題凸顯。
核心問題在于,感知智能如同四肢,而認知智能如同大腦,忽略后端平臺即“大腦”對于信息的知識抽取和與業(yè)務(wù)場景的關(guān)聯(lián)分析,導(dǎo)致人工智能技術(shù)在推進過程中出現(xiàn)“四肢發(fā)達、頭腦簡單”的現(xiàn)象。
認知智能時代的到來,是在感知智能之上,提高了AI的理解分析能力。知識圖譜技術(shù)將起到重要的支撐作用。在認知智能階段,機器能夠通過知識圖譜挖掘隱性關(guān)系,洞察“肉眼”無法發(fā)現(xiàn)的關(guān)系和邏輯,用于最終的業(yè)務(wù)決策,注重行業(yè)知識圖譜和關(guān)系挖掘,是人工智能在行業(yè)中更深層的落地應(yīng)用。
認知智能時代剛剛起步,只有部分數(shù)字化水平較高的行業(yè),如金融、政務(wù)、公安等行業(yè)開始逐步落地知識圖譜應(yīng)用場景,更多的行業(yè)還在探索階段。
4.1.3認知智能時代,知識圖譜將高速發(fā)展
認知智能時代的到來將推動知識圖譜技術(shù)高速發(fā)展。
人工智能各時代之間是包含關(guān)系,而非取代關(guān)系,隨著感知智能技術(shù)的發(fā)展,認知智能技術(shù)也會不斷發(fā)展,海量數(shù)據(jù)的有效管理的問題會一直存在,知識圖譜是目前平衡數(shù)據(jù)與管控最有效的解決方案,不斷發(fā)展的知識圖譜技術(shù)將為數(shù)據(jù)提供更加有效的分析管理應(yīng)用;
目前,認知智能發(fā)展至今,在落地應(yīng)用過程中存在兩大核心難點,即海量數(shù)據(jù)治理與關(guān)聯(lián)關(guān)系挖掘。其中海量數(shù)據(jù)的治理工作將主要由數(shù)據(jù)中臺完成。關(guān)聯(lián)關(guān)系挖掘目前將主要依靠知識圖譜技術(shù)進行。由于知識圖譜技術(shù)本身的優(yōu)勢,可以實現(xiàn)數(shù)據(jù)間隱性關(guān)系識別,同時目前學(xué)界正在攻關(guān)的跨知識庫關(guān)聯(lián)關(guān)系分析,也將有利于未來認知智能時代,具有復(fù)合知識能力的人工智能技術(shù)的研發(fā)。認知智能時代將更加依賴知識圖譜。
認知智能相較于感知智能時代的一大特點為計算機的推理判斷能力,將有效數(shù)據(jù)與相關(guān)結(jié)論關(guān)聯(lián),形成有效判斷。輔助操作者決策類的應(yīng)用將在未來的認知智能時代有廣泛應(yīng)用,而作為構(gòu)建此類應(yīng)用的底層技術(shù),知識圖譜也將高速發(fā)展。
4.2 新場景:知識圖譜將在垂直領(lǐng)域誕生更多應(yīng)用場景
知識圖譜技術(shù)未來在垂直領(lǐng)域應(yīng)用主要有兩個方向:1)目前已有應(yīng)用的行業(yè)將拓展應(yīng)用場景與應(yīng)用領(lǐng)域;2)未有知識圖譜應(yīng)用的行業(yè)將學(xué)習(xí)相似行業(yè)的成功經(jīng)驗復(fù)制應(yīng)用。
針對目前已有應(yīng)用的行業(yè),知識圖譜技術(shù)將通過關(guān)聯(lián)分析、語義識別、智能搜索、推理決策、知識庫管理等諸多應(yīng)用功能與用戶需求發(fā)生 “碰撞”,產(chǎn)生新的應(yīng)用場景。同時,行業(yè)內(nèi)知識圖譜的整體搭建速度也會更快,成熟度更高,搭建成本降低,在此行業(yè)知識圖譜技術(shù)已廣泛應(yīng)用時,將會出現(xiàn)功能完整的通用性知識圖譜產(chǎn)品,知識圖譜產(chǎn)品將向普惠方向發(fā)展,賦能行業(yè)內(nèi)中小用戶;
針對目前未有知識圖譜應(yīng)用的行業(yè),主要原因有三點:1)行業(yè)內(nèi)數(shù)據(jù)整體水平參差不齊,行業(yè)數(shù)字化進程較慢;2)勞動密集型產(chǎn)業(yè),行業(yè)知識積累與管理對于行業(yè)整體影響較小;3)整體行業(yè)經(jīng)濟不景氣,對于數(shù)字化投資有限,無專項資金支撐知識圖譜構(gòu)建;
針對此類行業(yè),隨著行業(yè)數(shù)字化轉(zhuǎn)型的加快,未有知識圖譜應(yīng)用的行業(yè)將學(xué)習(xí)相似行業(yè)知識圖譜產(chǎn)品的成功案例,復(fù)制到本行業(yè)中。但應(yīng)注意,知識圖譜技術(shù)有較強的領(lǐng)域性,在項目實施過程中需要行業(yè)用戶與廠商共同探索在新行業(yè)內(nèi)的知識圖譜技術(shù)應(yīng)用。
4.3 新融合:多技術(shù)融合將成為未來主流趨勢
知識圖譜本身是一種語義網(wǎng)絡(luò),屬于泛自然語言處理技術(shù),發(fā)展至今,知識圖譜與NLP技術(shù)有千絲萬縷的聯(lián)系。同時,在未來認知智能,乃至行動智能的時代,人工智能技術(shù)的協(xié)同融合趨勢將更加明顯。
由于知識圖譜的結(jié)構(gòu)特殊性,隨著數(shù)據(jù)量的增大,目前知識圖譜的跨庫應(yīng)用能力較弱,對知識圖譜進行分布式存儲將成為重要研究方向。未來分布式的知識圖譜存儲結(jié)構(gòu)將有效地解決知識圖譜負載與存儲模型的問題,更好地應(yīng)對未來更大數(shù)據(jù)量的知識圖譜構(gòu)建。
機器學(xué)習(xí)等人工智能技術(shù)與知識圖譜技術(shù)也會在知識構(gòu)建、知識推理、知識存儲以及知識應(yīng)用等多方面有更加深入的結(jié)合。算法模型將更好地支持全流程的知識圖譜構(gòu)建。
結(jié)語
各行業(yè)領(lǐng)域用戶都摩拳擦掌,準備利用知識圖譜技術(shù)“武裝”自身業(yè)務(wù)。但知識圖譜技術(shù)在垂直領(lǐng)域的未來之路還有很長,每一項技術(shù)的發(fā)展都是螺旋遞進。目前知識圖譜只是在部分信息化較好的行業(yè)有良好應(yīng)用,更多的應(yīng)用場景需要廠商與用戶共同探索。
知識圖譜是感知智能向認知智能飛躍的關(guān)鍵技術(shù)。沒有一項技術(shù)是完美的,所以,技術(shù)融合的趨勢會讓各項技術(shù)取長補短,更好服務(wù)于知識圖譜的應(yīng)用。技術(shù)融合也將是未來趨勢。
目前國內(nèi)已經(jīng)涌現(xiàn)出一批知識圖譜的優(yōu)秀廠商,克服萬難,在各擅長的領(lǐng)域內(nèi)完成知識圖譜的落地應(yīng)用。“寶劍鋒從磨礪出,梅花香自苦寒來”,知識圖譜就是一個在應(yīng)用中不斷打磨進化的技術(shù),各家廠商也應(yīng)做好深耕行業(yè),沉淀積累的準備。
知識圖譜更像是一個工程而非單一的技術(shù)。知識圖譜要做到的是落地應(yīng)用而非紙上談兵。在未來,相信知識圖譜會賦能更多的應(yīng)用場景。
特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關(guān)內(nèi)容。本站不承擔此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。