日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
AI中臺——智能聊天機(jī)器人平臺的架構(gòu)與應(yīng)用

主講人介紹:

通道ssl適用于網(wǎng)站、小程序/APP、API接口等需要進(jìn)行數(shù)據(jù)傳輸應(yīng)用場景,ssl證書未來市場廣闊!成為創(chuàng)新互聯(lián)公司的ssl證書銷售渠道,可以享受市場價格4-6折優(yōu)惠!如果有意向歡迎電話聯(lián)系或者加微信:18980820575(備注:SSL證書合作)期待與您的合作!

王東:北大研究生 宜信科技中心AI中臺團(tuán)隊(duì)負(fù)責(zé)人

導(dǎo)讀:隨著“中臺”戰(zhàn)略的提出,目前宜信中臺建設(shè)在思想理念及架構(gòu)設(shè)計(jì)上都已經(jīng)取得了很多成果。宜信是如何借助中臺化的思想打造“AI中臺”及相關(guān)的智能產(chǎn)品呢?本次直播,宜信科技中心AI中臺團(tuán)隊(duì)負(fù)責(zé)人王東老師分享了宜信AI中臺的具體實(shí)施路徑,并重點(diǎn)介紹了AI中臺的智能產(chǎn)品——智能聊天機(jī)器人平臺,包括智能聊天機(jī)器人平臺的背景理念、設(shè)計(jì)思想、技術(shù)架構(gòu)和應(yīng)用場景,該平臺能提供什么樣的能力,以及它如何快速地支持業(yè)務(wù)方,提供一種以中臺化的思想來建設(shè)智能產(chǎn)品的實(shí)踐思路。

分享大綱:

一、AI中臺總體設(shè)計(jì)和實(shí)施步驟

二、機(jī)器人平臺的背景、設(shè)計(jì)理念和技術(shù)架構(gòu)

三、機(jī)器人平臺的核心原理和主要功能點(diǎn)

四、智能聊天機(jī)器人平臺的應(yīng)用場景

五、總結(jié)

前兩期技術(shù)沙龍分別分享了宜信AI中臺和數(shù)據(jù)中臺的建設(shè)實(shí)踐,本次分享將先回顧AI中臺的總體設(shè)計(jì)和實(shí)施路徑,以及AI中臺與數(shù)據(jù)中臺的關(guān)系,再詳細(xì)介紹基于中臺思想建設(shè)的智能聊天機(jī)器人平臺,包括其技術(shù)架構(gòu)、技術(shù)原理、核心功能點(diǎn)、應(yīng)用場景以及應(yīng)用效果。

一、AI中臺總體設(shè)計(jì)和實(shí)施步驟

1.1 業(yè)務(wù)演進(jìn)與廣泛的智能化需求

隨著業(yè)務(wù)的不斷發(fā)展,業(yè)務(wù)處于不同的發(fā)展階段,對數(shù)據(jù)的需求也從剛開始的可用-滿足BI分析,到后來的易用-敏捷化分析,到現(xiàn)在的好用-數(shù)據(jù)智能化。例如前臺系統(tǒng)提出客戶細(xì)分、個性化推薦、智能問答、模型預(yù)測等需求,后臺數(shù)據(jù)探索需要進(jìn)行關(guān)聯(lián)分析、聚類分析、持續(xù)分析等,這些都向我們提出了數(shù)據(jù)智能化的需求。

  • 數(shù)據(jù)平臺化能夠解決數(shù)據(jù)可用性的問題,提供數(shù)據(jù)的平臺化管理、數(shù)據(jù)存儲、數(shù)據(jù)計(jì)算、管理、運(yùn)維等功能;
  • 數(shù)據(jù)中臺化可以解決易用的問題,提供自助化、敏捷化的支持,并為數(shù)據(jù)的資產(chǎn)化、融合化、運(yùn)營化提供支持。
  • 數(shù)據(jù)智能化解決了好用的問題:從數(shù)據(jù)洞察到學(xué)習(xí)預(yù)測,數(shù)據(jù)驅(qū)動創(chuàng)新。

1.2 從數(shù)據(jù)中臺到AI中臺

數(shù)據(jù)中臺除了提供平臺能力以外,還提供了一些更高級的能力,比如把數(shù)據(jù)變成一種基礎(chǔ)服務(wù)提供給業(yè)務(wù)方,業(yè)務(wù)方可以以自助的方式在數(shù)據(jù)中臺上獲取數(shù)據(jù)、進(jìn)行數(shù)據(jù)處理、數(shù)據(jù)探索、數(shù)據(jù)挖掘、分析鉆取、多維分析、自助化報(bào)表、數(shù)據(jù)共享等,以快速實(shí)現(xiàn)自己的商業(yè)價值。

隨著業(yè)務(wù)的發(fā)展,越來越多智能化的數(shù)據(jù)需求被提出,這些智能化需求涉及到模型訓(xùn)練、數(shù)據(jù)標(biāo)注、特征工程、模型部署、性能監(jiān)控等,需要使用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等算法支持。數(shù)據(jù)中臺的主要目標(biāo)還是服務(wù)數(shù)據(jù),對于智能化和模型并不能很好地支持,因此AI中臺應(yīng)運(yùn)而生。

我們把智能服務(wù)的需求抽象出來,形成一個獨(dú)立的AI中臺層。AI中臺是一個用來構(gòu)建智能服務(wù)的基礎(chǔ)設(shè)施平臺,對公司所需的模型提供分布分層的構(gòu)建能力和全生命周期管理的服務(wù),鼓勵各個業(yè)務(wù)領(lǐng)域?qū)⒒A(chǔ)性、場景性、通用性的AI能力沉淀到平臺中,加強(qiáng)模型復(fù)用、組合創(chuàng)新、規(guī)?;罱K實(shí)現(xiàn)降本增效和快速響應(yīng)業(yè)務(wù)方的目的。

1.3 數(shù)據(jù)中臺和AI中臺的關(guān)系

既然提到了數(shù)據(jù)中臺和AI中臺,很多人會問:數(shù)據(jù)中臺和AI中臺是什么關(guān)系呢?

數(shù)據(jù)中臺和AI中臺兩者是相互依存、承前啟后的關(guān)系。

首先,數(shù)據(jù)中臺和AI中臺都對外提供服務(wù),只是側(cè)重點(diǎn)不同。

  • 數(shù)據(jù)中臺提供各種數(shù)據(jù)服務(wù)和數(shù)據(jù)產(chǎn)品,例如:BI報(bào)表應(yīng)用、數(shù)據(jù)探索等。
  • AI中臺提供各種智能服務(wù)和智能產(chǎn)品,并承擔(dān)復(fù)雜的學(xué)習(xí)預(yù)測類智能需求研發(fā)、模型訓(xùn)練、特征工程、數(shù)據(jù)標(biāo)注等能力。例如:模型預(yù)測、智能推薦等。

其次,數(shù)據(jù)中臺和AI中臺是相互依存,相互支持的。

  • AI中臺依托數(shù)據(jù)中臺提供的數(shù)據(jù)能力和工具集,加速AI相關(guān)服務(wù)的開發(fā)和復(fù)用,來應(yīng)對前臺智能化的業(yè)務(wù)需求。有了數(shù)據(jù)中臺清洗好的數(shù)據(jù),搭建智能項(xiàng)目能夠事半功倍。
  • 數(shù)據(jù)中臺也需要使用AI中臺的智能化能力,使得數(shù)據(jù)使用更加平民化和智能化。例如增強(qiáng)型BI分析:通用自然語言交互方式,降低BI使用門檻;通過AI分析給出參與建議,幫助普通用戶在沒有數(shù)據(jù)專家的情況下有效訪問數(shù)據(jù);增強(qiáng)型數(shù)據(jù)管理:利用機(jī)器學(xué)習(xí)來管理數(shù)據(jù),包括數(shù)據(jù)質(zhì)量、元數(shù)據(jù)管理、主數(shù)據(jù)管理等。

1.4 AI中臺需要解決的痛點(diǎn)

在過去,很多算法團(tuán)隊(duì)更像是算法外包團(tuán)隊(duì),根據(jù)不同業(yè)務(wù)線的需求,各自構(gòu)建陣地,逐個攻克目標(biāo)。這樣的形式雖然也取得了很多成績,但存在重復(fù)建設(shè)、效率有限的問題。

我們將這些問題總結(jié)如下:

  • “煙囪式”開發(fā),項(xiàng)目成本高、不易集成,過程重復(fù),缺乏能力沉淀。
  • 模型訪問方式各異,調(diào)用關(guān)系錯綜復(fù)雜,缺乏編排優(yōu)化、協(xié)同。
  • 手工進(jìn)行數(shù)據(jù)操作,缺少統(tǒng)一數(shù)據(jù)訪問渠道,數(shù)據(jù)獲取難、標(biāo)準(zhǔn)不統(tǒng)一。
  • 模型研發(fā)缺乏標(biāo)準(zhǔn)指導(dǎo)、參與角色眾多,缺少協(xié)同、自動化輔助,難以有效管理溝通協(xié)作。
  • 模型交付難,缺少統(tǒng)一的模型運(yùn)行、監(jiān)控平臺、服務(wù)管理接口及更新、維護(hù)機(jī)制。
  • 基礎(chǔ)資源分散隔離,無法動態(tài)進(jìn)行資源的分配和管理,造成浪費(fèi)。

這些都是AI中臺需要解決的痛點(diǎn),針對以上痛點(diǎn),我們希望:

  • 對于算法、模型的標(biāo)準(zhǔn)化平臺化,對研發(fā)過程標(biāo)準(zhǔn)化指導(dǎo),以提高可復(fù)用性。
  • 統(tǒng)一的服務(wù)接口規(guī)范,支持服務(wù)的動態(tài)編排組合。
  • 與數(shù)據(jù)中臺對接,利用數(shù)據(jù)中臺的能力對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理和預(yù)處理。
  • 流程優(yōu)化,清晰角色定義,構(gòu)建AI產(chǎn)品流水線,具備環(huán)節(jié)內(nèi)部、環(huán)節(jié)之間的自動迭代、流轉(zhuǎn)功能。
  • 提供統(tǒng)一的模型交付部署、運(yùn)行環(huán)境和監(jiān)控能力,以及模型更新機(jī)制。
  • 統(tǒng)一資源管理,包括計(jì)算資源、存儲資源等,支持資源彈性調(diào)度。

總結(jié)起來就是:可復(fù)用化、服務(wù)統(tǒng)一化、對接數(shù)據(jù)中臺、流程角色優(yōu)化、運(yùn)行監(jiān)控化和資源管控化,最終讓AI中臺成為一個強(qiáng)大的AI能力支持中心,根據(jù)業(yè)務(wù)需求快速提供火力支援,迅速完成商業(yè)價值。

1.5 AI中臺平臺架構(gòu)

下面介紹AI中臺的平臺架構(gòu)。

最下面是數(shù)據(jù)中臺,提供數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)管理、數(shù)據(jù)安全、數(shù)據(jù)服務(wù)等能力。最上面是業(yè)務(wù)前臺,包括各條業(yè)務(wù)線。AI中臺處于數(shù)據(jù)中臺和業(yè)務(wù)前臺的中間位置。

如圖所示,整個AI中臺由幾個模塊組成:

  • AIHub智能服務(wù):以服務(wù)的方式將模型封裝起來,提供模型服務(wù)運(yùn)行平臺能力。包括模型發(fā)布測試、自動部署、模型更新、模型交付、產(chǎn)品封裝等。
  • AIMon平臺監(jiān)控:對運(yùn)行的模型進(jìn)行監(jiān)控和預(yù)警,提供平臺的監(jiān)控服務(wù)。包括性能測試、狀態(tài)反饋、預(yù)警通知等。
  • AIKit智能工具箱:提供輕量級、低侵入的AI工具服務(wù),AI應(yīng)用團(tuán)隊(duì)可以自由選用。例如:通過無縫嵌入python語言開發(fā)環(huán)境,Moonbox可以提供虛擬查詢數(shù)據(jù)、混算數(shù)據(jù)等能力。也提供數(shù)據(jù)標(biāo)注能力,包括結(jié)構(gòu)化數(shù)據(jù),以及文字、圖像等非結(jié)構(gòu)化數(shù)據(jù)的在線標(biāo)注。
  • AIMgt中臺管理:AI中臺的一些通用管理能力。包括:角色權(quán)限、租戶管理、流程控制、資源管理等。
  • AILab智能試驗(yàn)室:提供標(biāo)準(zhǔn)的模型訓(xùn)練與優(yōu)化過程支持。包括模型設(shè)計(jì)、模型訓(xùn)練、特征工程、特征處理、模型追蹤、模型評估、算法庫、模型庫等。
  • AIAsset智能資產(chǎn):用于模型資產(chǎn)管理,實(shí)現(xiàn)AI能力沉淀、復(fù)用、盤點(diǎn)。
  • CUI會話式UI:這是我們AI中臺的一個產(chǎn)品,就是接下來我們要介紹的可用于問答、閑聊、任務(wù)、推薦等場景的聊天機(jī)器人平臺,從機(jī)器人平臺的角度也包含語音外呼機(jī)器人。

1.6 AI中臺的能力架構(gòu)

上圖展示AI中臺的能力架構(gòu)。我們以能力的角度來描述AI中臺對外輸出。除了前文介紹的服務(wù)運(yùn)行能力、監(jiān)控預(yù)警能力、資源管理能力(就是圖中左邊的幾個模塊)以外,我們把AI中臺的能力分為4層:

1)平臺層

比如數(shù)據(jù)獲取能力、在線訓(xùn)練能力、在線標(biāo)注能力、特征工程能力、自助訓(xùn)練能力等。這些能力是通過AI工具集和AIlab來實(shí)現(xiàn)的。

這層的用戶主要包括:

  • 算法工程師(AI中臺、AI團(tuán)隊(duì)),他們可以使用AI中臺提供的平臺層能力來進(jìn)行在線訓(xùn)練、復(fù)用算法庫、復(fù)用平臺計(jì)算資源、進(jìn)行各種實(shí)驗(yàn)等。
  • 高級研發(fā)人員、數(shù)據(jù)分析人員,他們可以使用AI中臺的自助訓(xùn)練能力,進(jìn)行自助訓(xùn)練,例如:根據(jù)自己已經(jīng)標(biāo)注好的數(shù)據(jù),自助訓(xùn)練分類模型。

2)AI技術(shù)層

AI技術(shù)層主要提供:AI基礎(chǔ)能力,包括詞法分析、語音合成、文章分類、圖像識別等,這些本質(zhì)上是AI技術(shù)NLP、語音、圖像、視頻等大分類里的能力。

3)AI業(yè)務(wù)層

AI業(yè)務(wù)層主要提供AI技術(shù)與業(yè)務(wù)相結(jié)合后能提供的能力,比如:評論觀點(diǎn)提取、文章標(biāo)簽、卡證類識別、人臉識別、視頻審查等。

AI技術(shù)層和業(yè)務(wù)層的區(qū)別在于:AI技術(shù)層主要提供AI基礎(chǔ)能力,比如NLP、CV、語音、視頻等。而AI業(yè)務(wù)層主要是將AI技術(shù)與具體的業(yè)務(wù)場景結(jié)合起來,例如身份證識別、學(xué)歷識別、驗(yàn)證碼識別等。

這兩層的用戶是:業(yè)務(wù)團(tuán)隊(duì)的應(yīng)用開發(fā)人員,可以直接調(diào)用智能服務(wù),從而實(shí)現(xiàn)業(yè)務(wù)場景智能化,例如:短文本相似度、語言合成、票據(jù)識別等。

4)產(chǎn)品層

這一層以產(chǎn)品的形式對外提供服務(wù),例如:智能機(jī)器人產(chǎn)品、知識圖譜產(chǎn)品等。

這層的用戶是:公司的業(yè)務(wù)人員或公司的直接客戶,他們通過直接使用產(chǎn)品就可以獲得結(jié)果, 例如:機(jī)器人。

上面3層都屬于AI資產(chǎn)。從影響力角度來看,產(chǎn)品層的影響力最大,依次下來是業(yè)務(wù)層、技術(shù)層,最后是平臺層。我們在AI中臺的實(shí)施路徑上,也會按照這個優(yōu)先級去構(gòu)建和實(shí)施。

1.7 AI中臺的建設(shè)思路-開放性

數(shù)據(jù)中臺的口號是平民化和敏捷化。AI中臺的口號是開放化。

AI中臺的建設(shè)思路是希望多方聯(lián)合,公開透明,廣泛參與,協(xié)商一致促進(jìn)AI能力沉淀,加強(qiáng)AI服務(wù)復(fù)用,降本增效。

我們更加關(guān)注于通用性的AI需求,為各個領(lǐng)域的AI應(yīng)用團(tuán)隊(duì)提供通用化智能服務(wù)。強(qiáng)調(diào)平臺性和可復(fù)用性,鼓勵基礎(chǔ)類、場景類AI服務(wù)的通用化、平臺化。

廣泛支持大中小業(yè)務(wù)領(lǐng)域AI應(yīng)用團(tuán)隊(duì)面臨的大量智能業(yè)務(wù)需求,提供模型學(xué)習(xí)平臺與模型運(yùn)行監(jiān)控托管服務(wù)以及通用的AI工具,方便前臺業(yè)務(wù)快速上線智能應(yīng)用。在實(shí)施過程中也會充分利用包括數(shù)據(jù)中臺在內(nèi)的現(xiàn)有技術(shù)資源,并根據(jù)業(yè)務(wù)需求強(qiáng)弱和重要性來確定實(shí)施路線。

我們希望AI不再是錦上添花,而是必備的能力,讓開發(fā)者重新回歸到業(yè)務(wù)的理解和創(chuàng)意的賽道上來,關(guān)注自己的業(yè)務(wù)邏輯。AI能力將會全部開放給開發(fā)者和使用者,這些能力包括語音、視頻、自然語言處理、知識圖譜等,我們會將這些能力封裝好,開發(fā)者直接調(diào)用就可以。

二、機(jī)器人平臺的背景、設(shè)計(jì)理念和技術(shù)架構(gòu)

2.1 智能聊天機(jī)器人

基于中臺化思想,我們是如何建設(shè)機(jī)器人平臺的?

智能聊天機(jī)器人,是一種通過自然語言模擬人類進(jìn)行對話的程序。

目前,特定場景和領(lǐng)域的聊天機(jī)器人已經(jīng)展現(xiàn)出了很高的自然語言理解與處理能力,例如:小度、Siri、小愛同學(xué)等。

智能聊天機(jī)器人可以代替企業(yè)中相對固化、重復(fù)的人力密集型任務(wù)或流程,包括:

  • 問題咨詢:基于業(yè)務(wù)知識庫進(jìn)行業(yè)務(wù)問題解答。
  • 數(shù)據(jù)檢索:縱跨各業(yè)務(wù)系統(tǒng)或數(shù)據(jù)庫,檢索數(shù)據(jù)或文檔。
  • 業(yè)務(wù)處理:對接相關(guān)業(yè)務(wù)系統(tǒng)轉(zhuǎn)達(dá)指令,完成相應(yīng)業(yè)務(wù)操作。

典型的應(yīng)用場景:智能聊天機(jī)器人除了可以閑聊以外,還可以用在問答作為問答機(jī)器人,回答專業(yè)領(lǐng)域的問題;作為任務(wù)機(jī)器人完成線上,甚至部分線下的任務(wù);作為推薦機(jī)器人,推薦文章、音樂、產(chǎn)品;作為助理機(jī)器人,集成以上各種功能。

智能聊天機(jī)器人可以對外提供客戶服務(wù)、對內(nèi)進(jìn)行業(yè)務(wù)輔助,實(shí)現(xiàn)全方位的效能提升,降本增效。

2.2 智能聊天機(jī)器人的本質(zhì):會話式UI

智能聊天機(jī)器人的本質(zhì)是會話式UI。會話式UI是通過會話形式將已有數(shù)據(jù)、功能、服務(wù)展示給用戶。

會話式UI與傳統(tǒng)UI相比,具有獨(dú)特的優(yōu)勢。

  • 提高用戶注意力。在信息碎片化的今天,用戶注意力持續(xù)集中的時間不多,人們很容易為各種事情分心。在會話式UI中,信息是根據(jù)用戶的指令需求逐步提供的,這樣用戶就不會被無關(guān)的信息干擾。
  • 減少用戶的挫敗感。在會話式UI中,用戶能進(jìn)行的操作相對有限,這也避免了因用戶行為帶來不可控的高錯誤問題。讓用戶做簡單的選擇題,能降低用戶思考的成本和系統(tǒng)錯誤率,最終能夠?qū)崿F(xiàn)讓用戶快速聚焦他們想要的東西,減少因操作帶來的挫敗感。
  • 更高的投入產(chǎn)出比。會話式UI的另一個優(yōu)勢是性價比高。會話式UI用戶界面上線后立即就能投入工作,不需要刻意進(jìn)行訓(xùn)練學(xué)習(xí),降低了使用成本,并且可以根據(jù)商業(yè)邏輯及應(yīng)用情況隨時將對話設(shè)計(jì)進(jìn)行調(diào)整修改。

正如三星實(shí)驗(yàn)室高級設(shè)計(jì)師Golden Krishna所說:“最好的界面就是沒有界面”。很多人認(rèn)為語音交互比聊天機(jī)器人的干擾更小,能提供更好的使用體驗(yàn)。

這也是導(dǎo)致各種智能音箱在市場反響火爆的原因,語音交互已經(jīng)走進(jìn)千家萬戶、世界各地。

2.3 趨勢:會話式UI與業(yè)務(wù)集成

目前會話式UI與業(yè)務(wù)系統(tǒng)緊密集成,是發(fā)展的主要趨勢。通過集成各個業(yè)務(wù)系統(tǒng),可以打造出專屬的業(yè)務(wù)助手。如上圖所示,我們可以將報(bào)表查看、指令集成、知識圖譜查詢、查詢郵件等諸多服務(wù)集成到業(yè)務(wù)系統(tǒng)中,并且提供權(quán)限審核的功能,從而打造一個專屬的業(yè)務(wù)助理。

一些行業(yè)預(yù)測認(rèn)為:

  • 未來,更成熟的技術(shù)使得聊天機(jī)器人能夠更準(zhǔn)確地識別用戶的問題和意圖。
  • 客戶服務(wù)是聊天機(jī)器人的主戰(zhàn)場,是產(chǎn)生最大效益的領(lǐng)域。
  • 聊天機(jī)器人在電商、通訊、保險、金融、旅行等領(lǐng)域廣泛應(yīng)用。
  • 以大數(shù)據(jù)的增強(qiáng)型分析為例,使用自然語言NLP等交互方式,BI使用門檻進(jìn)一步降低。

Gartner預(yù)測到2020年:50%的分析查詢會通過搜索、自然語言處理或語音生成,或自動生成。一線業(yè)務(wù)工作人員通過自然語言處理和會話分析,來進(jìn)行分析和使用商業(yè)智能產(chǎn)品的使用率從35%提升到50%以上。

2.4 智能聊天機(jī)器人建設(shè)過程

接下來詳細(xì)介紹聊天機(jī)器人建設(shè)的過程。

智能聊天機(jī)器人建設(shè)是有難度的,比如機(jī)器人的智能化核心開發(fā)需要一定的AI研發(fā)能力;機(jī)器人需要全套的模型封裝,以及數(shù)據(jù)管理、任務(wù)調(diào)度、權(quán)限控制等工程能力的支持等;各業(yè)務(wù)線均有廣泛的需求,一個個實(shí)施起來將是很漫長的過程。

如果按照一條線一條線建設(shè)的方式,如圖所示,AI同事和平臺同事支持第一個業(yè)務(wù)時,沒有其他業(yè)務(wù)線的需求進(jìn)來,按照項(xiàng)目的支持能夠快速響應(yīng)需求,這時的體驗(yàn)是很好的;而對于第二個業(yè)務(wù)來說,此時由于AI同事和平臺同事正在支持第一個業(yè)務(wù),第二個業(yè)務(wù)線的功能就會有所缺失,可以看到圖中業(yè)務(wù)線B的機(jī)器人少了一條腿,這時就產(chǎn)生了等待;到第三條業(yè)務(wù)線,已經(jīng)進(jìn)入了需求排期階段,AI同事和平臺同事對該業(yè)務(wù)線的支持就很有限了;同樣的,后續(xù)的業(yè)務(wù)線都將處于等待狀態(tài),盡管業(yè)務(wù)方很生氣,可AI同事和平臺同事已經(jīng)疲于奔命。

由此可以看出這種煙囪式機(jī)器人研發(fā)的缺點(diǎn):耗時長、成本高。

那么如何才能高效地支持這些需求呢?

2.5 機(jī)器人工廠

以中臺化思維來建設(shè)智能聊天機(jī)器人平臺。通過平臺化的建設(shè)、復(fù)用化的思想,使得我們的聊天機(jī)器人成為聊天機(jī)器人制造工廠。

  • AI模型復(fù)用化:AI工程師構(gòu)建通用AI模型,僅需少量具體的業(yè)務(wù)數(shù)據(jù)即可構(gòu)建一個個性化的機(jī)器人核心。
  • 工程能力平臺化:平臺化建設(shè),提供一套全面的、通用化的機(jī)器人管理功能,將各種能力沉淀下來,實(shí)現(xiàn)工程模塊和能力復(fù)用化。

我們在構(gòu)建智能聊天機(jī)器人平臺的過程中,將各個業(yè)務(wù)線的需求和能力都集成到平臺中,提供給不同業(yè)務(wù)線使用,各業(yè)務(wù)線都復(fù)用這些能力,并且提供數(shù)據(jù)權(quán)限的高度隔離。

最后達(dá)到機(jī)器人流水式生產(chǎn),管理功能高度復(fù)用,業(yè)務(wù)用戶高速接入,迅速賦能全部領(lǐng)域。

2.6 智能聊天機(jī)器人平臺設(shè)計(jì)考量

智能聊天機(jī)器人平臺的設(shè)計(jì)考量包括以下幾個方面。

1)平臺化or項(xiàng)目制

既然我們用平臺化方式去建設(shè),就必然面臨一些問題:平臺化的好處是可以復(fù)用,事半功倍;缺點(diǎn)是難以兼容個性化。所以我們在平臺建設(shè)過程中,要同時考慮什么樣的功能屬于平臺、什么樣的功能屬于租戶、什么樣的功能屬于公司,把公共的功能進(jìn)行沉淀、把租戶的功能進(jìn)行定制化,這樣才能既兼顧平臺化的事半功倍,又能滿足個性化的需求。

2)中臺能力

  • 多租戶。我們以多租戶的方式建設(shè)智能聊天機(jī)器人平臺,基于用戶角色來定義功能,平臺管理員和租戶功能進(jìn)行能力劃分。
  • 自助化。所有功能自助化,管理和運(yùn)維工作下放給租戶,這樣一來,租戶就可以對自己的機(jī)器人進(jìn)行相應(yīng)的管理,平臺的維護(hù)也會減少很多,而且不用再等排期。
  • 隔離和安全。通過資源隔離(包括數(shù)據(jù)隔離和語科隔離)、算力隔離等將成本分?jǐn)傆?jì)算出來,也可保證數(shù)據(jù)之間互相不影響。另外,基于功能角色和數(shù)據(jù)角色的雙重角色正交的方式保證數(shù)據(jù)安全。

3)統(tǒng)一閉環(huán)

  • 智能機(jī)器人平臺是一個工程、算法、運(yùn)營統(tǒng)一的結(jié)果。機(jī)器人不是一個簡單的算法模型,需要模型運(yùn)行、數(shù)據(jù)管理、權(quán)限控制、人工介入、客戶端支持等,還需要運(yùn)營的支持和鼓勵,比如我們平臺中引入的積分系統(tǒng),根據(jù)積分情況來開展一些運(yùn)營活動,鼓勵大家使用一些功能。
  • 通過運(yùn)行過程中不斷補(bǔ)充問題、在線標(biāo)注、語料導(dǎo)出、自動訓(xùn)練、自動上線形成平臺、數(shù)據(jù)和模型的閉環(huán)。比如我們開發(fā)了會話管理來進(jìn)行在線標(biāo)注,幫助用戶快速補(bǔ)充問題。

2.7 智能機(jī)器人平臺系統(tǒng)架構(gòu)

上圖所示是智能機(jī)器人平臺的系統(tǒng)架構(gòu)。

  • 最上面是機(jī)器人對外提供的服務(wù),通過Web、APP、Restful API對外提供服務(wù)。
  • 中間是一個微服務(wù)層,使用Spring Cloud微服務(wù)架構(gòu),服務(wù)都注冊在Eureka里。微服務(wù)包括了網(wǎng)關(guān)服務(wù)、調(diào)度服務(wù)、外部服務(wù)、商業(yè)邏輯服務(wù)、數(shù)據(jù)訪問層、統(tǒng)計(jì)服務(wù)、通訊服務(wù)等。其中涉及到算法預(yù)測的模塊是在Python的一個服務(wù)里,我們也將Python的服務(wù)注冊到Eureka里,這也是我們稱之為“模型即服務(wù)”的一種思想。
  • 外接認(rèn)證系統(tǒng)包括LDAP、SSO、PS等,外接系統(tǒng)包括各種PC端、APP端、報(bào)表等。
  • 數(shù)據(jù)存儲在Mongo中,文檔存儲在HDFS里,檢索使用Eleastic-Search,統(tǒng)計(jì)使用Click-house,人工后臺通訊用Rabbit mq,會話和上下文管理使用Redis。
  • 整個平臺是微服務(wù)架構(gòu),支持容器化,支持使用Conductor模型編排,用MQTT協(xié)議以解決APP端網(wǎng)絡(luò)不穩(wěn)定的問題。

三、機(jī)器人平臺的核心原理和主要功能點(diǎn)

3.1 機(jī)器人的核心技術(shù)

前文介紹了機(jī)器人平臺的背景、設(shè)計(jì)理念和技術(shù)架構(gòu),接下來介紹機(jī)器人平臺的核心原理和主要功能點(diǎn)。

智能聊天機(jī)器人最核心的部分是對話引擎,對話引擎包括:自動語音識別(ASR)、自然語言理解(NLU)、對話管理(DM)、自然語言生成(NLG) 和文本到語音合成(TTS)。

其中,自然語言理解(NLU)的目標(biāo)是將文本轉(zhuǎn)換成語義表示,文本中的單詞語義并不重要,重要的是文本轉(zhuǎn)化成了語義信息。簡單來說,就是將人的語言轉(zhuǎn)化成機(jī)器可以理解的結(jié)構(gòu)化的完整的語義,讓機(jī)器理解人的語言。

我們通常說的NLP自然語言處理其實(shí)是一個大的集合,包含了NLU自然語言理解和NLG自然語言生成,并且包含了它生成上面的處理部分和下面的應(yīng)用階段,所以NLU和NLG都是NLP的一個子集,它們不是平級的關(guān)系。

DM是對話管理系統(tǒng)的大腦,負(fù)責(zé)更新對話狀態(tài)。對話引擎的難點(diǎn)在NLU和DM。

總的來說,這些技術(shù)都是屬于自然語言處理技術(shù)(NLP,Natural Language Processing),本質(zhì)上我們需要使用NLP技術(shù)來解決聊天機(jī)器人的問題。

對于用戶的一個問題,需要將這個自然語言問題通過一個模型(這個模型是我們用機(jī)器學(xué)習(xí)基于大量數(shù)據(jù)訓(xùn)練和歸納得出來的),轉(zhuǎn)換為機(jī)器能理解的數(shù)據(jù)形式(我們將這種數(shù)據(jù)形式稱之為向量)。

NLP技術(shù)除了用于智能聊天機(jī)器人以外,還用在很多領(lǐng)域,例如:句法語義分析、信息抽取、文本挖掘、機(jī)器翻譯、信息檢索、對話系統(tǒng)等領(lǐng)域。

3.2 機(jī)器人原理

智能聊天機(jī)器人是由多個機(jī)器人組成,包括問答機(jī)器人、閑聊機(jī)器人、任務(wù)機(jī)器人等,人工后臺以及文檔庫之間協(xié)作完成任務(wù),最終選擇最優(yōu)答案返回給用戶。

如圖所示,用戶提一個問題過來:

  • 首先ASR將語音轉(zhuǎn)成文本,這時候涉及到了調(diào)度。平臺服務(wù)和任務(wù)調(diào)度認(rèn)為這是一個機(jī)器人的問題,就進(jìn)入預(yù)處理階段。
  • 預(yù)處理包含分詞/去停、詞表映射、詞性分析、句法分析、實(shí)體識別、句子復(fù)述、關(guān)系提取等;
  • 然后進(jìn)入分析階段,包括領(lǐng)域分析、問題分類、意圖檢測以及bot識別等;
  • 然后轉(zhuǎn)到不同的機(jī)器人,比如QA機(jī)器人-解答用戶對事實(shí)和非事實(shí)類的問題、閑聊機(jī)器人-解答用戶情感方面的表述和對客觀問題的討論、任務(wù)機(jī)器人-滿足特定場景的任務(wù)操作、場景機(jī)器人、知識圖譜機(jī)器人等;
  • 之后將結(jié)果匯集到融合排序?qū)?,進(jìn)行加權(quán)重排答案矯正;
  • 最后經(jīng)過用戶權(quán)限過濾,生成答案,將答案經(jīng)過TTS合成語音反饋給用戶。

如果這個問題機(jī)器人不能解答,就會轉(zhuǎn)入人工后臺,或轉(zhuǎn)到搜索引擎進(jìn)入文檔的搜索檢索,最終將最優(yōu)答案返回。

3.3 QA機(jī)器人

QA機(jī)器人的本質(zhì)是:假設(shè)用戶提了一個問題Q,QA機(jī)器人需要從已有的QA數(shù)據(jù)庫中尋找最合適的QA對返回,QA機(jī)器人會進(jìn)行QQ相似度計(jì)算和QA匹配度計(jì)算,通過綜合相似度與匹配度,找到最適合的一組QA對 (Qi, Ai),即最佳答案返回。

解決方案1:NN模型

常見的網(wǎng)絡(luò)模型包括RNN和CNN模型。例如雙層編碼(Decoder)的長短期記憶模型(LSTM)。這種模型在很多場景下都比較好用,網(wǎng)絡(luò)模型的主要缺點(diǎn)是需要一定數(shù)量的樣本。

解決方案2:拆分成子問題。

在語料比較小的情況下,將問題進(jìn)行拆分,分為兩個階段:

  • 把問題變成一種短文本語義表征,通常有tfidf、w2v。
  • 然后再進(jìn)行語義距離計(jì)算,例如計(jì)算向量的余弦距離。

它的優(yōu)點(diǎn)是在語料比較小的情況下效果不錯。

3.4 QA機(jī)器人原理(QQ匹配)

這里以QQ匹配來介紹QA機(jī)器人原理。

QQ匹配包括幾個部分:句向量化、相似度計(jì)算、相似度排序。

  • 句向量化是使用BoW詞袋模型和同義詞擴(kuò)展,將句子的詞轉(zhuǎn)換成向量;
  • 然后再與問題庫里的詞進(jìn)行相似度計(jì)算,計(jì)算出余弦相似度;
  • 用余弦距離產(chǎn)生相應(yīng)的結(jié)果,按照相似度大小排序返回答案列表。

句向量我們是通過詞袋模型和同義詞擴(kuò)展來表示的。

什么是詞袋模型?詞袋模型就是忽略文本里的詞序、詞法、句法,只將它看做一個詞的集合,把它當(dāng)成一個詞袋。

還引入了同義詞擴(kuò)展。在實(shí)際的問題中,不同的詞可能存在不同的問法,但其語義相同,所以進(jìn)行一些同義詞等價,這樣就形成了詞向量。向量的值是TF-IDF值,用于表示權(quán)重。

TF-IDF模型(term frequency–inverse document frequency,詞頻與逆向文件頻率)。TF-IDF是一種統(tǒng)計(jì)方法,用以評估某一字詞對于一個文件集或一個語料庫的重要程度。TF-IDF的主要思想是,如果某個詞或短語在一篇文章中出現(xiàn)的詞頻高,并且在其他文章中很少出現(xiàn),則認(rèn)為此詞或者短語具有很好的類別區(qū)分能力,適合用來分類。

TF-IDF有兩個值,一個是詞頻率,另一個是IDF(inverse document frequency,逆向文件頻率)。如圖中的計(jì)算方式。

舉個例子,庫中10000篇文檔,10000篇提到“母牛”,其中10篇提到“產(chǎn)奶量”,比如一篇關(guān)于“母牛的產(chǎn)奶量”的文字,這篇文章有100個詞,“母牛”出現(xiàn)5次,“產(chǎn)奶量”出現(xiàn)2次)。

通過計(jì)算發(fā)現(xiàn),雖然“母?!钡脑~頻率很高,但I(xiàn)DF值很低,最后“母?!钡腡F-IDF很低,也就是說這個詞不具太大的標(biāo)識度。而“產(chǎn)奶量”這個詞的詞頻率不高,但它的辨識度很高,最終它的TF-IDF也很高。

具體執(zhí)行過程如圖所示。

  • 首先拿到一個語句,進(jìn)行分詞、去停用詞、去重,得到一個詞序列。然后遍歷每一個詞進(jìn)行TF-IDF計(jì)算,如果在同義詞表里,就計(jì)算詞TF-IDF并求平均值;如果在詞庫中,就計(jì)算TF-IDF值;如果不在詞庫中,就直接忽略,最后形成詞對應(yīng)的TF-IDF值,并將Value向量單元化。
  • 接下來我們要計(jì)算向量和向量之間的距離,這里我們采用余弦距離。計(jì)算方式如圖所示。
  • 當(dāng)兩個詞向量的余弦值接近1的時候,兩個詞向量相似,也就是兩個句子相關(guān)。否則就不相關(guān)。通過計(jì)算余弦值來最終達(dá)到判斷句子的相似度。

上文介紹的QQ匹配是屬于一種基于檢索的聊天機(jī)器人,另一種對應(yīng)的分類是基于模型生成的表情機(jī)器人。

基于檢索的聊天機(jī)器人:

  • 特點(diǎn)是回復(fù)數(shù)據(jù)是預(yù)先存儲且知道(或定義)的數(shù)據(jù)。
  • 優(yōu)點(diǎn)是問題與答案都經(jīng)過人工總結(jié),保證了數(shù)據(jù)庫中的答案正確性,表述自然、易于理解。
  • 缺點(diǎn)是用戶提問的各種問題,機(jī)器人都試圖在庫上尋找答案;問題數(shù)有限,無法覆蓋用戶的所有問題;需要不斷總結(jié)、擴(kuò)展,爭取覆蓋大多數(shù)問題。

生成模型的聊天機(jī)器人:

  • 特點(diǎn)是創(chuàng)造出嶄新的、未知的回復(fù)內(nèi)容(模型沒有見過),類似機(jī)器翻譯技術(shù)。
  • 優(yōu)點(diǎn)是不需要預(yù)先存儲且定義好的數(shù)據(jù),比起檢索模型更加的靈活多變。
  • 缺點(diǎn)是生成效果不佳,生成的答案可能有一些語法錯誤和語義無關(guān)的內(nèi)容;生成式模型需要海量的訓(xùn)練數(shù)據(jù),且難以優(yōu)化;結(jié)果無法控制。

目前的現(xiàn)狀是,在商業(yè)領(lǐng)域,工業(yè)級標(biāo)準(zhǔn)還是會使用基于檢索的機(jī)器人,適合特定領(lǐng)域內(nèi)、問題集合有限,還有一些變體,比如知識圖譜、基于KG的機(jī)器人、基于搜索引擎的機(jī)器人。而生成模型的機(jī)器人,是學(xué)術(shù)界研究的重點(diǎn),在商業(yè)領(lǐng)域,它會作為檢索式機(jī)器人的補(bǔ)充形式,兩者結(jié)合使用,

3.5 閑聊機(jī)器人原理

閑聊機(jī)器人主要是進(jìn)行客觀話題討論,用戶對聊天機(jī)器人進(jìn)行一些情感表達(dá),回答問候、情感和娛樂等信息。閑聊處理由兩個組件組成:

  • 基于預(yù)置規(guī)則匹配:公司合規(guī)用語要求。
  • 基于聊天庫中海量閑聊語料:滿足大多數(shù)閑聊應(yīng)答。

海量的閑聊語料,可以從在線論壇、微博對話、甚至別的通用機(jī)器人爬取,雖然從各個地方爬取,也需要審核,以滿足用戶需求。

閑聊機(jī)器人的要求是:簡單閑聊、結(jié)果可控、快速開發(fā)。所以實(shí)現(xiàn)上我們基于AIML構(gòu)建閑聊機(jī)器人。

AIML是由Richard Wallace發(fā)明的一種語言。他設(shè)計(jì)了一個名為 A.L.I.C.E.(Artificial Linguistics Internet Computer Entity 人工語言網(wǎng)計(jì)算機(jī)實(shí)體)的機(jī)器人,并獲得了多項(xiàng)人工智能大獎。AIML是一種為了匹配模式和確定響應(yīng)而進(jìn)行規(guī)則定義的XML格式。

AIML的能力很靈活,如圖所示,可以基于模板匹配、任意字符匹配、元素提取、一個問題多個答案、劃分主題等。

AIML來作為知識載體的好處是靈活、人性化強(qiáng)。缺點(diǎn)是在知識的編寫方面門檻高,比如閑聊庫的擴(kuò)充方面的問題等。

好在有現(xiàn)成的AIML編輯軟件,如:SimpleAIMLEditor,GaitoBotAIMLEditor等。

AIML語言的規(guī)范也在不斷升級,最新版本AIML2.0。

3.6 任務(wù)機(jī)器人原理

任務(wù)機(jī)器人(Task-Bot) 的關(guān)鍵技術(shù)是基于意圖識別與語義槽提取。舉個例子,A說“幫我訂一個今天下午3點(diǎn)到4點(diǎn)的會議室吧?要大一點(diǎn)的?!睓C(jī)器人識別出來這是一個任務(wù),而這個任務(wù)要完成必須三個語義槽:時間、地點(diǎn)、大小。

經(jīng)過分析發(fā)現(xiàn)A的任務(wù)請求中缺乏一個語義槽-地點(diǎn),于是觸發(fā)機(jī)器人反問“請問您要預(yù)訂哪個職場的會議室?”,A補(bǔ)充了地點(diǎn)后,機(jī)器人聯(lián)動會議預(yù)定系統(tǒng),進(jìn)行會議室預(yù)定,完成任務(wù)并反饋結(jié)果給A。

這個過程涉及了:意圖識別、關(guān)鍵參數(shù)提取、多輪對話&對話管理、配置化、對接外部系統(tǒng)。

以上圖的一個實(shí)際例子來看,這個例子是根據(jù)身份證號查詢歸屬地。

  • 首先配置可能的問法,這里可以看到,設(shè)置的可能問法越多,越能幫助機(jī)器人識別意圖。這里主要涉及到意圖識別和設(shè)置可能問法。
  • 然后配置需要提取的槽值,槽值來自一個實(shí)體,這里的槽值是身份證。并且配置如果沒有提取到的話,需要追問的問題??梢栽诰€進(jìn)行測試槽值提取。
  • 接下來配置觸發(fā)的外部系統(tǒng),這里支持常見的post,get,將相應(yīng)的槽值發(fā)送給系統(tǒng),然后獲得返回值,再從返回值中提取必要信息,用于顯示正確情況和錯誤情況。
  • 最后看到的效果如上圖所示,整個過程涉及到多輪對話和話題追蹤。

3.7 場景機(jī)器人原理

場景機(jī)器人可以說是任務(wù)機(jī)器人更高級的版本,它是基于預(yù)置規(guī)則驅(qū)動完成場景任務(wù)。

上圖示例中,銷售人員G想查客戶李國強(qiáng)的信息,機(jī)器人給出相應(yīng)信息后,根據(jù)預(yù)設(shè)的場景,觸發(fā)后臺配置的一個業(yè)務(wù)推薦流程,根據(jù)這個流程,銷售人員可以獲得適合李國強(qiáng)客戶的產(chǎn)品推薦、了解相關(guān)產(chǎn)品情況、進(jìn)行話術(shù)演練等,本來只是一個聊天過程,跳轉(zhuǎn)到特定的場景以及業(yè)務(wù)相關(guān)的聯(lián)動,這就是場景機(jī)器人。場景機(jī)器人的場景和相關(guān)業(yè)務(wù)跳轉(zhuǎn)都是可以配置的,這樣可以達(dá)到動態(tài)化地支持不同的場景。

場景機(jī)器人與場景綁定、結(jié)合場景相關(guān)話術(shù)和跳轉(zhuǎn)規(guī)則,可以做:客戶畫像查詢、產(chǎn)品信息查看、場景演練、面見話術(shù)等,還可以進(jìn)行交叉銷售、客戶關(guān)聯(lián)查詢。

3.8 KG機(jī)器人原理

KG機(jī)器人,即知識圖譜機(jī)器人,本質(zhì)上是一種語義網(wǎng)絡(luò),其結(jié)點(diǎn)代表實(shí)體或者概念,邊代表實(shí)體、概念之間的各種語義關(guān)系。KG機(jī)器人是基于知識圖譜推理給出結(jié)果,也是基于檢索型機(jī)器人的一種。

相較于純文本,知識圖譜在問答系統(tǒng)中具有以下優(yōu)勢。

  • 數(shù)據(jù)關(guān)聯(lián)度:語義理解程度是問答系統(tǒng)的核心指標(biāo)。在知識圖譜中,所有知識點(diǎn)被具有語義信息的邊所關(guān)聯(lián)。從問句到知識圖譜的知識點(diǎn)的匹配關(guān)聯(lián)過程中,可以用到大量其關(guān)聯(lián)結(jié)點(diǎn)的關(guān)聯(lián)信息。這種關(guān)聯(lián)信息無疑更為智能化的語義理解提供了條件。
  • 數(shù)據(jù)精度:回答準(zhǔn)確率高,知識圖譜的知識來自專業(yè)人士標(biāo)注,或者專業(yè)數(shù)據(jù)庫的格式化抓取,這保證了數(shù)據(jù)的高準(zhǔn)確率。
  • 數(shù)據(jù)結(jié)構(gòu)化:檢索效率知識圖譜的結(jié)構(gòu)化組織形式,為計(jì)算機(jī)的快速知識檢索提供了格式支持。

這些優(yōu)勢都促使我們在構(gòu)建智能聊天機(jī)器人平臺時使用知識圖譜來作為問答系統(tǒng)的知識來源。

舉個例子,這是保險的知識圖譜,包含了:查詢實(shí)體屬性-平安境內(nèi)旅行險一個月多少錢?查詢關(guān)系以及屬性-能保骨折,且承保時間在5年以上的保險有哪些?查詢簡單關(guān)系-平安境內(nèi)旅行險能保意外骨折嗎?查詢復(fù)雜關(guān)系-想買一個能保骨折,并且能夠在??谑械娜揍t(yī)院報(bào)銷的保險。

這些本質(zhì)上都是在進(jìn)行圖查詢,查詢實(shí)體的屬性,查詢實(shí)體和實(shí)體之間的關(guān)系等。

知識圖譜機(jī)器人構(gòu)建過程中:

  • 首先第一步是定義知識圖譜的領(lǐng)域知識,上述例子中我們相當(dāng)于在面向?qū)ο蠖x實(shí)體、屬性、關(guān)系等,三元組(實(shí)體、屬性、關(guān)系)的關(guān)系定義好了以后,才可以構(gòu)建圖譜模型。
  • 接下來是提取信息,這個過程涉及到大量的訓(xùn)練、在線標(biāo)注等,需要從現(xiàn)有的表單、文檔中將需要的信息提取出來,并將提取的信息導(dǎo)入第一步構(gòu)建的模型中。
  • 接下來是知識問答。需要從問句中提取實(shí)體、屬性、關(guān)系。在這個例子中,重大疾病險的等價詞是重疾險,重疾險是一個實(shí)體,結(jié)腸癌也是一個實(shí)體。
  • 最后問句就被轉(zhuǎn)換為一個實(shí)體和實(shí)體之間關(guān)系的預(yù)測。

當(dāng)用戶問問題時候,把問句轉(zhuǎn)化成圖計(jì)算,機(jī)器人通過知識圖譜進(jìn)行查詢計(jì)算,并轉(zhuǎn)化為答案反饋給用戶。

3.9 模型編排

除了上述各種機(jī)器人之外,聊天機(jī)器人平臺還涉及到模型編排和模型管理的部分。比如有的業(yè)務(wù)只需要QA機(jī)器人,這時通過預(yù)處理,調(diào)用QA機(jī)器人,經(jīng)過角色權(quán)限過濾就可以提供服務(wù)了。有的場景可能需要多種機(jī)器人進(jìn)行合作,這就涉及到路由/群發(fā),群發(fā)機(jī)器人的結(jié)果還要進(jìn)行融合合并。

模型編排,將不同的模型進(jìn)行組合,以可視化的方式對調(diào)用的模型順序進(jìn)行編排,支持拖拽式配置。

模型本身是需要服務(wù)化的。我們的實(shí)際模型本身是一些python服務(wù),我們將這些python服務(wù)進(jìn)行封裝,進(jìn)行服務(wù)的統(tǒng)一管理,這樣的話就可以對模型定義統(tǒng)一的接口,還可以進(jìn)行自動化的更新,比如通過定時模型訓(xùn)練去更新此模型,其他模型不受影響,如上圖所示的模型手動更新和自動更新。同時我們可以進(jìn)行單元測試和鏈路測試。

3.10 智能聊天機(jī)器人能力

目前平臺已能夠支持:

  • 多類型機(jī)器人集成功能,包括問答、任務(wù)、閑聊等;
  • 復(fù)雜情景會話:包括多輪對話功能、話題追蹤功能等;
  • 多渠道機(jī)器人交互終端;
  • 統(tǒng)一的機(jī)器人管理框架;
  • 完善的人工客服能力支持;
  • 全面的數(shù)據(jù)記錄與統(tǒng)計(jì)。

3.11 機(jī)器人平臺功能

聊天機(jī)器人平臺主要功能包括以下幾個方面。

  • 聊天機(jī)器人平臺。聊天機(jī)器人平臺的前臺有機(jī)器人應(yīng)答、QA、文檔檢索、關(guān)聯(lián)檢索、離線消息、會話歷史、常見問題、問候語等功能。后臺包括搜索引擎是否介入、反饋設(shè)置、外觀設(shè)置、場景設(shè)置、模型配置等功能。
  • 人工后臺。人工后臺包括客服工作臺(在線會話、會話歷史、會話轉(zhuǎn)單、會話排隊(duì)、邀請會話、客戶信息顯示、快捷回復(fù)等功能)、客服管理、技能組管理等。
  • 會話管理。瀏覽會話導(dǎo)出、查詢歷史會話、對歷史會話進(jìn)行在線分類評分,添加QA問題。
  • QA/文檔管理。瀏覽編輯、全文檢索、問題分類、等價問題、批量上傳語料、生成水印、查看文檔權(quán)限。
  • 任務(wù)管理。對于任務(wù)機(jī)器人來說,功能包括任務(wù)配置、實(shí)體管理、任務(wù)更新、模型配置等。
  • 閑聊管理。對于閑聊機(jī)器人,功能包括閑聊庫管理、全文檢索、語料導(dǎo)出、模型更新管理。
  • 報(bào)表統(tǒng)計(jì)。包括會話統(tǒng)計(jì)、文檔/QA統(tǒng)計(jì),人工后臺服務(wù)分析、用戶提問句云活躍度排名、用戶積分、用戶行為覆蓋等。
  • 模型管理。包括模型編排、模型啟停更新、自動維護(hù)發(fā)布上線、模型預(yù)測等測試環(huán)境功能。
  • 認(rèn)證支持/外部系統(tǒng)對接。包括PS對接、LDAP對接、SSO對接/各種外部系統(tǒng)對接。

1)機(jī)器人前臺

機(jī)器人預(yù)置了web交互頁面,支持機(jī)器人全部的功能。包括對話、留言反饋、轉(zhuǎn)人工、查看歷史消息;可直接嵌入PC端和APP端業(yè)務(wù)系統(tǒng)等。

在上圖的例子中可以看到,前面部分是我們的常見問題列表,用戶問了一個問題,然后找到一個匹配該問題的答案。如果用戶給出的問題比較簡單,如上圖,只給出“宜人貸”,就沒辦法命中一個獨(dú)立的問題,這時除了匹配答案以外,還會給出一些與該問題相關(guān)聯(lián)的問題,這種我們稱之為關(guān)聯(lián)問題。也可以轉(zhuǎn)到搜索引擎,通過搜素引擎的相關(guān)問題。

實(shí)際上,對于檢索模型的聊天機(jī)器人而言,當(dāng)FAQ中沒有合適的答案,我們返回的是FAQ中與問句最相近問句-答案對中的問句,而不是答案。這樣可以從用戶提問中得到更多信息,以便返回更真實(shí)的答案。我們在實(shí)踐中發(fā)現(xiàn),用戶通過這樣的關(guān)聯(lián),只需要幾次點(diǎn)擊就能找到真正想要的答案,其滿意度會得到提升。

2)知識庫

這是機(jī)器人的知識庫,知識庫包含了一些分類信息,支持相應(yīng)的數(shù)據(jù)角色、文檔的數(shù)據(jù)顏色格式,還包含瀏覽編輯、全文檢索、問題分類、批量上傳、語料生成、水印生成等功能。

3)人工后臺

這是機(jī)器人的人工后臺。人工后臺上線后,用戶可以跟人工后臺的客服人員聊天,在這個過程中也可以上傳圖片。與機(jī)器人問答不同的是,機(jī)器人模式中用戶只能發(fā)文字,而與客服人員聊天,可以上傳文檔、插入表情、請求評價等。在這里還可以做快捷回復(fù)、查看知識庫、文檔庫、客戶本身的信息,還有一些智能回答。

這是客服工作臺的功能,可以從隊(duì)列里調(diào)出相應(yīng)的客戶進(jìn)行會話,解決不了的問題可以轉(zhuǎn)交給別的工作臺的客服解答。

4)會話管理

接著來看會話管理。上圖左邊是這個人對應(yīng)的歷史聊天信息,我們可以檢索并定位到他認(rèn)為回答不好的問題,進(jìn)行在線快速補(bǔ)充添加新問題。每一個問題的評分都會顯示,既能幫助算法同事,也能幫助運(yùn)營同事進(jìn)行在線信息維護(hù)。

5)統(tǒng)計(jì)分析

機(jī)器人平臺還提供數(shù)據(jù)統(tǒng)計(jì)和分析功能,這一功能是基于Davinci數(shù)據(jù)可視化工具完成的,可以自定義數(shù)據(jù)指標(biāo),比如機(jī)器人服務(wù)時長、服務(wù)執(zhí)行度等。還可以進(jìn)行報(bào)表統(tǒng)計(jì):會話統(tǒng)計(jì)、文檔QA統(tǒng)計(jì),人工后臺服務(wù)分析、用戶提問句云、活躍度排名、用戶積分、用戶行為覆蓋、使用明細(xì)。

6)模型管理

機(jī)器人平臺還提供通用化模型運(yùn)行托管平臺,它是一個高可用運(yùn)行架構(gòu),可以進(jìn)行模型封裝、發(fā)布、啟停、更新管理,還包括自動數(shù)據(jù)更新機(jī)制、統(tǒng)一服務(wù)訪問接口等。

7)多租戶和角色權(quán)限

機(jī)器人平臺提供多租戶和角色權(quán)限管理的功能,并且在公司里提供用戶的自動導(dǎo)入,通過配置相應(yīng)的角色和權(quán)限,自動導(dǎo)入成機(jī)器人的用戶角色權(quán)限。這樣一來,就不用維護(hù)用戶本身了,可以跟不同的業(yè)務(wù)系統(tǒng)直接對接。

機(jī)器人平臺的其他功能,諸如任務(wù)配置、閑聊配置、積分管理、對接外部系統(tǒng)等功能此處不一一展開。

3.12 機(jī)器人發(fā)展階段

如圖所示為智能聊天機(jī)器人平臺的發(fā)展階段,我們已經(jīng)完全了前面階段的機(jī)器人功能建設(shè),包括問答、人工后臺等。目前我們處于第三階段向第四階段演進(jìn)的過程,最終我們希望達(dá)到業(yè)務(wù)領(lǐng)域系統(tǒng)性CUI整合,即通過機(jī)器人會話,以場景式機(jī)器人的方式展示給客戶,成為機(jī)器人助理。

四、智能聊天機(jī)器人平臺的應(yīng)用場景

4.1 智能客服機(jī)器人

智能客服機(jī)器人的初衷是解決客服管理部的痛點(diǎn)。

宜信有很多線下門店,這些門店中的銷售人員有大量的問題,涉及到政策、法規(guī)、流程、管理等眾多方面,這些問題都會通過內(nèi)部溝通工具蜜蜂或郵件集中到客服管理部來解答。

  • 溝通的過程中,因?yàn)槿藬?shù)和問題量太大,重復(fù)工作多、問題難跟蹤,知識難沉淀、缺乏問題的統(tǒng)計(jì)、無法針對性的培訓(xùn)。
  • 對于門店客服和銷售人員而言,人工回答等待時間很長,影響工作效率,客服容易情緒急躁,人工解答也不標(biāo)準(zhǔn)。
  • 對于客戶來說,等待時間較長,影響客戶體驗(yàn)、解答不標(biāo)準(zhǔn)、影響品牌認(rèn)知。

引入智能客服機(jī)器人以后,80%的問題被機(jī)器人攔截,剩下的20%轉(zhuǎn)到人工后臺,減輕了客服管理人員的壓力。

智能客服機(jī)器人目前服務(wù)于所有一線的客服同事,成為客服管理重要的日常工具。客服人員只需要通過手機(jī)就可以操作,實(shí)現(xiàn)了運(yùn)營管理智能化從0到1的過程,幫助運(yùn)營人員減輕壓力,提升運(yùn)營效率。

4.2 財(cái)富智能助手機(jī)器人

財(cái)富銷售過程中涉及到很多產(chǎn)品(基金、保險等),需要了解產(chǎn)品知識、政策法規(guī)、銷售話術(shù)等。同事希望能有一個知識型的助手,協(xié)助解答在銷售過程中遇到的諸多知識盲點(diǎn),提高專業(yè)度。

我們計(jì)劃使用聊天機(jī)器人小助手與現(xiàn)有手機(jī)app結(jié)合,實(shí)現(xiàn)產(chǎn)品、客戶、知識一站式服務(wù)。

如上圖所示,財(cái)富智能助手并不是直接調(diào)用機(jī)器人平臺,而是通過API方式調(diào)用機(jī)器人平臺,然后去詢問各種支持銷售的問題。

目前財(cái)富智能助手機(jī)器人覆蓋所有一線銷售和業(yè)務(wù)支持人員,解決投前、投中、投后、銷售政策等問題,提高了業(yè)務(wù)專業(yè)度、響應(yīng)速度,提升業(yè)務(wù)拓展效率。

4.3 保險智能機(jī)器人

第三個場景是保險智能機(jī)器人。微信用戶存在大量相關(guān)問題咨詢,使用人員來回答的話疲于應(yīng)付,回答也不專業(yè),人力成本很高,希望通過機(jī)器人對售前類問題提供咨詢服務(wù),代替人工,完成售前信息交互,大幅減少人員成本,提高回答準(zhǔn)確的和精準(zhǔn)度。

如圖所示,保險智能機(jī)器人基于第三方知識庫提供查詢:包括保險類術(shù)語查詢、疾病庫查詢、險種查詢、醫(yī)院庫等保險知識大全;基于知識圖譜和推理的1~3度內(nèi)查詢等,例如:條款明細(xì)請問這款產(chǎn)品有猶豫期嗎?我孩子5歲可以買這款產(chǎn)品嗎?重疾險都包那些疾?。窟€可以做常見售前售后意圖判斷、保險費(fèi)用預(yù)計(jì)算。

4.4 AIOps運(yùn)維機(jī)器人

最后一個場景是AIOps智能運(yùn)維機(jī)器人,AIOps是一個很大的話題,涉及到海量數(shù)據(jù)的存儲、分析和處理。數(shù)據(jù)包括:歷史數(shù)據(jù)、流數(shù)據(jù)、日志數(shù)據(jù)、時序數(shù)據(jù)、異常數(shù)據(jù)等。整個系統(tǒng)由許多小工具集成成為一個大系統(tǒng)。AIOps還包含自動模式發(fā)現(xiàn)和預(yù)測、異常檢查、根因分析等需要模型支持等方面。

這里我們主要關(guān)注入口:文本輸入。

在日常運(yùn)維中,當(dāng)出現(xiàn)異常時,運(yùn)維同事收到手機(jī)、郵件或短信報(bào)警,希望通過手機(jī)APP,以自然語言方式查看獲得當(dāng)前系統(tǒng)狀態(tài)、隨時隨地了解當(dāng)前系統(tǒng),甚至可以通過運(yùn)維執(zhí)行命令來解除故障。

比如可以通過手機(jī)APP調(diào)用任務(wù)機(jī)器人去查詢后臺系統(tǒng)中網(wǎng)絡(luò)占用的一個時序圖,把這個圖以報(bào)表的方式返回到前端。使用機(jī)器人可以有效降低信息過載問題,調(diào)用相關(guān)接口,直接找到目前最重要的問題并返回。當(dāng)發(fā)現(xiàn)系統(tǒng)出現(xiàn)故障時,可以通過機(jī)器人發(fā)送命令,重啟服務(wù)解除故障。

五、總結(jié)

基于AI中臺的思想和實(shí)踐。智能聊天機(jī)器人采用平臺化建設(shè)方式,使得機(jī)器人可以快速復(fù)制。第一個機(jī)器人從研發(fā)到上線用時6個月,接下來是5個月上線,4個月上線,2個月上線,6周上線,最新的項(xiàng)目是3周完成上線。

支持多業(yè)務(wù)線、系統(tǒng)無縫對接,同時響應(yīng)個性化需求。產(chǎn)品從立項(xiàng)以來支持公司普惠金融、財(cái)富管理的諸多重要業(yè)務(wù)方,支持PC端、APP端、restful api接口對接。

覆蓋同事廣,服務(wù)時間長。支持一線同事數(shù)萬人,累積回答問題數(shù)十萬次以上,累積會話時長近千小時。

運(yùn)營效果好,節(jié)省人力。據(jù)統(tǒng)計(jì),有效回答(機(jī)器人回答占總回答比例)在80%以上,錯誤反饋率在5%以下(反饋無用的比例)。

產(chǎn)品種類全。包括問答機(jī)器人、閑聊機(jī)器人、任務(wù)機(jī)器人、知識圖譜機(jī)器人、以及基于場景的交互式機(jī)器人(如產(chǎn)品推薦、問卷調(diào)查、催收銷售等)。

提供工程、算法和運(yùn)營統(tǒng)一的一站式智能聊天解決方案。比如在線查看標(biāo)注會話和知識更新、自動化語料導(dǎo)出和模型更新、數(shù)據(jù)、算法和運(yùn)營形成閉環(huán)。

【本文是專欄機(jī)構(gòu)宜信技術(shù)學(xué)院的原創(chuàng)文章,微信公眾號“宜信技術(shù)學(xué)院( id: CE_TECH)”】

??戳這里,看該作者更多好文??


本文題目:AI中臺——智能聊天機(jī)器人平臺的架構(gòu)與應(yīng)用
網(wǎng)站地址:http://www.dlmjj.cn/article/coiddsj.html