新聞中心
Thomson Reuters:以經(jīng)濟高效的方式加載和處理流式數(shù)據(jù)
作者:佚名 2021-09-06 17:16:11
云計算 對于企業(yè)和專業(yè)人士來說,Thomson Reuters 是全球領(lǐng)先智能信息來源之一,也是全球最受信任的新聞組織之一。它為公司提供尋找可信答案所需的智能、技術(shù)和人類專業(yè)知識,幫助公司更迅速作出更明智的決策。其客戶覆蓋金融、風(fēng)險、法律、稅務(wù)、會計和媒體市場。

創(chuàng)新互聯(lián)是一家企業(yè)級云計算解決方案提供商,超15年IDC數(shù)據(jù)中心運營經(jīng)驗。主營GPU顯卡服務(wù)器,站群服務(wù)器,成都機柜租用,海外高防服務(wù)器,服務(wù)器機柜,動態(tài)撥號VPS,海外云手機,海外云服務(wù)器,海外服務(wù)器租用托管等。
對于企業(yè)和專業(yè)人士來說,Thomson Reuters 是全球領(lǐng)先智能信息來源之一,也是全球最受信任的新聞組織之一。它為公司提供尋找可信答案所需的智能、技術(shù)和人類專業(yè)知識,幫助公司更迅速作出更明智的決策。其客戶覆蓋金融、風(fēng)險、法律、稅務(wù)、會計和媒體市場。
挑戰(zhàn)
Thomson Reuters 有數(shù)百種產(chǎn)品和服務(wù),面向從法律事務(wù)所、銀行到消費者等各行各業(yè)的客戶。2016 年,Thomson Reuters 決定構(gòu)建一種解決方案來捕獲、分析和可視化其產(chǎn)品/服務(wù)生成的分析數(shù)據(jù),從而提供洞察意見來幫助產(chǎn)品團隊持續(xù)提升用戶體驗。
市場上有很多現(xiàn)成的商用使用情況分析服務(wù)。然而,Thomson Reuters 決定構(gòu)建自己的分析服務(wù),以便管理成本、掌握分析數(shù)據(jù)所有權(quán),并通過文件元數(shù)據(jù)之類的其他信息豐富分析數(shù)據(jù)。
該公司清楚自己希望在云中構(gòu)建這種解決方案,并且知道底層平臺的諸多要求。首先,需要利用動態(tài)和靜態(tài)加密保護信息。還需要每秒處理數(shù)千事件,并需要彈性擴展以適應(yīng)突發(fā)新聞時雙倍或三倍增長的流量。而且,由于負責(zé)構(gòu)建該解決方案的小組規(guī)模相當(dāng)小,公司需要最大程度縮減行政和管理任務(wù),以便他們能專注于構(gòu)建新功能和支持產(chǎn)品團隊。最后,Thomson Reuters 希望解決方案能快速上線,他們只有五個月的時間。
為什么選擇 Amazon Web Services
Thomson Reuters 很快就意識到 Amazon Web Services (AWS) 是能夠滿足其所有需求的唯一平臺。該公司已然在眾多功能中使用 AWS,很熟悉它的能力和規(guī)模。Thomson Reuters 構(gòu)建的分析解決方案 Product Insight 依賴于多種 AWS 服務(wù)。
初始事件攝取層由 Elastic Load Balancing 以及 Auto Scaling 組中的自定義 NGINX Web 服務(wù)器組成。在 SSL/TLS 結(jié)束后,攝取層使用元數(shù)據(jù)增加事件并使用 AWS Key Management Service (KMS) 將它們加密。
攝取層將受保護的數(shù)據(jù)傳遞到由 Amazon Kinesis Streams、Amazon Kinesis Firehose 和 AWS Lambda 無服務(wù)器計算構(gòu)成的流式數(shù)據(jù)管道。Thomson Reuters 評估了包括 Apache Kafka 在內(nèi)的其他流式數(shù)據(jù)工具,但發(fā)現(xiàn)它們難以管理和擴展。該公司不希望在管理軟件堆棧和服務(wù)器隊列上殫精竭慮,因此選擇了完全托管的 Amazon Kinesis。
Amazon Kinesis 流式處理數(shù)據(jù)管道能夠自動批處理數(shù)據(jù)并以經(jīng)濟高效的方式將其傳遞到主要數(shù)據(jù)集,從而永久存儲到支持跨區(qū)域復(fù)制的 Amazon Simple Storage Service (Amazon S3) 存儲桶內(nèi)。通過主要數(shù)據(jù)集,Thomson Reuters 可以應(yīng)用額外轉(zhuǎn)換步驟、在系統(tǒng)處于丟失狀態(tài)時恢復(fù)事件中的數(shù)據(jù),并支持新的業(yè)務(wù)案例。如果事件無法即時從攝取層分派到數(shù)據(jù)管道,故障轉(zhuǎn)移機制會將它們傳遞到 Amazon S3,以待系統(tǒng)恢復(fù)正常運行時重新執(zhí)行相應(yīng)操作。
在 AWS Lambda 的幫助下,Thomson Reuters 能夠以經(jīng)濟高效的方式加載和處理流式數(shù)據(jù),而無需預(yù)置或管理任何服務(wù)器。Lambda 會從 Kinesis 管道收集數(shù)據(jù)并將其加載到 Amazon S3 中的主要數(shù)據(jù)集。另外,每當(dāng)有新數(shù)據(jù)存儲時,Amazon S3 的數(shù)據(jù)通知會觸發(fā) Lambda,從而對主要數(shù)據(jù)集執(zhí)行額外轉(zhuǎn)換。僅當(dāng)數(shù)據(jù)通過集成 Kinesis 和 Amazon S3 觸發(fā) Lambda 時,Lambda 才會運行代碼;并且僅當(dāng)代碼運行時,才需要對計算處理付費。
附加到 Amazon Kinesis 流的并行實時管道會通過連接到 Thomson Reuters Services 平臺的自定義提取、轉(zhuǎn)換和加載 (ETL) 服務(wù)器將事件傳遞到安全的多租戶 Elasticsearch 集群。所有環(huán)節(jié)均在 AWS 中托管。Kibana 這個開源的數(shù)據(jù)分析和可視化工具會將實時數(shù)據(jù)提供給經(jīng)授權(quán)的 Thomson Reuters 產(chǎn)品團隊。
另外,Thomson Reuters Services 平臺使用 AWS Identity and Access Management (IAM) 和 Amazon S3 跨賬戶訪問功能提供身份驗證和授權(quán)層。為監(jiān)控解決方案,該公司使用了 Amazon CloudWatch。
效益
Product Insight 早于計劃時間兩個月發(fā)布,超出了技術(shù)性預(yù)期。“我們最初的目標(biāo)是每秒處理 2000 個事件?!盩homson Reuters 產(chǎn)品創(chuàng)新高級經(jīng)理 Anders Fritz 說道,“我們的測試顯示 AWS 上的 Product Insight 可以每秒處理多達 4000 個事件,并且預(yù)期可以在一年內(nèi)提升到每秒處理 10000 多個事件?!?這意味著每個月可以處理超過 250 億次事件。
即便是這么高的吞吐量,系統(tǒng)從始至終都沒有丟失任何數(shù)據(jù)。“因為強大的故障轉(zhuǎn)移架構(gòu)和 AWS 的技術(shù)能力,我們從開始收集數(shù)據(jù)起就沒有丟失過一次事件?!盕ritz 說。
這期間還發(fā)生了美國總統(tǒng)大選和英國脫歐之類的新聞事件,遭遇過使用量暴增?!凹词姑咳帐录?shù)量雙倍增加,攝取管道也能平穩(wěn)擴展和收縮,沒有絲毫問題。”Thomson Reuters 首席軟件工程師 Marco Pierleoni 說道。
內(nèi)部產(chǎn)品團隊很快采納了 Product Insight,并快速且輕松地將它們加入系統(tǒng)中?!拔覀兛梢钥焖俳F隊,時間從幾小時到幾天不等。”Fritz 說道,“大多數(shù)時間都用來計劃團隊想要分析的數(shù)據(jù)。在后端,我們可以設(shè)置系統(tǒng),在幾分鐘內(nèi)接收產(chǎn)品收據(jù)?!?上手過程在 SDK 和標(biāo)準(zhǔn)化數(shù)據(jù)架構(gòu)的作用下獲得了加速。
由于 Product Insight 是使用 Amazon Kinesis 在流式數(shù)據(jù)架構(gòu)上創(chuàng)建,因此產(chǎn)品團隊幾乎可以實時訪問數(shù)據(jù)?!笆褂?Amazon Kinesis,我們的解決方案可以在 10 秒內(nèi)將新事件傳遞到用戶控制面板?!盕ritz 說道,“我們的產(chǎn)品團隊可以即時了解并響應(yīng)使用模式,而我們的運營專業(yè)人員可以監(jiān)控表現(xiàn)以便及時檢測并緩解異常情況,以免影響客戶體驗?!?/p>
因為 Product Insight 要求最小化行政參與,所以工程師可以集中精力與產(chǎn)品團隊合作增加業(yè)務(wù)價值,而不是花時間管理基礎(chǔ)設(shè)施。而且,AWS Key Management Service 實現(xiàn)的安全性可以幫助確保解決方案滿足內(nèi)外合規(guī)性要求。
標(biāo)題名稱:ThomsonReuters:以經(jīng)濟高效的方式加載和處理流式數(shù)據(jù)
本文網(wǎng)址:http://www.dlmjj.cn/article/dpeppdg.html


咨詢
建站咨詢
