日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時(shí)間:8:30-17:00
你可能遇到了下面的問(wèn)題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營(yíng)銷解決方案
java情感分析代碼 java代碼分析

大數(shù)據(jù)分析工具詳盡介紹&數(shù)據(jù)分析算法

大數(shù)據(jù)分析工具詳盡介紹數(shù)據(jù)分析算法

成都創(chuàng)新互聯(lián)專注于中大型企業(yè)的成都網(wǎng)站制作、網(wǎng)站建設(shè)和網(wǎng)站改版、網(wǎng)站營(yíng)銷服務(wù),追求商業(yè)策劃與數(shù)據(jù)分析、創(chuàng)意藝術(shù)與技術(shù)開(kāi)發(fā)的融合,累計(jì)客戶上千余家,服務(wù)滿意度達(dá)97%。幫助廣大客戶順利對(duì)接上互聯(lián)網(wǎng)浪潮,準(zhǔn)確優(yōu)選出符合自己需要的互聯(lián)網(wǎng)運(yùn)用,我們將一直專注成都品牌網(wǎng)站建設(shè)和互聯(lián)網(wǎng)程序開(kāi)發(fā),在前進(jìn)的路上,與客戶一起成長(zhǎng)!

1、 Hadoop

Hadoop 是一個(gè)能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布式處理的軟件框架。但是 Hadoop 是以一種可靠、高效、可伸縮的方式進(jìn)行處理的。Hadoop 是可靠的,因?yàn)樗僭O(shè)計(jì)算元素和存儲(chǔ)會(huì)失敗,因此它維護(hù)多個(gè)工作數(shù)據(jù)副本,確保能夠針對(duì)失敗的節(jié)點(diǎn)重新分布處理。Hadoop 是高效的,因?yàn)樗圆⑿械姆绞焦ぷ?,通過(guò)并行處理加快處理速度。Hadoop 還是可伸縮的,能夠處理 PB 級(jí)數(shù)據(jù)。此外,Hadoop 依賴于社區(qū)服務(wù)器,因此它的成本比較低,任何人都可以使用。

Hadoop是一個(gè)能夠讓用戶輕松架構(gòu)和使用的分布式計(jì)算平臺(tái)。用戶可以輕松地在Hadoop上開(kāi)發(fā)和運(yùn)行處理海量數(shù)據(jù)的應(yīng)用程序。它主要有以下幾個(gè)優(yōu)點(diǎn):

⒈高可靠性。Hadoop按位存儲(chǔ)和處理數(shù)據(jù)的能力值得人們信賴。

⒉高擴(kuò)展性。Hadoop是在可用的計(jì)算機(jī)集簇間分配數(shù)據(jù)并完成計(jì)算任務(wù)的,這些集簇可以方便地?cái)U(kuò)展到數(shù)以千計(jì)的節(jié)點(diǎn)中。

⒊高效性。Hadoop能夠在節(jié)點(diǎn)之間動(dòng)態(tài)地移動(dòng)數(shù)據(jù),并保證各個(gè)節(jié)點(diǎn)的動(dòng)態(tài)平衡,因此處理速度非常快。

⒋高容錯(cuò)性。Hadoop能夠自動(dòng)保存數(shù)據(jù)的多個(gè)副本,并且能夠自動(dòng)將失敗的任務(wù)重新分配。

Hadoop帶有用 Java 語(yǔ)言編寫(xiě)的框架,因此運(yùn)行在 Linux 生產(chǎn)平臺(tái)上是非常理想的。Hadoop 上的應(yīng)用程序也可以使用其他語(yǔ)言編寫(xiě),比如 C++。

2、 HPCC

HPCC,High Performance Computing and Communications(高性能計(jì)算與通信)的縮寫(xiě)。1993年,由美國(guó)科學(xué)、工程、技術(shù)聯(lián)邦協(xié)調(diào)理事會(huì)向國(guó)會(huì)提交了“重大挑戰(zhàn)項(xiàng)目:高性能計(jì)算與 通信”的報(bào)告,也就是被稱為HPCC計(jì)劃的報(bào)告,即美國(guó)總統(tǒng)科學(xué)戰(zhàn)略項(xiàng)目,其目的是通過(guò)加強(qiáng)研究與開(kāi)發(fā)解決一批重要的科學(xué)與技術(shù)挑戰(zhàn)問(wèn)題。HPCC是美國(guó) 實(shí)施信息高速公路而上實(shí)施的計(jì)劃,該計(jì)劃的實(shí)施將耗資百億美元,其主要目標(biāo)要達(dá)到:開(kāi)發(fā)可擴(kuò)展的計(jì)算系統(tǒng)及相關(guān)軟件,以支持太位級(jí)網(wǎng)絡(luò)傳輸性能,開(kāi)發(fā)千兆 比特網(wǎng)絡(luò)技術(shù),擴(kuò)展研究和教育機(jī)構(gòu)及網(wǎng)絡(luò)連接能力。

該項(xiàng)目主要由五部分組成:

1、高性能計(jì)算機(jī)系統(tǒng)(HPCS),內(nèi)容包括今后幾代計(jì)算機(jī)系統(tǒng)的研究、系統(tǒng)設(shè)計(jì)工具、先進(jìn)的典型系統(tǒng)及原有系統(tǒng)的評(píng)價(jià)等;

2、先進(jìn)軟件技術(shù)與算法(ASTA),內(nèi)容有巨大挑戰(zhàn)問(wèn)題的軟件支撐、新算法設(shè)計(jì)、軟件分支與工具、計(jì)算計(jì)算及高性能計(jì)算研究中心等;

3、國(guó)家科研與教育網(wǎng)格(NREN),內(nèi)容有中接站及10億位級(jí)傳輸?shù)难芯颗c開(kāi)發(fā);

4、基本研究與人類資源(BRHR),內(nèi)容有基礎(chǔ)研究、培訓(xùn)、教育及課程教材,被設(shè)計(jì)通過(guò)獎(jiǎng)勵(lì)調(diào)查者-開(kāi)始的,長(zhǎng)期 的調(diào)查在可升級(jí)的高性能計(jì)算中來(lái)增加創(chuàng)新意識(shí)流,通過(guò)提高教育和高性能的計(jì)算訓(xùn)練和通信來(lái)加大熟練的和訓(xùn)練有素的人員的聯(lián)營(yíng),和來(lái)提供必需的基礎(chǔ)架構(gòu)來(lái)支 持這些調(diào)查和研究活動(dòng);

5、信息基礎(chǔ)結(jié)構(gòu)技術(shù)和應(yīng)用(IITA ),目的在于保證美國(guó)在先進(jìn)信息技術(shù)開(kāi)發(fā)方面的領(lǐng)先地位。

3、 Storm

Storm是自由的開(kāi)源軟件,一個(gè)分布式的、容錯(cuò)的實(shí)時(shí)計(jì)算系統(tǒng)。Storm可以非??煽康奶幚睚嫶蟮臄?shù)據(jù)流,用于處理Hadoop的批量數(shù)據(jù)。Storm很簡(jiǎn)單,支持許多種編程語(yǔ)言,使用起來(lái)非常有趣。Storm由Twitter開(kāi)源而來(lái),其它知名的應(yīng)用企業(yè)包括Groupon、淘寶、支付寶、阿里巴巴、樂(lè)元素、Admaster等等。

Storm有許多應(yīng)用領(lǐng)域:實(shí)時(shí)分析、在線機(jī)器學(xué)習(xí)、不停頓的計(jì)算、分布式RPC(遠(yuǎn)過(guò)程調(diào)用協(xié)議,一種通過(guò)網(wǎng)絡(luò)從遠(yuǎn)程計(jì)算機(jī)程序上請(qǐng)求服務(wù))、 ETL(Extraction-Transformation-Loading的縮寫(xiě),即數(shù)據(jù)抽取、轉(zhuǎn)換和加載)等等。Storm的處理速度驚人:經(jīng)測(cè) 試,每個(gè)節(jié)點(diǎn)每秒鐘可以處理100萬(wàn)個(gè)數(shù)據(jù)元組。Storm是可擴(kuò)展、容錯(cuò),很容易設(shè)置和操作。

4、 Apache Drill

為了幫助企業(yè)用戶尋找更為有效、加快Hadoop數(shù)據(jù)查詢的方法,Apache軟件基金會(huì)近日發(fā)起了一項(xiàng)名為“Drill”的開(kāi)源項(xiàng)目。Apache Drill 實(shí)現(xiàn)了 Google’s Dremel.

據(jù)Hadoop廠商MapR Technologies公司產(chǎn)品經(jīng)理Tomer Shiran介紹,“Drill”已經(jīng)作為Apache孵化器項(xiàng)目來(lái)運(yùn)作,將面向全球軟件工程師持續(xù)推廣。

該項(xiàng)目將會(huì)創(chuàng)建出開(kāi)源版本的谷歌Dremel Hadoop工具(谷歌使用該工具來(lái)為Hadoop數(shù)據(jù)分析工具的互聯(lián)網(wǎng)應(yīng)用提速)。而“Drill”將有助于Hadoop用戶實(shí)現(xiàn)更快查詢海量數(shù)據(jù)集的目的。

“Drill”項(xiàng)目其實(shí)也是從谷歌的Dremel項(xiàng)目中獲得靈感:該項(xiàng)目幫助谷歌實(shí)現(xiàn)海量數(shù)據(jù)集的分析處理,包括分析抓取Web文檔、跟蹤安裝在Android Market上的應(yīng)用程序數(shù)據(jù)、分析垃圾郵件、分析谷歌分布式構(gòu)建系統(tǒng)上的測(cè)試結(jié)果等等。

通過(guò)開(kāi)發(fā)“Drill”Apache開(kāi)源項(xiàng)目,組織機(jī)構(gòu)將有望建立Drill所屬的API接口和靈活強(qiáng)大的體系架構(gòu),從而幫助支持廣泛的數(shù)據(jù)源、數(shù)據(jù)格式和查詢語(yǔ)言。

5、 RapidMiner

RapidMiner是世界領(lǐng)先的數(shù)據(jù)挖掘解決方案,在一個(gè)非常大的程度上有著先進(jìn)技術(shù)。它數(shù)據(jù)挖掘任務(wù)涉及范圍廣泛,包括各種數(shù)據(jù)藝術(shù),能簡(jiǎn)化數(shù)據(jù)挖掘過(guò)程的設(shè)計(jì)和評(píng)價(jià)。

功能和特點(diǎn)

免費(fèi)提供數(shù)據(jù)挖掘技術(shù)和庫(kù)

100%用Java代碼(可運(yùn)行在操作系統(tǒng))

數(shù)據(jù)挖掘過(guò)程簡(jiǎn)單,強(qiáng)大和直觀

內(nèi)部XML保證了標(biāo)準(zhǔn)化的格式來(lái)表示交換數(shù)據(jù)挖掘過(guò)程

可以用簡(jiǎn)單腳本語(yǔ)言自動(dòng)進(jìn)行大規(guī)模進(jìn)程

多層次的數(shù)據(jù)視圖,確保有效和透明的數(shù)據(jù)

圖形用戶界面的互動(dòng)原型

命令行(批處理模式)自動(dòng)大規(guī)模應(yīng)用

Java API(應(yīng)用編程接口)

簡(jiǎn)單的插件和推廣機(jī)制

強(qiáng)大的可視化引擎,許多尖端的高維數(shù)據(jù)的可視化建模

400多個(gè)數(shù)據(jù)挖掘運(yùn)營(yíng)商支持

耶魯大學(xué)已成功地應(yīng)用在許多不同的應(yīng)用領(lǐng)域,包括文本挖掘,多媒體挖掘,功能設(shè)計(jì),數(shù)據(jù)流挖掘,集成開(kāi)發(fā)的方法和分布式數(shù)據(jù)挖掘。

6、 Pentaho BI

Pentaho BI 平臺(tái)不同于傳統(tǒng)的BI 產(chǎn)品,它是一個(gè)以流程為中心的,面向解決方案(Solution)的框架。其目的在于將一系列企業(yè)級(jí)BI產(chǎn)品、開(kāi)源軟件、API等等組件集成起來(lái),方便商務(wù)智能應(yīng)用的開(kāi)發(fā)。它的出現(xiàn),使得一系列的面向商務(wù)智能的獨(dú)立產(chǎn)品如Jfree、Quartz等等,能夠集成在一起,構(gòu)成一項(xiàng)項(xiàng)復(fù)雜的、完整的商務(wù)智能解決方案。

Pentaho BI 平臺(tái),Pentaho Open BI 套件的核心架構(gòu)和基礎(chǔ),是以流程為中心的,因?yàn)槠渲袠锌刂破魇且粋€(gè)工作流引擎。工作流引擎使用流程定義來(lái)定義在BI 平臺(tái)上執(zhí)行的商業(yè)智能流程。流程可以很容易的被定制,也可以添加新的流程。BI 平臺(tái)包含組件和報(bào)表,用以分析這些流程的性能。目前,Pentaho的主要組成元素包括報(bào)表生成、分析、數(shù)據(jù)挖掘和工作流管理等等。這些組件通過(guò) J2EE、WebService、SOAP、HTTP、Java、JavaScript、Portals等技術(shù)集成到Pentaho平臺(tái)中來(lái)。 Pentaho的發(fā)行,主要以Pentaho SDK的形式進(jìn)行。

Pentaho SDK共包含五個(gè)部分:Pentaho平臺(tái)、Pentaho示例數(shù)據(jù)庫(kù)、可獨(dú)立運(yùn)行的Pentaho平臺(tái)、Pentaho解決方案示例和一個(gè)預(yù)先配制好的 Pentaho網(wǎng)絡(luò)服務(wù)器。其中Pentaho平臺(tái)是Pentaho平臺(tái)最主要的部分,囊括了Pentaho平臺(tái)源代碼的主體;Pentaho數(shù)據(jù)庫(kù)為 Pentaho平臺(tái)的正常運(yùn)行提供的數(shù)據(jù)服務(wù),包括配置信息、Solution相關(guān)的信息等等,對(duì)于Pentaho平臺(tái)來(lái)說(shuō)它不是必須的,通過(guò)配置是可以用其它數(shù)據(jù)庫(kù)服務(wù)取代的;可獨(dú)立運(yùn)行的Pentaho平臺(tái)是Pentaho平臺(tái)的獨(dú)立運(yùn)行模式的示例,它演示了如何使Pentaho平臺(tái)在沒(méi)有應(yīng)用服務(wù)器支持的情況下獨(dú)立運(yùn)行;

Pentaho解決方案示例是一個(gè)Eclipse工程,用來(lái)演示如何為Pentaho平臺(tái)開(kāi)發(fā)相關(guān)的商業(yè)智能解決方案。

Pentaho BI 平臺(tái)構(gòu)建于服務(wù)器,引擎和組件的基礎(chǔ)之上。這些提供了系統(tǒng)的J2EE 服務(wù)器,安全,portal,工作流,規(guī)則引擎,圖表,協(xié)作,內(nèi)容管理,數(shù)據(jù)集成,分析和建模功能。這些組件的大部分是基于標(biāo)準(zhǔn)的,可使用其他產(chǎn)品替換之。

7、 SAS Enterprise Miner

§ 支持整個(gè)數(shù)據(jù)挖掘過(guò)程的完備工具集

§ 易用的圖形界面,適合不同類型的用戶快速建模

§ 強(qiáng)大的模型管理和評(píng)估功能

§ 快速便捷的模型發(fā)布機(jī)制, 促進(jìn)業(yè)務(wù)閉環(huán)形成

數(shù)據(jù)分析算法

大數(shù)據(jù)分析主要依靠機(jī)器學(xué)習(xí)和大規(guī)模計(jì)算。機(jī)器學(xué)習(xí)包括監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等,而監(jiān)督學(xué)習(xí)又包括分類學(xué)習(xí)、回歸學(xué)習(xí)、排序?qū)W習(xí)、匹配學(xué)習(xí)等(見(jiàn)圖1)。分類是最常見(jiàn)的機(jī)器學(xué)習(xí)應(yīng)用問(wèn)題,比如垃圾郵件過(guò)濾、人臉檢測(cè)、用戶畫(huà)像、文本情感分析、網(wǎng)頁(yè)歸類等,本質(zhì)上都是分類問(wèn)題。分類學(xué)習(xí)也是機(jī)器學(xué)習(xí)領(lǐng)域,研究最徹底、使用最廣泛的一個(gè)分支。

最近、Fernández-Delgado等人在JMLR(Journal of Machine Learning Research,機(jī)器學(xué)習(xí)頂級(jí)期刊)雜志發(fā)表了一篇有趣的論文。他們讓179種不同的分類學(xué)習(xí)方法(分類學(xué)習(xí)算法)在UCI 121個(gè)數(shù)據(jù)集上進(jìn)行了“大比武”(UCI是機(jī)器學(xué)習(xí)公用數(shù)據(jù)集,每個(gè)數(shù)據(jù)集的規(guī)模都不大)。結(jié)果發(fā)現(xiàn)Random Forest(隨機(jī)森林)和SVM(支持向量機(jī))名列第一、第二名,但兩者差異不大。在84.3%的數(shù)據(jù)上、Random Forest壓倒了其它90%的方法。也就是說(shuō),在大多數(shù)情況下,只用Random Forest 或 SVM事情就搞定了。

KNN

K最近鄰算法。給定一些已經(jīng)訓(xùn)練好的數(shù)據(jù),輸入一個(gè)新的測(cè)試數(shù)據(jù)點(diǎn),計(jì)算包含于此測(cè)試數(shù)據(jù)點(diǎn)的最近的點(diǎn)的分類情況,哪個(gè)分類的類型占多數(shù),則此測(cè)試點(diǎn)的分類與此相同,所以在這里,有的時(shí)候可以復(fù)制不同的分類點(diǎn)不同的權(quán)重。近的點(diǎn)的權(quán)重大點(diǎn),遠(yuǎn)的點(diǎn)自然就小點(diǎn)。詳細(xì)介紹鏈接

Naive Bayes

樸素貝葉斯算法。樸素貝葉斯算法是貝葉斯算法里面一種比較簡(jiǎn)單的分類算法,用到了一個(gè)比較重要的貝葉斯定理,用一句簡(jiǎn)單的話概括就是條件概率的相互轉(zhuǎn)換推導(dǎo)。詳細(xì)介紹鏈接

樸素貝葉斯分類是一種十分簡(jiǎn)單的分類算法,叫它樸素貝葉斯分類是因?yàn)檫@種方法的思想真的很樸素,樸素貝葉斯的思想基礎(chǔ)是這樣的:對(duì)于給出的待分類項(xiàng),求解在此項(xiàng)出現(xiàn)的條件下各個(gè)類別出現(xiàn)的概率,哪個(gè)最大,就認(rèn)為此待分類項(xiàng)屬于哪個(gè)類別。通俗來(lái)說(shuō),就好比這么個(gè)道理,你在街上看到一個(gè)黑人,我問(wèn)你你猜這哥們哪里來(lái)的,你十有八九猜非洲。為什么呢?因?yàn)楹谌酥蟹侵奕说谋嚷首罡撸?dāng)然人家也可能是美洲人或亞洲人,但在沒(méi)有其它可用信息下,我們會(huì)選擇條件概率最大的類別,這就是樸素貝葉斯的思想基礎(chǔ)。

SVM

支持向量機(jī)算法。支持向量機(jī)算法是一種對(duì)線性和非線性數(shù)據(jù)進(jìn)行分類的方法,非線性數(shù)據(jù)進(jìn)行分類的時(shí)候可以通過(guò)核函數(shù)轉(zhuǎn)為線性的情況再處理。其中的一個(gè)關(guān)鍵的步驟是搜索最大邊緣超平面。詳細(xì)介紹鏈接

Apriori

Apriori算法是關(guān)聯(lián)規(guī)則挖掘算法,通過(guò)連接和剪枝運(yùn)算挖掘出頻繁項(xiàng)集,然后根據(jù)頻繁項(xiàng)集得到關(guān)聯(lián)規(guī)則,關(guān)聯(lián)規(guī)則的導(dǎo)出需要滿足最小置信度的要求。詳細(xì)介紹鏈接

PageRank

網(wǎng)頁(yè)重要性/排名算法。PageRank算法最早產(chǎn)生于Google,核心思想是通過(guò)網(wǎng)頁(yè)的入鏈數(shù)作為一個(gè)網(wǎng)頁(yè)好快的判定標(biāo)準(zhǔn),如果1個(gè)網(wǎng)頁(yè)內(nèi)部包含了多個(gè)指向外部的鏈接,則PR值將會(huì)被均分,PageRank算法也會(huì)遭到LinkSpan攻擊。詳細(xì)介紹鏈接

RandomForest

隨機(jī)森林算法。算法思想是決策樹(shù)+boosting.決策樹(shù)采用的是CART分類回歸數(shù),通過(guò)組合各個(gè)決策樹(shù)的弱分類器,構(gòu)成一個(gè)最終的強(qiáng)分類器,在構(gòu)造決策樹(shù)的時(shí)候采取隨機(jī)數(shù)量的樣本數(shù)和隨機(jī)的部分屬性進(jìn)行子決策樹(shù)的構(gòu)建,避免了過(guò)分?jǐn)M合的現(xiàn)象發(fā)生。詳細(xì)介紹鏈接

Artificial Neural Network

“神經(jīng)網(wǎng)絡(luò)”這個(gè)詞實(shí)際是來(lái)自于生物學(xué),而我們所指的神經(jīng)網(wǎng)絡(luò)正確的名稱應(yīng)該是“人工神經(jīng)網(wǎng)絡(luò)(ANNs)”。

人工神經(jīng)網(wǎng)絡(luò)也具有初步的自適應(yīng)與自組織能力。在學(xué)習(xí)或訓(xùn)練過(guò)程中改變突觸權(quán)重值,以適應(yīng)周圍環(huán)境的要求。同一網(wǎng)絡(luò)因?qū)W習(xí)方式及內(nèi)容不同可具有不同的功能。人工神經(jīng)網(wǎng)絡(luò)是一個(gè)具有學(xué)習(xí)能力的系統(tǒng),可以發(fā)展知識(shí),以致超過(guò)設(shè)計(jì)者原有的知識(shí)水平。通常,它的學(xué)習(xí)訓(xùn)練方式可分為兩種,一種是有監(jiān)督或稱有導(dǎo)師的學(xué)習(xí),這時(shí)利用給定的樣本標(biāo)準(zhǔn)進(jìn)行分類或模仿;另一種是無(wú)監(jiān)督學(xué)習(xí)或稱無(wú)為導(dǎo)師學(xué)習(xí),這時(shí),只規(guī)定學(xué)習(xí)方式或某些規(guī)則,則具體的學(xué)習(xí)內(nèi)容隨系統(tǒng)所處環(huán)境 (即輸入信號(hào)情況)而異,系統(tǒng)可以自動(dòng)發(fā)現(xiàn)環(huán)境特征和規(guī)律性,具有更近似人腦的功能。

目前常用的自然語(yǔ)言處理開(kāi)源項(xiàng)目/開(kāi)發(fā)包有哪些?

中文主要有:NLTK,HanLP,Ansj,THULAC,結(jié)巴分詞,F(xiàn)NLP,哈工大LTP,中科院ICTCLAS分詞,GATE,SnowNLP,東北大學(xué)NiuTrans,NLPIR;英文主要有:NLTK,Genism,TextBlob,Stanford NLP,Spacy。英文的開(kāi)源NLP工具主要參見(jiàn)StackoverFlow-java or python for nlp。HanLP:HanLP是由一系列模型與算法組成的Java工具包,目標(biāo)是普及自然語(yǔ)言處理在生產(chǎn)環(huán)境中的應(yīng)用。HanLP具備功能完善、性能高效、架構(gòu)清晰、語(yǔ)料時(shí)新、可自定義的特點(diǎn)。開(kāi)發(fā)語(yǔ)言:Java,網(wǎng)址:hankcs/HanLP,開(kāi)發(fā)機(jī)構(gòu):大快公司,協(xié)議:Apache-2.0功能:非常多,主要有中文分詞,詞性標(biāo)注,命名實(shí)體識(shí)別,關(guān)鍵詞提取,自動(dòng)摘要,短語(yǔ)提取,拼音轉(zhuǎn)換,簡(jiǎn)繁轉(zhuǎn)換,文本推薦,依存句法分析,文本分類:情感分析,word2vec,語(yǔ)料庫(kù)工具。

GitHub上面有哪些經(jīng)典的java框架源碼

Bazel:來(lái)自Google的構(gòu)建工具,可以快速、可靠地構(gòu)建代碼。官網(wǎng)

Gradle:使用Groovy(非XML)進(jìn)行增量構(gòu)建,可以很好地與Maven依賴管理配合工作。官網(wǎng)

Buck:Facebook構(gòu)建工具。官網(wǎng)

字節(jié)碼操作

編程方式操作字節(jié)碼的開(kāi)發(fā)庫(kù)。

ASM:通用底層字節(jié)碼操作和分析開(kāi)發(fā)庫(kù)。官網(wǎng)

Byte Buddy:使用流式API進(jìn)一步簡(jiǎn)化字節(jié)碼生成。官網(wǎng)

Byteman:在運(yùn)行時(shí)通過(guò)DSL(規(guī)則)操作字節(jié)碼進(jìn)行測(cè)試和故障排除。官網(wǎng)

Javassist:一個(gè)簡(jiǎn)化字節(jié)碼編輯嘗試。官網(wǎng)

集群管理

在集群內(nèi)動(dòng)態(tài)管理應(yīng)用程序的框架。

Apache Aurora:Apache Aurora是一個(gè)Mesos框架,用于長(zhǎng)時(shí)間運(yùn)行服務(wù)和定時(shí)任務(wù)(cron job)。官網(wǎng)

Singularity:Singularity是一個(gè)Mesos框架,方便部署和操作。它支持Web Service、后臺(tái)運(yùn)行、調(diào)度作業(yè)和一次性任務(wù)。官網(wǎng)

代碼分析

測(cè)量代碼指標(biāo)和質(zhì)量工具。

Checkstyle:代碼編寫(xiě)規(guī)范和標(biāo)準(zhǔn)靜態(tài)分析工具。官網(wǎng)

Error Prone:將常見(jiàn)編程錯(cuò)誤作為運(yùn)行時(shí)錯(cuò)誤報(bào)告。官網(wǎng)

FindBugs:通過(guò)字節(jié)碼靜態(tài)分析查找隱藏bug。官網(wǎng)

jQAssistant:使用基于Neo4J查詢語(yǔ)言進(jìn)行代碼靜態(tài)分析。官網(wǎng)

PMD:對(duì)源代碼分析查找不良的編程習(xí)慣。官網(wǎng)

SonarQube:通過(guò)插件集成其它分析組件,對(duì)過(guò)去一段時(shí)間內(nèi)的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)。官網(wǎng)

編譯器生成工具

用來(lái)創(chuàng)建解析器、解釋器或編譯器的框架。

ANTLR:復(fù)雜的全功能自頂向下解析框架。官網(wǎng)

JavaCC:JavaCC是更加專門的輕量級(jí)工具,易于上手且支持語(yǔ)法超前預(yù)測(cè)。官網(wǎng)

外部配置工具

支持外部配置的開(kāi)發(fā)庫(kù)。

config:針對(duì)JVM語(yǔ)言的配置庫(kù)。官網(wǎng)

owner:減少冗余配置屬性。官網(wǎng)

約束滿足問(wèn)題求解程序

幫助解決約束滿足問(wèn)題的開(kāi)發(fā)庫(kù)。

Choco:可直接使用的約束滿足問(wèn)題求解程序,使用了約束規(guī)劃技術(shù)。官網(wǎng)

JaCoP:為FlatZinc語(yǔ)言提供了一個(gè)接口,可以執(zhí)行MiniZinc模型。官網(wǎng)

OptaPlanner:企業(yè)規(guī)劃與資源調(diào)度優(yōu)化求解程序。官網(wǎng)

Sat4J:邏輯代數(shù)與優(yōu)化問(wèn)題最先進(jìn)的求解程序。官網(wǎng)

持續(xù)集成

Bamboo:Atlassian解決方案,可以很好地集成Atlassian的其他產(chǎn)品??梢赃x擇開(kāi)源許可,也可以購(gòu)買商業(yè)版。官網(wǎng)

CircleCI:提供托管服務(wù),可以免費(fèi)試用。官網(wǎng)

Codeship:提供托管服務(wù),提供有限的免費(fèi)模式。官網(wǎng)

fabric8:容器集成平臺(tái)。官網(wǎng)

Go:ThoughtWork開(kāi)源解決方案。官網(wǎng)

Jenkins:支持基于服務(wù)器的部署服務(wù)。官網(wǎng)

TeamCity:JetBrain的持續(xù)集成解決方案,有免費(fèi)版。官網(wǎng)

Travis:通常用作開(kāi)源項(xiàng)目的托管服務(wù)。官網(wǎng)

Buildkite: 持續(xù)集成工具,用簡(jiǎn)單的腳本就能設(shè)置pipeline,而且能快速構(gòu)建,可以免費(fèi)試用。官網(wǎng)

CSV解析

簡(jiǎn)化CSV數(shù)據(jù)讀寫(xiě)的框架與開(kāi)發(fā)庫(kù)

uniVocity-parsers:速度最快功能最全的CSV開(kāi)發(fā)庫(kù)之一,同時(shí)支持TSV與固定寬度記錄的讀寫(xiě)。官網(wǎng)

數(shù)據(jù)庫(kù)

簡(jiǎn)化數(shù)據(jù)庫(kù)交互的相關(guān)工具。

Apache Phoenix:HBase針對(duì)低延時(shí)應(yīng)用程序的高性能關(guān)系數(shù)據(jù)庫(kù)層。官網(wǎng)

Crate:實(shí)現(xiàn)了數(shù)據(jù)同步、分片、縮放、復(fù)制的分布式數(shù)據(jù)存儲(chǔ)。除此之外還可以使用基于SQL的語(yǔ)法跨集群查詢。官網(wǎng)

Flyway:簡(jiǎn)單的數(shù)據(jù)庫(kù)遷移工具。官網(wǎng)

H2:小型SQL數(shù)據(jù)庫(kù),以可以作為內(nèi)存數(shù)據(jù)庫(kù)使用著稱。官網(wǎng)

HikariCP:高性能JDBC連接工具。官網(wǎng)

JDBI:便捷的JDBC抽象。官網(wǎng)

Protobuf:Google數(shù)據(jù)交換格式。官網(wǎng)

SBE:簡(jiǎn)單二進(jìn)制編碼,是最快速的消息格式之一。官網(wǎng)

Wire:整潔輕量級(jí)協(xié)議緩存。官網(wǎng)

幫實(shí)現(xiàn)依賴翻轉(zhuǎn)范式的開(kāi)發(fā)庫(kù)。?官網(wǎng)

Apache DeltaSpike:CDI擴(kuò)展框架。官網(wǎng)

Dagger2:編譯時(shí)注入框架,不需要使用反射。官網(wǎng)

Guice:可以匹敵Dagger的輕量級(jí)注入框架。官網(wǎng)

HK2:輕量級(jí)動(dòng)態(tài)依賴注入框架。官網(wǎng)

開(kāi)發(fā)流程增強(qiáng)工具

從最基本的層面增強(qiáng)開(kāi)發(fā)流程。

ADT4J:針對(duì)代數(shù)數(shù)據(jù)類型的JSR-269代碼生成器。官網(wǎng)

AspectJ:面向切面編程(AOP)的無(wú)縫擴(kuò)展。官網(wǎng)

Auto:源代碼生成器集合。官網(wǎng)

DCEVM:通過(guò)修改JVM在運(yùn)行時(shí)支持對(duì)已加載的類進(jìn)行無(wú)限次重定義。官網(wǎng)

HotswapAgent:支持無(wú)限次重定義運(yùn)行時(shí)類與資源。官網(wǎng)

Immutables:類似Scala的條件類。官網(wǎng)

JHipster:基于Spring Boot與AngularJS應(yīng)用程序的Yeoman源代碼生成器。官網(wǎng)

JRebel:無(wú)需重新部署,可以即時(shí)重新加載代碼與配置的商業(yè)軟件。官網(wǎng)

Lombok:減少冗余的代碼生成器。官網(wǎng)

Spring Loaded:類重載代理。官網(wǎng)

vert.x:多語(yǔ)言事件驅(qū)動(dòng)應(yīng)用框架。官網(wǎng)

分布式應(yīng)用

用來(lái)編寫(xiě)分布式容錯(cuò)應(yīng)用的開(kāi)發(fā)庫(kù)和框架。

Akka:用來(lái)編寫(xiě)分布式容錯(cuò)并發(fā)事件驅(qū)動(dòng)應(yīng)用程序的工具和運(yùn)行時(shí)。官網(wǎng)

Apache Storm:實(shí)時(shí)計(jì)算系統(tǒng)。官網(wǎng)

Apache ZooKeeper:針對(duì)大型分布式系統(tǒng)的協(xié)調(diào)服務(wù),支持分布式配置、同步和名稱注冊(cè)。官網(wǎng)

Hazelcast:高可擴(kuò)展內(nèi)存數(shù)據(jù)網(wǎng)格。官網(wǎng)

Hystrix:提供延遲和容錯(cuò)。官網(wǎng)

JGroups:提供可靠的消息傳遞和集群創(chuàng)建的工具。官網(wǎng)

Orbit:支持虛擬角色(Actor),在傳統(tǒng)角色的基礎(chǔ)上增加了另外一層抽象。官網(wǎng)

Quasar:為JVM提供輕量級(jí)線程和角色。官網(wǎng)

分布式數(shù)據(jù)庫(kù)

對(duì)應(yīng)用程序而言,在分布式系統(tǒng)中的數(shù)據(jù)庫(kù)看起來(lái)就像是只有一個(gè)數(shù)據(jù)源。

Apache Cassandra:列式數(shù)據(jù)庫(kù),可用性高且沒(méi)有單點(diǎn)故障。官網(wǎng)

Apache HBase:針對(duì)大數(shù)據(jù)的Hadoop數(shù)據(jù)庫(kù)。官網(wǎng)

Druid:實(shí)時(shí)和歷史OLAP數(shù)據(jù)存儲(chǔ),在聚集查詢和近似查詢方面表現(xiàn)不俗。官網(wǎng)

Infinispan:針對(duì)緩存的高并發(fā)鍵值對(duì)數(shù)據(jù)存儲(chǔ)。官網(wǎng)

發(fā)布

以本機(jī)格式發(fā)布應(yīng)用程序的工具。

Bintray:發(fā)布二進(jìn)制文件版本控制工具。可以于Maven或Gradle一起配合使用。提供開(kāi)源免費(fèi)版本和幾種商業(yè)收費(fèi)版本。官網(wǎng)

Central Repository:最大的二進(jìn)制組件倉(cāng)庫(kù),面向開(kāi)源社區(qū)提供免費(fèi)服務(wù)。Apache Maven默認(rèn)使用Central?官網(wǎng)Repository,也可以在所有其他構(gòu)建工具中使用。

IzPack:為跨平臺(tái)部署建立創(chuàng)作工具(Authoring Tool)。官網(wǎng)

JitPack:打包GitHub倉(cāng)庫(kù)的便捷工具。可根據(jù)需要構(gòu)建Maven、Gradle項(xiàng)目,發(fā)布可立即使用的組件。官網(wǎng)

Launch4j:將JAR包裝為輕量級(jí)本機(jī)Windows可執(zhí)行程序。官網(wǎng)

Nexus:支持代理和緩存功能的二進(jìn)制管理工具。官網(wǎng)

packr:將JAR、資源和JVM打包成Windows、Linux和Mac OS X本地發(fā)布文件。官網(wǎng)

文檔處理工具

處理Office文檔的開(kāi)發(fā)庫(kù)。

Apache POI:支持OOXML規(guī)范(XLSX、DOCX、PPTX)以及OLE2規(guī)范(XLS、DOC、PPT)。官網(wǎng)

documents4j:使用第三方轉(zhuǎn)換器進(jìn)行文檔格式轉(zhuǎn)換,轉(zhuǎn)成類似MS Word這樣的格式。官網(wǎng)

jOpenDocument:處理OpenDocument格式(由Sun公司提出基于XML的文檔格式)。官網(wǎng)

函數(shù)式編程

函數(shù)式編程支持庫(kù)。

Cyclops:支持一元(Monad)操作和流操作工具類、comprehension(List語(yǔ)法)、模式匹配、trampoline等特性。官網(wǎng)

Fugue:Guava的函數(shù)式編程擴(kuò)展。官網(wǎng)

Functional Java:實(shí)現(xiàn)了多種基礎(chǔ)和高級(jí)編程抽象,用來(lái)輔助面向組合開(kāi)發(fā)(composition-oriented development)。官網(wǎng)

Javaslang:一個(gè)函數(shù)式組件庫(kù),提供持久化數(shù)據(jù)類型和函數(shù)式控制結(jié)構(gòu)。官網(wǎng)

jOOλ:旨在填補(bǔ)Java 8 lambda差距的擴(kuò)展,提供了眾多缺失的類型和一組豐富的順序流API。官網(wǎng)

游戲開(kāi)發(fā)

游戲開(kāi)發(fā)框架。

jMonkeyEngine:現(xiàn)代3D游戲開(kāi)發(fā)引擎。官網(wǎng)

libGDX:全面的跨平臺(tái)高級(jí)框架。官網(wǎng)

LWJGL:對(duì)OpenGL/CL/AL等技術(shù)進(jìn)行抽象的健壯框架。官網(wǎng)

GUI

現(xiàn)代圖形化用戶界面開(kāi)發(fā)庫(kù)。

JavaFX:Swing的后繼者。官網(wǎng)

Scene Builder:開(kāi)發(fā)JavaFX應(yīng)用的可視化布局工具。官網(wǎng)

高性能計(jì)算

涵蓋了從集合到特定開(kāi)發(fā)庫(kù)的高性能計(jì)算相關(guān)工具。

Agrona:高性能應(yīng)用中常見(jiàn)的數(shù)據(jù)結(jié)構(gòu)和工具方法。官網(wǎng)

Disruptor:線程間消息傳遞開(kāi)發(fā)庫(kù)。官網(wǎng)

fastutil:快速緊湊的特定類型集合(Collection)。官網(wǎng)

GS Collections:受Smalltalk啟發(fā)的集合框架。官網(wǎng)

HPPC:基礎(chǔ)類型集合。官網(wǎng)

Javolution:實(shí)時(shí)和嵌入式系統(tǒng)的開(kāi)發(fā)庫(kù)。官網(wǎng)

JCTools:JDK中缺失的并發(fā)工具。官網(wǎng)

Koloboke:Hash set和hash map。官網(wǎng)

Trove:基礎(chǔ)類型集合。官網(wǎng)

High-scale-bli:Cliff Click 個(gè)人開(kāi)發(fā)的高性能并發(fā)庫(kù)官網(wǎng)

IDE

簡(jiǎn)化開(kāi)發(fā)的集成開(kāi)發(fā)環(huán)境。

Eclipse:老牌開(kāi)源項(xiàng)目,支持多種插件和編程語(yǔ)言。官網(wǎng)

IntelliJ IDEA:支持眾多JVM語(yǔ)言,是安卓開(kāi)發(fā)者好的選擇。商業(yè)版主要針對(duì)企業(yè)客戶。官網(wǎng)

NetBeans:為多種技術(shù)提供集成化支持,包括Java SE、Java EE、數(shù)據(jù)庫(kù)訪問(wèn)、HTML5

Imgscalr:純Java 2D實(shí)現(xiàn),簡(jiǎn)單、高效、支持硬件加速的圖像縮放開(kāi)發(fā)庫(kù)。官網(wǎng)

Picasso:安卓圖片下載和圖片緩存開(kāi)發(fā)庫(kù)。官網(wǎng)

Thumbnailator:Thumbnailator是一個(gè)高質(zhì)量Java縮略圖開(kāi)發(fā)庫(kù)。官網(wǎng)

ZXing:支持多種格式的一維、二維條形碼圖片處理開(kāi)發(fā)庫(kù)。官網(wǎng)

im4java: 基于ImageMagick或GraphicsMagick命令行的圖片處理開(kāi)發(fā)庫(kù),基本上ImageMagick能夠支持的圖片格式和處理方式都能夠處理。官網(wǎng)

Apache Batik:在Java應(yīng)用中程序以SVG格式顯示、生成及處理圖像的工具集,包括SVG解析器、SVG生成器、SVG DOM等模塊,可以集成使用也可以單獨(dú)使用,還可以擴(kuò)展自定義的SVG標(biāo)簽。官網(wǎng)

JSON

簡(jiǎn)化JSON處理的開(kāi)發(fā)庫(kù)。

Genson:強(qiáng)大且易于使用的Java到JSON轉(zhuǎn)換開(kāi)發(fā)庫(kù)。官網(wǎng)

Gson:谷歌官方推出的JSON處理庫(kù),支持在對(duì)象與JSON之間雙向序列化,性能良好且可以實(shí)時(shí)調(diào)用。官網(wǎng)

Jackson:與GSON類似,在頻繁使用時(shí)性能更佳。官網(wǎng)

LoganSquare:基于Jackson流式API,提供對(duì)JSON解析和序列化。比GSON與Jackson組合方式效果更好。官網(wǎng)

Fastjson:一個(gè)Java語(yǔ)言編寫(xiě)的高性能功能完善的JSON庫(kù)。官網(wǎng)

Kyro:快速、高效、自動(dòng)化的Java對(duì)象序列化和克隆庫(kù)。官網(wǎng)

JVM與JDK

目前的JVM和JDK實(shí)現(xiàn)。

JDK 9:JDK 9的早期訪問(wèn)版本。官網(wǎng)

OpenJDK:JDK開(kāi)源實(shí)現(xiàn)。官網(wǎng)

基于JVM的語(yǔ)言

除Java外,可以用來(lái)編寫(xiě)JVM應(yīng)用程序的編程語(yǔ)言。

Scala:融合了面向?qū)ο蠛秃瘮?shù)式編程思想的靜態(tài)類型編程語(yǔ)言。官網(wǎng)

Groovy:類型可選(Optionally typed)的動(dòng)態(tài)語(yǔ)言,支持靜態(tài)類型和靜態(tài)編譯。目前是一個(gè)Apache孵化器項(xiàng)目。官網(wǎng)

Clojure:可看做現(xiàn)代版Lisp的動(dòng)態(tài)類型語(yǔ)言。官網(wǎng)

Ceylon:RedHat開(kāi)發(fā)的面向?qū)ο箪o態(tài)類型編程語(yǔ)言。官網(wǎng)

Kotlin:JetBrain針對(duì)JVM、安卓和瀏覽器提供的靜態(tài)類型編程語(yǔ)言。官網(wǎng)

Xtend:一種靜態(tài)編程語(yǔ)言,能夠?qū)⑵浯a轉(zhuǎn)換為簡(jiǎn)潔高效的Java代碼,并基于JVM運(yùn)行。官網(wǎng)

日志

記錄應(yīng)用程序行為日志的開(kāi)發(fā)庫(kù)。

Apache Log4j 2:使用強(qiáng)大的插件和配置架構(gòu)進(jìn)行完全重寫(xiě)。官網(wǎng)

kibana:分析及可視化日志文件。官網(wǎng)

Logback:強(qiáng)健的日期開(kāi)發(fā)庫(kù),通過(guò)Groovy提供很多有趣的選項(xiàng)。官網(wǎng)

logstash:日志文件管理工具。官網(wǎng)

Metrics:通過(guò)JMX或HTTP發(fā)布參數(shù),并且支持存儲(chǔ)到數(shù)據(jù)庫(kù)。官網(wǎng)

SLF4J:日志抽象層,需要與具體的實(shí)現(xiàn)配合使用。官網(wǎng)

機(jī)器學(xué)習(xí)

提供具體統(tǒng)計(jì)算法的工具。其算法可從數(shù)據(jù)中學(xué)習(xí)。

Apache Flink:快速、可靠的大規(guī)模數(shù)據(jù)處理引擎。官網(wǎng)

Apache Hadoop:在商用硬件集群上用來(lái)進(jìn)行大規(guī)模數(shù)據(jù)存儲(chǔ)的開(kāi)源軟件框架。官網(wǎng)

Apache Mahout:專注協(xié)同過(guò)濾、聚類和分類的可擴(kuò)展算法。官網(wǎng)

Apache Spark:開(kāi)源數(shù)據(jù)分析集群計(jì)算框架。官網(wǎng)

DeepDive:從非結(jié)構(gòu)化數(shù)據(jù)建立結(jié)構(gòu)化信息并集成到已有數(shù)據(jù)庫(kù)的工具。官網(wǎng)

Deeplearning4j:分布式多線程深度學(xué)習(xí)開(kāi)發(fā)庫(kù)。官網(wǎng)

H2O:用作大數(shù)據(jù)統(tǒng)計(jì)的分析引擎。官網(wǎng)

Weka:用作數(shù)據(jù)挖掘的算法集合,包括從預(yù)處理到可視化的各個(gè)層次。官網(wǎng)

QuickML:高效機(jī)器學(xué)習(xí)庫(kù)。官網(wǎng)、GitHub

消息傳遞

在客戶端之間進(jìn)行消息傳遞,確保協(xié)議獨(dú)立性的工具。

Aeron:高效可擴(kuò)展的單播、多播消息傳遞工具。官網(wǎng)

Apache ActiveMQ:實(shí)現(xiàn)JMS的開(kāi)源消息代理(broker),可將同步通訊轉(zhuǎn)為異步通訊。官網(wǎng)

Apache Camel:通過(guò)企業(yè)級(jí)整合模式(Enterprise Integration Pattern EIP)將不同的消息傳輸API整合在一起。官網(wǎng)

Apache Kafka:高吞吐量分布式消息系統(tǒng)。官網(wǎng)

Hermes:快速、可靠的消息代理(Broker),基于Kafka構(gòu)建。官網(wǎng)

JBoss HornetQ:清晰、準(zhǔn)確、模塊化,可以方便嵌入的消息工具。官網(wǎng)

JeroMQ:ZeroMQ的純Java實(shí)現(xiàn)。官網(wǎng)

Smack:跨平臺(tái)XMPP客戶端函數(shù)庫(kù)。官網(wǎng)

Openfire:是開(kāi)源的、基于XMPP、采用Java編程語(yǔ)言開(kāi)發(fā)的實(shí)時(shí)協(xié)作服務(wù)器。 Openfire安裝和使用都非常簡(jiǎn)單,并可利用Web界面進(jìn)行管理。?官網(wǎng)GitHub

Spark:是一個(gè)開(kāi)源,跨平臺(tái)IM客戶端。它的特性支持集組聊天,電話集成和強(qiáng)大安全性能。如果企業(yè)內(nèi)部部署IM使用Openfire+Spark是最佳的組合。?官網(wǎng)?GitHub

Tigase: 是一個(gè)輕量級(jí)的可伸縮的 Jabber/XMPP 服務(wù)器。無(wú)需其他第三方庫(kù)支持,可以處理非常高的復(fù)雜和大量的用戶數(shù),可以根據(jù)需要進(jìn)行水平擴(kuò)展。?官網(wǎng)

雜項(xiàng)

未分類其它資源。

Design Patterns:實(shí)現(xiàn)并解釋了最常見(jiàn)的設(shè)計(jì)模式。官網(wǎng)

Jimfs:內(nèi)存文件系統(tǒng)。官網(wǎng)

Lanterna:類似curses的簡(jiǎn)單console文本GUI函數(shù)庫(kù)。官網(wǎng)

LightAdmin:可插入式CRUD UI函數(shù)庫(kù),可用來(lái)快速應(yīng)用開(kāi)發(fā)。官網(wǎng)

OpenRefine:用來(lái)處理混亂數(shù)據(jù)的工具,包括清理、轉(zhuǎn)換、使用Web Service進(jìn)行擴(kuò)展并將其關(guān)聯(lián)到數(shù)據(jù)庫(kù)。官網(wǎng)

RoboVM:Java編寫(xiě)原生iOS應(yīng)用。官網(wǎng)

Quartz:強(qiáng)大的任務(wù)調(diào)度庫(kù).官網(wǎng)

應(yīng)用監(jiān)控工具

監(jiān)控生產(chǎn)環(huán)境中應(yīng)用程序的工具。

AppDynamics:性能監(jiān)測(cè)商業(yè)工具。官網(wǎng)

JavaMelody:性能監(jiān)測(cè)和分析工具。官網(wǎng)

Kamon:Kamon用來(lái)監(jiān)測(cè)在JVM上運(yùn)行的應(yīng)用程序。官網(wǎng)

New Relic:性能監(jiān)測(cè)商業(yè)工具。官網(wǎng)

SPM:支持對(duì)JVM應(yīng)用程序進(jìn)行分布式事務(wù)追蹤的性能監(jiān)測(cè)商業(yè)工具。官網(wǎng)

Takipi:產(chǎn)品運(yùn)行時(shí)錯(cuò)誤監(jiān)測(cè)及調(diào)試商業(yè)工具。官網(wǎng)

原生開(kāi)發(fā)庫(kù)

用來(lái)進(jìn)行特定平臺(tái)開(kāi)發(fā)的原生開(kāi)發(fā)庫(kù)。

JNA:不使用JNI就可以使用原生開(kāi)發(fā)庫(kù)。此外,還為常見(jiàn)系統(tǒng)函數(shù)提供了接口。官網(wǎng)

自然語(yǔ)言處理

用來(lái)專門處理文本的函數(shù)庫(kù)。

Apache OpenNLP:處理類似分詞等常見(jiàn)任務(wù)的工具。官網(wǎng)

CoreNLP:斯坦佛CoreNLP提供了一組基礎(chǔ)工具,可以處理類似標(biāo)簽、實(shí)體名識(shí)別和情感分析這樣的任務(wù)。官網(wǎng)

LingPipe:一組可以處理各種任務(wù)的工具集,支持POS標(biāo)簽、情感分析等。官網(wǎng)

Mallet:統(tǒng)計(jì)學(xué)自然語(yǔ)言處理、文檔分類、聚類、主題建模等。官網(wǎng)

網(wǎng)絡(luò)

網(wǎng)絡(luò)編程函數(shù)庫(kù)。

Async Http Client:異步HTTP和WebSocket客戶端函數(shù)庫(kù)。官網(wǎng)

Grizzly:NIO框架,在Glassfish中作為網(wǎng)絡(luò)層使用。官網(wǎng)

Netty:構(gòu)建高性能網(wǎng)絡(luò)應(yīng)用程序開(kāi)發(fā)框架。官網(wǎng)

OkHttp:一個(gè)Android和Java應(yīng)用的HTTP+SPDY客戶端。官網(wǎng)

Undertow:基于NIO實(shí)現(xiàn)了阻塞和非阻塞API的Web服務(wù)器,在WildFly中作為網(wǎng)絡(luò)層使用。官網(wǎng)

ORM

處理對(duì)象持久化的API。

Ebean:支持快速數(shù)據(jù)訪問(wèn)和編碼的ORM框架。官網(wǎng)

EclipseLink:支持許多持久化標(biāo)準(zhǔn),JPA、JAXB、JCA和SDO。官網(wǎng)

Hibernate:廣泛使用、強(qiáng)健的持久化框架。Hibernate的技術(shù)社區(qū)非?;钴S。官網(wǎng)

MyBatis:帶有存儲(chǔ)過(guò)程或者SQL語(yǔ)句的耦合對(duì)象(Couples object)。官網(wǎng)

OrmLite:輕量級(jí)開(kāi)發(fā)包,免除了其它ORM產(chǎn)品中的復(fù)雜性和開(kāi)銷。官網(wǎng)

Nutz:另一個(gè)SSH。官網(wǎng),Github

JFinal:JAVA WEB + ORM框架。官網(wǎng),Github

PDF

用來(lái)幫助創(chuàng)建PDF文件的資源。

Apache FOP:從XSL-FO創(chuàng)建PDF。官網(wǎng)

Apache PDFBox:用來(lái)創(chuàng)建和操作PDF的工具集。官網(wǎng)

DynamicReports:JasperReports的精簡(jiǎn)版。官網(wǎng)

flyingsaucer:XML/XHTML和CSS 2.1渲染器。官網(wǎng)

iText:一個(gè)易于使用的PDF函數(shù)庫(kù),用來(lái)編程創(chuàng)建PDF文件。注意,用于商業(yè)用途時(shí)需要許可證。官網(wǎng)

JasperReports:一個(gè)復(fù)雜的報(bào)表引擎。官網(wǎng)

性能分析

性能分析、性能剖析及基準(zhǔn)測(cè)試工具。

jHiccup:提供平臺(tái)中JVM暫停的日志和記錄。官網(wǎng)

JMH:JVM基準(zhǔn)測(cè)試工具。官網(wǎng)

JProfiler:商業(yè)分析器。官網(wǎng)

LatencyUtils:測(cè)量和報(bào)告延遲的工具。官網(wǎng)

VisualVM:對(duì)運(yùn)行中的應(yīng)用程序信息提供了可視化界面。官網(wǎng)

YourKit Java Profiler:商業(yè)分析器。官網(wǎng)

響應(yīng)式開(kāi)發(fā)庫(kù)

用來(lái)開(kāi)發(fā)響應(yīng)式應(yīng)用程序的開(kāi)發(fā)庫(kù)。

Reactive Streams:異步流處理標(biāo)準(zhǔn),支持非阻塞式反向壓力(backpressure)。官網(wǎng)

Reactor:構(gòu)建響應(yīng)式快速數(shù)據(jù)(fast-data)應(yīng)用程序的開(kāi)發(fā)庫(kù)。官網(wǎng)

RxJava:通過(guò)JVM可觀察序列(observable sequence)構(gòu)建異步和基于事件的程序。官網(wǎng)

REST框架

用來(lái)創(chuàng)建RESTful 服務(wù)的框架。

Dropwizard:偏向于自己使用的Web框架。用來(lái)構(gòu)建Web應(yīng)用程序,使用了Jetty、Jackson、Jersey和Metrics。官網(wǎng)

Feign:受Retrofit、JAXRS-2.0和WebSocket啟發(fā)的HTTP客戶端連接器(binder)。官網(wǎng)

Jersey:JAX-RS參考實(shí)現(xiàn)。官網(wǎng)

RESTEasy:經(jīng)過(guò)JAX-RS規(guī)范完全認(rèn)證的可移植實(shí)現(xiàn)。官網(wǎng)

RestExpress:一個(gè)Java類型安全的REST客戶端。官網(wǎng)

RestX:基于注解處理和編譯時(shí)源碼生成的框架。官網(wǎng)

Retrofit:類型安全的REST客戶端。官網(wǎng)

Spark:受到Sinatra啟發(fā)的Java REST框架。官網(wǎng)

Swagger:Swagger是一個(gè)規(guī)范且完整的框架,提供描述、生產(chǎn)、消費(fèi)和可視化RESTful Web Service。官網(wǎng)

Blade:國(guó)人開(kāi)發(fā)的一個(gè)輕量級(jí)的MVC框架. 它擁有簡(jiǎn)潔的代碼,優(yōu)雅的設(shè)計(jì)。官網(wǎng)

科學(xué)計(jì)算與分析

用于科學(xué)計(jì)算和分析的函數(shù)庫(kù)。

DataMelt:用于科學(xué)計(jì)算、數(shù)據(jù)分析及數(shù)據(jù)可視化的開(kāi)發(fā)環(huán)境。官網(wǎng)

JGraphT:支持?jǐn)?shù)學(xué)圖論對(duì)象和算法的圖形庫(kù)。官網(wǎng)

JScience:用來(lái)進(jìn)行科學(xué)測(cè)量和單位的一組類。官網(wǎng)

搜索引擎

文檔索引引擎,用于搜索和分析。

Apache Solr:一個(gè)完全的企業(yè)搜索引擎。為高吞吐量通信進(jìn)行了優(yōu)化。官網(wǎng)

Elasticsearch:一個(gè)分布式、支持多租戶(multitenant)全文本搜索引擎。提供了RESTful Web接口和無(wú)schema的JSON文檔。官網(wǎng)

Apache Lucene:是一個(gè)開(kāi)放源代碼的全文檢索引擎工具包,是一個(gè)全文檢索引擎的架構(gòu),提供了完整的查詢引擎和索引引擎,部分文本分析引擎。官網(wǎng)

安全

用于處理安全、認(rèn)證、授權(quán)或會(huì)話管理的函數(shù)庫(kù)。

Apache Shiro:執(zhí)行認(rèn)證、授權(quán)、加密和會(huì)話管理。官網(wǎng)

Bouncy Castle,涵蓋了從基礎(chǔ)的幫助函數(shù)到PGP/SMIME操作。官網(wǎng):多途加密開(kāi)發(fā)庫(kù)。支持JCA提供者(JCA provider)

Cryptomator:在云上進(jìn)行客戶端跨平臺(tái)透明加密。官網(wǎng)

Keycloak:為瀏覽器應(yīng)用和RESTful Web Service集成SSO和IDM。目前還處于beta版本,但是看起來(lái)非常有前途。官網(wǎng)

PicketLink:PicketLink是一個(gè)針對(duì)Java應(yīng)用進(jìn)行安全和身份認(rèn)證管理的大型項(xiàng)目(Umbrella Project)。官網(wǎng)

序列化

用來(lái)高效處理序列化的函數(shù)庫(kù)。

FlatBuffers:高效利用內(nèi)存的序列化函數(shù)庫(kù),無(wú)需解包和解析即可高效訪問(wèn)序列化數(shù)據(jù)。官網(wǎng)

Kryo:快速、高效的對(duì)象圖形序列化框架。官網(wǎng)

FST:提供兼容JDK的高性能對(duì)象圖形序列化。官網(wǎng)

MessagePack:一種高效的二進(jìn)制序列化格式。官網(wǎng)

應(yīng)用服務(wù)器

用來(lái)部署應(yīng)用程序的服務(wù)器。

Apache Tomcat:針對(duì)Servlet和JSP的應(yīng)用服務(wù)器,健壯性好且適用性強(qiáng)。官網(wǎng)

Apache TomEE:Tomcat加Java EE。官網(wǎng)

Jetty:輕量級(jí)、小巧的應(yīng)用服務(wù)器,通常會(huì)嵌入到項(xiàng)目中。官網(wǎng)

WebSphere Liberty:輕量級(jí)、模塊化應(yīng)用服務(wù)器,由IBM開(kāi)發(fā)。官網(wǎng)

WildFly:之前被稱作JBoss,由Red Hat開(kāi)發(fā)。支持很多Java EE功能。官網(wǎng)

模板引擎

在模板中替換表達(dá)式的工具。

Apache Velocity:提供HTML頁(yè)面模板、email模板和通用開(kāi)源代碼生成器模板。官網(wǎng)

FreeMarker:通用模板引擎,不需要任何重量級(jí)或自己使用的依賴關(guān)系。官網(wǎng)

Handlebars.java:使用Java編寫(xiě)的模板引擎,邏輯簡(jiǎn)單,支持語(yǔ)義擴(kuò)展(semantic Mustache)。官網(wǎng)

Thymeleaf:旨在替換JSP,支持XML文件的工具。官網(wǎng)

測(cè)試

測(cè)試內(nèi)容從對(duì)象到接口,涵蓋性能測(cè)試和基準(zhǔn)測(cè)試工具。

Apache JMeter:功能性測(cè)試和性能評(píng)測(cè)。官網(wǎng)

Arquillian:集成測(cè)試和功能行測(cè)試平臺(tái),集成Java EE容器。官網(wǎng)

AssertJ:支持流式斷言提高測(cè)試的可讀性。官網(wǎng)

Awaitility:用來(lái)同步異步操作的DSL。官網(wǎng)

Cucumber:BDD測(cè)試框架。官網(wǎng)

Gatling:設(shè)計(jì)為易于使用、可維護(hù)的和高性能負(fù)載測(cè)試工具。官網(wǎng)

Hamcrest:可用來(lái)靈活創(chuàng)建意圖(intent)表達(dá)式的匹配器。官網(wǎng)

JMockit:用來(lái)模擬靜態(tài)、final方法等。官網(wǎng)

JUnit:通用測(cè)試框架。官網(wǎng)

Mockito:在自動(dòng)化單元測(cè)試中創(chuàng)建測(cè)試對(duì)象,為TDD或BDD提供支持。官網(wǎng)

PowerMock: 支持模擬靜態(tài)方法、構(gòu)造函數(shù)、final類和方法、私有方法以及移除靜態(tài)初始化器的模擬工具。官網(wǎng)

REST Assured:為REST/HTTP服務(wù)提供方便測(cè)試的Java DSL。官網(wǎng)

Selenide:為Selenium提供精準(zhǔn)的周邊API,用來(lái)編寫(xiě)穩(wěn)定且可讀的UI測(cè)試。官網(wǎng)

Selenium:為Web應(yīng)用程序提供可移植軟件測(cè)試框架。官網(wǎng)

Spock:JUnit-compatible framework featuring an expressive Groovy-derived specification language.官網(wǎng)兼容JUnit框架,支持衍生的Groovy范的語(yǔ)言。

TestNG:測(cè)試框架。官網(wǎng)

Truth:Google的斷言和命題(proposition)框架。官網(wǎng)

Unitils:模塊化測(cè)試函數(shù)庫(kù),支持單元測(cè)試和集成測(cè)試。官網(wǎng)

WireMock:Web Service測(cè)試樁(Stub)和模擬函數(shù)。官網(wǎng)

通用工具庫(kù)

通用工具類函數(shù)庫(kù)。

Apache Commons:提供各種用途的函數(shù),比如配置、驗(yàn)證、集合、文件上傳或XML處理等。官網(wǎng)

args4j:命令行參數(shù)解析器。官網(wǎng)

CRaSH:為運(yùn)行進(jìn)行提供CLI。官網(wǎng)

Gephi:可視化跨平臺(tái)網(wǎng)絡(luò)圖形化操作程序。官網(wǎng)

Guava:集合、緩存、支持基本類型、并發(fā)函數(shù)庫(kù)、通用注解、字符串處理、I/O等。官網(wǎng)

JADE:構(gòu)建、調(diào)試多租戶系統(tǒng)的框架和環(huán)境。官網(wǎng)

javatuples:正如名字表示的那樣,提供tuple支持。盡管目前tuple的概念還有留有爭(zhēng)議。官網(wǎng)

JCommander:命令行參數(shù)解析器。官網(wǎng)

Protégé:提供存在論(ontology)編輯器以及構(gòu)建知識(shí)系統(tǒng)的框架。官網(wǎng)

網(wǎng)絡(luò)爬蟲(chóng)

用于分析網(wǎng)站內(nèi)容的函數(shù)庫(kù)。

Apache Nutch:可用于生產(chǎn)環(huán)境的高度可擴(kuò)展、可伸縮的網(wǎng)絡(luò)爬蟲(chóng)。官網(wǎng)

Crawler4j:簡(jiǎn)單的輕量級(jí)網(wǎng)絡(luò)爬蟲(chóng)。官網(wǎng)

JSoup:刮取、解析、操作和清理HTML。官網(wǎng)

Web框架

用于處理Web應(yīng)用程序不同層次間通訊的框架。

Apache Tapestry:基于組件的框架,使用Java創(chuàng)建動(dòng)態(tài)、強(qiáng)健的、高度可擴(kuò)展的Web應(yīng)用程序。官網(wǎng)

Apache Wicket:基于組件的Web應(yīng)用框架,與Tapestry類似帶有狀態(tài)顯示GUI。官網(wǎng)

Google Web Toolkit:一組Web開(kāi)發(fā)工具集,包含在客戶端將Java代碼轉(zhuǎn)為JavaScript的編譯器、XML解析器、RCP?官網(wǎng)API、JUnit集成、國(guó)際化支持和GUI控件。

Grails:Groovy框架,旨在提供一個(gè)高效開(kāi)發(fā)環(huán)境,使用約定而非配置、沒(méi)有XML并支持混入(mixin)。官網(wǎng)

Ninja:Java全棧Web開(kāi)發(fā)框架。非常穩(wěn)固、快速和高效。官網(wǎng)

Pippo:小型、高度模塊化的類Sinatra框架。官網(wǎng)

Play:使用約定而非配置,支持代碼熱加載并在瀏覽器中顯示錯(cuò)誤。官網(wǎng)

PrimeFaces:JSF框架,提供免費(fèi)和帶支持的商業(yè)版本。包括若干前端組件。官網(wǎng)

Ratpack:一組Java開(kāi)發(fā)函數(shù)庫(kù),用于構(gòu)建快速、高效、可擴(kuò)展且測(cè)試完備的HTTP應(yīng)用程序。官網(wǎng)

Spring Boot:微框架,簡(jiǎn)化了Spring新程序的開(kāi)發(fā)過(guò)程。官網(wǎng)

Spring:旨在簡(jiǎn)化Java EE的開(kāi)發(fā)過(guò)程,提供依賴注入相關(guān)組件并支持面向切面編程。官網(wǎng)

Vaadin:基于GWT構(gòu)建的事件驅(qū)動(dòng)框架。使用服務(wù)端架構(gòu),客戶端使用Ajax。官網(wǎng)

Blade:國(guó)人開(kāi)發(fā)的一個(gè)輕量級(jí)的MVC框架. 它擁有簡(jiǎn)潔的代碼,優(yōu)雅的設(shè)計(jì)。官網(wǎng)

業(yè)務(wù)流程管理套件

流程驅(qū)動(dòng)的軟件系統(tǒng)構(gòu)建。

jBPM:非常靈活的業(yè)務(wù)流程管理框架,致力于構(gòu)建開(kāi)發(fā)與業(yè)務(wù)分析人員之間的橋梁。官網(wǎng)

Activity:輕量級(jí)工作流和業(yè)務(wù)流程管理框架。官網(wǎng)?github

資源

社區(qū)

有沒(méi)有中文情感分析 java開(kāi)源包

情感分析可以細(xì)分成幾個(gè)點(diǎn):

1. 主客觀

2. 觀點(diǎn)句提取(評(píng)價(jià)對(duì)象--情感詞)

3. 情感極性判斷

看看你要做的到底是哪個(gè)方面?

其中2是難度比較大的,特別是評(píng)價(jià)對(duì)象的提取。

都可以轉(zhuǎn)化為分類問(wèn)題,2可以參考一下淘寶的。


網(wǎng)頁(yè)題目:java情感分析代碼 java代碼分析
本文路徑:http://www.dlmjj.cn/article/ddisehj.html