推薦教程:Python教程
大數(shù)據(jù)本質(zhì)上是人類社會數(shù)據(jù)積累從量變到質(zhì)變的必然產(chǎn)物,是在信息高速公路基礎(chǔ)上的進(jìn)一步升級和深化,提升人工系統(tǒng)智能水平的重要途徑,對人類社會的發(fā)展具有極其重大的影響和意義。
大數(shù)據(jù)是一個體量特別大、數(shù)據(jù)類別特別多的數(shù)據(jù)集,并且這樣的數(shù)據(jù)集無法用傳統(tǒng)軟件工具對其內(nèi)容進(jìn)行抓取、管理和處理。大數(shù)據(jù)首先是數(shù)據(jù)體量(Volumes)大,一般在10TB規(guī)模左右,但在實際應(yīng)用中,很多企業(yè)用戶把多個數(shù)據(jù)集放在一起,已經(jīng)形成了 PB 級的數(shù)據(jù)量。其次是數(shù)據(jù)類別(Variety)多,數(shù)據(jù)來自多種數(shù)據(jù)源,數(shù)據(jù)種類和格式日漸豐富,包括半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。再次是數(shù)據(jù)處理速度(Velocity)快,在數(shù)據(jù)量非常 龐大的情況下,也能夠做到數(shù)據(jù)的實時處理。最后一個特點是數(shù)據(jù)真實性(Veracity)高, 企業(yè)越發(fā)需要有效的信息之力以確保其真實性及安全性。
大數(shù)據(jù)是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。
隨著云計算、云存儲和物聯(lián)網(wǎng)等技術(shù)廣泛應(yīng)用,人們通過搜索引擎等獲取信息,尋找知識,構(gòu)建知識圖;人類的各種社會互動、溝通,社交網(wǎng)絡(luò)和傳感器也正在生成海量數(shù)據(jù);商業(yè)自動化導(dǎo)致海量數(shù)據(jù)存儲,但用于決策的有效信息又隱藏在數(shù)據(jù)中,如何從數(shù)據(jù)中發(fā)現(xiàn)知識,大數(shù)據(jù)挖掘技術(shù)應(yīng)運而生!
大數(shù)據(jù)、數(shù)據(jù)挖掘、數(shù)據(jù)分析、人工智能與大數(shù)據(jù)和云計算的關(guān)系,總而言之,還希望大家多看下這方面的科譜專文