共找到4條詞條名為大數據的結果 展開
- 巨量數據集合(IT行業術語)
- 塗子沛所著書籍
- 電子工業出版社出版圖書
- 人民郵電出版社出版的圖書
大數據
巨量數據集合(IT行業術語)
大數據(big data),IT行業術語,是指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中大數據指不用隨機分析法(抽樣調查)這樣捷徑,而採用所有數據進行分析處理。
大數據的5V特點(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。
大數據與雲計算的關係
麥肯錫全球研究所給出的定義是:一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統資料庫軟體工具能力範圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特徵。
大數據技術的戰略意義不在於掌握龐大的數據信息,而在於對這些含有意義的數據進行專業化處理。換而言之,如果把大數據比作一種產業,那麼這種產業實現盈利的關鍵,在於提高對數據的“加工能力”,通過“加工”實現數據的“增值”。
從技術上看,大數據與雲計算的關係就像一枚硬幣的正反面一樣密不可分。大數據必然無法用單台的計算機進行處理,必須採用分散式架構。它的特色在於對海量數據進行分散式數據挖掘。但它必須依託雲計算的分散式處理、分散式資料庫和雲存儲、虛擬化技術。
隨著雲時代的來臨,大數據(Big data)也吸引了越來越多的關注。分析師團隊認為,大數據(Big data)通常用來形容一個公司創造的大量非結構化數據和半結構化數據,這些數據在下載到關係型資料庫用於分析時會花費過多時間和金錢。大數據分析常和雲計算聯繫到一起,因為實時的大型數據集分析需要像MapReduce一樣的框架來向數十、數百或甚至數千的電腦分配工作。
大數據需要特殊的技術,以有效地處理大量的容忍經過時間內的數據。適用於大數據的技術,包括大規模并行處理(MPP)資料庫、數據挖掘、分散式文件系統、分散式資料庫、雲計算平台、網際網路和可擴展的存儲系統。
最小的基本單位是bit,按順序給出所有單位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。
它們按照進率1024(2的十次方)來計算:
1 Byte =8 bit
1 KB = 1,024 Bytes = 8192 bit
1 MB = 1,024 KB = 1,048,576 Bytes
1 GB = 1,024 MB = 1,048,576 KB
1 TB = 1,024 GB = 1,048,576 MB
1 PB = 1,024 TB = 1,048,576 GB
1 EB = 1,024 PB = 1,048,576 TB
1 ZB = 1,024 EB = 1,048,576 PB
1 YB = 1,024 ZB = 1,048,576 EB
1 BB = 1,024 YB = 1,048,576 ZB
1 NB = 1,024 BB = 1,048,576 YB
1 DB = 1,024 NB = 1,048,576 BB
全稱:
1 Bit(比特) =Binary Digit
8Bits = 1 Byte(位元組)
1,000 Bytes = 1 Kilobyte
1,000Kilobytes = 1 Megabyte
1,000 Megabytes = 1 Gigabyte
1,000 Gigabytes = 1Terabyte
1,000 Terabytes = 1 Petabyte
1,000 Petabytes = 1 Exabyte
1,000Exabytes = 1 Zettabyte
1,000 Zettabytes = 1 Yottabyte
1,000 Yottabytes = 1Brontobyte
1,000 Brontobytes = 1 Geopbyte
容量(Volume):數據的大小決定所考慮的數據的價值和潛在的信息;
種類(Variety):數據類型的多樣性;
速度(Velocity):指獲得數據的速度;
可變性(Variability):妨礙了處理和有效地管理數據的過程。
真實性(Veracity):數據的質量
複雜性(Complexity):數據量巨大,來源多渠道
價值(value):合理運用大數據,以低成本創造高價值
大數據[巨量數據集合(IT行業術語)]
其次,想要系統的認知大數據,必須要全面而細緻的分解它,著手從三個層面來展開:
第一層面是理論,理論是認知的必經途徑,也是被廣泛認同和傳播的基線。在這裡從大數據的特徵定義理解行業對大數據的整體描繪和定性;從對大數據價值的探討來深入解析大數據的珍貴所在;洞悉大數據的發展趨勢;從大數據隱私這個特別而重要的視角審視人和數據之間的長久博弈。
第二層面是技術,技術是大數據價值體現的手段和前進的基石。在這裡分別從雲計算、分散式處理技術、存儲技術和感知技術的發展來說明大數據從採集、處理、存儲到形成結果的整個過程。
第三層面是實踐,實踐是大數據的最終價值體現。在這裡分別從網際網路的大數據,政府的大數據,企業的大數據和個人的大數據四個方面來描繪大數據已經展現的美好景象及即將實現的藍圖。
洛杉磯警察局和加利福尼亞大學合作利用大數據預測犯罪的發生。
google流感趨勢(Google Flu Trends)利用搜索關鍵詞預測禽流感的散布。
統計學家內特。西爾弗(Nate Silver)利用大數據預測2012美國選舉結果。
麻省理工學院利用手機定位數據和交通數據建立城市規劃。
梅西百貨的實時定價機制。根據需求和庫存的情況,該公司基於SAS的系統對多達7300萬種貨品進行實時調價。
醫療行業早就遇到了海量數據和非結構化數據的挑戰,而近年來很多國家都在積極推進醫療信息化發展,這使得很多醫療機構有資金來做大數據分析。
現在的社會是一個高速發展的社會,科技發達,信息流通,人們之間的交流越來越密切,生活也越來越方便,大數據就是這個高科技時代的產物。阿里巴巴創辦人馬雲來台演講中就提到,未來的時代將不是IT時代,而是DT的時代,DT就是Data Technology數據科技,顯示大數據對於阿里巴巴集團來說舉足輕重。
有人把數據比喻為蘊藏能量的煤礦。煤炭按照性質有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數據並不在“大”,而在於“有用”。價值含量、挖掘成本比數量更為重要。對於很多行業而言,如何利用這些大規模數據是贏得競爭的關鍵。
大數據的價值體現在以下幾個方面:
1)對大量消費者提供產品或服務的企業可以利用大數據進行精準營銷
2) 做小而美模式的中小微企業可以利用大數據做服務轉型
3) 面臨網際網路壓力之下必須轉型的傳統企業需要與時俱進充分利用大數據的價值
不過,“大數據”在經濟發展中的巨大意義並不代表其能取代一切對於社會問題的理性思考,科學發展的邏輯不能被湮沒在海量數據中。著名經濟學家路德維希·馮·米塞斯曾提醒過:“就今日言,有很多人忙碌於資料之無益累積,以致對問題之說明與解決,喪失了其對特殊的經濟意義的了解。”這確實是需要警惕的。
在這個快速發展的智能硬體時代,困擾應用開發者的一個重要問題就是如何在功率、覆蓋範圍、傳輸速率和成本之間找到那個微妙的平衡點。企業組織利用相關數據和分析可以幫助它們降低成本、提高效率、開發新產品、做出更明智的業務決策等等。例如,通過結合大數據和高性能的分析,下面這些對企業有益的情況都可能會發生:
1)及時解析故障、問題和缺陷的根源,每年可能為企業節省數十億美元。
2)為成千上萬的快遞車輛規劃實時交通路線,躲避擁堵。
3)分析所有SKU,以利潤最大化為目標來定價和清理庫存。
4)根據客戶的購買習慣,為其推送他可能感興趣的優惠信息。
5)從大量客戶中快速識別出金牌客戶。
6)使用點擊流分析和數據挖掘來規避欺詐行為。
趨勢一:數據的資源化
何為資源化,是指大數據成為企業和社會關注的重要戰略資源,並已成為大家爭相搶奪的新焦點。因而,企業必須要提前制定大數據營銷戰略計劃,搶佔市場先機。
趨勢二:與雲計算的深度結合
大數據離不開雲處理,雲處理為大數據提供了彈性可拓展的基礎設備,是產生大數據的平台之一。自2013年開始,大數據技術已開始和雲計算技術緊密結合,預計未來兩者關係將更為密切。除此之外,物聯網、移動網際網路等新興計算形態,也將一齊助力大數據革命,讓大數據營銷發揮出更大的影響力。
趨勢三:科學理論的突破
隨著大數據的快速發展,就像計算機和網際網路一樣,大數據很有可能是新一輪的技術革命。隨之興起的數據挖掘、機器學習和人工智慧等相關技術,可能會改變數據世界里的很多演演算法和基礎理論,實現科學技術上的突破。
趨勢四:數據科學和數據聯盟的成立
未來,數據科學將成為一門專門的學科,被越來越多的人所認知。各大高校將設立專門的數據科學類專業,也會催生一批與之相關的新的就業崗位。與此同時,基於數據這個基礎平台,也將建立起跨領域的數據共享平台,之後,數據共享將擴展到企業層面,並且成為未來產業的核心一環。
趨勢五:數據泄露泛濫
未來幾年數據泄露事件的增長率也許會達到100%,除非數據在其源頭就能夠得到安全保障。可以說,在未來,每個財富500強企業都會面臨數據攻擊,無論他們是否已經做好安全防範。而所有企業,無論規模大小,都需要重新審視今天的安全定義。在財富500強企業中,超過50%將會設置首席信息安全官這一職位。企業需要從新的角度來確保自身以及客戶數據,所有數據在創建之初便需要獲得安全保障,而並非在數據保存的最後一個環節,僅僅加強後者的安全措施已被證明於事無補。
趨勢六:數據管理成為核心競爭力
數據管理成為核心競爭力,直接影響財務表現。當“數據資產是企業核心資產”的概念深入人心之後,企業對於數據管理便有了更清晰的界定,將數據管理作為企業核心競爭力,持續發展,戰略性規劃與運用數據資產,成為企業數據管理的核心。數據資產管理效率與主營業務收入增長率、銷售收入增長率顯著正相關;此外,對於具有網際網路思維的企業而言,數據資產競爭力所佔比重為36.8%,數據資產的管理效果將直接影響企業的財務表現。
趨勢七:數據質量是BI(商業智能)成功的關鍵
採用自助式商業智能工具進行大數據處理的企業將會脫穎而出。其中要面臨的一個挑戰是,很多數據源會帶來大量低質量數據。想要成功,企業需要理解原始數據與數據分析之間的差距,從而消除低質量數據並通過BI獲得更佳決策。
趨勢八:數據生態系統複合化程度加強
大數據的世界不只是一個單一的、巨大的計算機網路,而是一個由大量活動構件與多元參與者元素所構成的生態系統,終端設備提供商、基礎設施提供商、網路服務提供商、網路接入服務提供商、數據服務使能者、數據服務提供商、觸點服務、數據服務零售商等等一系列的參與者共同構建的生態系統。而今,這樣一套數據生態系統的基本雛形已然形成,接下來的發展將趨向於系統內部角色的細分,也就是市場的細分;系統機制的調整,也就是商業模式的創新;系統結構的調整,也就是競爭環境的調整等等,從而使得數據生態系統複合化程度逐漸增強。
大數據概念應用到IT操作工具產生的數據中,大數據可以使IT管理軟體供應商解決大廣泛的業務決策。IT系統、應用和技術基礎設施每天每秒都在產生數據。大數據非結構化或者結構數據都代表了‘所有用戶的行為、服務級別、安全、風險、欺詐行為等更多操作’的絕對記錄。
大數據分析的產生旨在於IT管理,企業可以將實時數據流分析和歷史相關數據相結合,然後大數據分析並發現它們所需的模型。反過來,幫助預測和預防未來運行中斷和性能問題。進一步來講,他們可以利用大數據了解使用模型以及地理趨勢,進而加深大數據對重要用戶的洞察力。他們也可以追蹤和記錄網路行為,大數據輕鬆地識別業務影響;隨著對服務利用的深刻理解加快利潤增長;同時跨多系統收集數據發展IT服務目錄。
大數據分析的想法,尤其在IT操作方面,大數據對於我們發明並沒有什麼作用,但是我們一直在其中。Gartner已經關注這個話題很多年了,基本上他們已經強調,如果IT正在引進新鮮靈感,他們將會扔掉大數據老式方法開發一個新的IT操作分析平台。
經李克強總理簽批,2015年9月,國務院印發《促進大數據發展行動綱要》(以下簡稱《綱要》),系統部署大數據發展工作。
《綱要》明確,推動大數據發展和應用,在未來5至10年打造精準治理、多方協作的社會治理新模式,建立運行平穩、安全高效的經濟運行新機制,構建以人為本、惠及全民的民生服務新體系,開啟大眾創業、萬眾創新的創新驅動新格局,培育高端智能、新興繁榮的產業發展新生態。
《綱要》部署三方面主要任務。一要加快政府數據開放共享,推動資源整合,提升治理能力。大力推動政府部門數據共享,穩步推動公共數據資源開放,統籌規劃大數據基礎設施建設,支持宏觀調控科學化,推動政府治理精準化,推進商事服務便捷化,促進安全保障高效化,加快民生服務普惠化。二要推動產業創新發展,培育新興業態,助力經濟轉型。發展大數據在工業、新興產業、農業農村等行業領域應用,推動大數據發展與科研創新有機結合,推進基礎研究和核心技術攻關,形成大數據產品體系,完善大數據產業鏈。三要強化安全保障,提高管理水平,促進健康發展。健全大數據安全保障體系,強化安全支撐。
2015年9月18日貴州省啟動我國首個大數據綜合試驗區的建設工作,力爭通過3至5年的努力,將貴州大數據綜合試驗區建設成為全國數據匯聚應用新高地、綜合治理示範區、產業發展聚集區、創業創新首選地、政策創新先行區。
圍繞這一目標,貴州省將重點構建“三大體系”,重點打造“七大平台”,實施“十大工程”。
“三大體系”是指構建先行先試的政策法規體系、跨界融合的產業生態體系、防控一體的安全保障體系;“七大平台”則是指打造大數據示範平台、大數據集聚平台、大數據應用平台、大數據交易平台、大數據金融服務平台、大數據交流合作平台和大數據創業創新平台;“十大工程”即實施數據資源匯聚工程、政府數據共享開放工程、綜合治理示範提升工程、大數據便民惠民工程、大數據三大業態培育工程、傳統產業改造升級工程、信息基礎設施提升工程、人才培養引進工程、大數據安全保障工程和大數據區域試點統籌發展工程。
此外,貴州省將計劃通過綜合試驗區建設,探索大數據應用的創新模式,培育大數據交易新的做法,開展數據交易的市場試點,鼓勵產業鏈上下游之間的數據交換,規範數據資源的交易行為,促進形成新的業態。
國家發展改革委有關專家表示,大數據綜合試驗區建設不是簡單的建產業園、建數據中心、建雲平台等,而是要充分依託已有的設施資源,把現有的利用好,把新建的規劃好,避免造成空間資源的浪費和損失。探索大數據應用新的模式,圍繞有數據、用數據、管數據,開展先行先試,更好地服務國家大數據發展戰略。
2016年3月17日,《中華人民共和國國民經濟和社會發展第十三個五年規劃綱要》發布,其中第二十七章“實施國家大數據戰略”提出:把大數據作為基礎性戰略資源,全面實施促進大數據發展行動,加快推動數據資源共享開放和開發應用,助力產業轉型升級和社會治理創新;具體包括:加快政府數據開放共享、促進大數據產業健康發展。
讓“大數據”成鄉村振興的“新動能”
2021年,黨的十九大報告提出實施鄉村振興戰略,這對於解決好新時期“三農”問題、加快推進農業農村現代化具有重要意義。隨著信息化時代的來臨,大數據已經成為了我們生活中的常態,我們都生活在同一張“網”中。當然,大數據帶來的不僅是生活工作上的便利,在推動“三農”發展中同樣具有重要的意義。從農村電商、直播帶貨、人工智慧種植、養殖等,都讓我們看到了大數據的大有可為。要推動鄉村振興戰略的落實,也需要我們用好“大數據”,把他變成“新動能”,成為農民、農業、農村發展的重要“支點”,奮力譜寫鄉村全面振興新篇章。
大數據賦能農業,農產品“身份證”擦亮農字品牌。隨著時代的發展,消費者對農產品也有了新的要求,不僅在於“吃得飽”,還在於吃得好、吃的健康、吃得安全、吃得放心,這也是對農產品的一個新的考驗。通過大數據賦能農業的方式,普安縣茶產業致富帶頭人保貴就利用農產品溯源技術給茶葉貼上專屬“身份證”,讓農產品的“前世今生”更加清楚,這是一種滿足消費者知情權的有效做法,強化了對種植者的監督,也能夠讓消費者對質量更放心,自然能夠帶來農產品的銷量提升,不斷地擦亮農字品牌。
大數據賦能農民,養殖流程數字化釋放“數字紅利”。隨著農業生產模式的改變,對農民也提出了新的要求,要讓他們在種植、養殖的過程中,能夠更好地管理,尤其需要大數據賦能。一方面,需要農民加強對人工智慧技術的學習,迅速地轉變為新農人;另一方面,讓讓農民在大數據的推動中有更多的獲得感,才能讓他們成為養殖流程數字化的重要實踐者。比如,在貴州省遵義市,利用物聯網和智能感知技術,養蠶全流程實現數字化。當然,大數據的運用不僅在養蠶,在其它方面也具有積極的作用,在降低養殖風險的過程中,更是讓農民收穫了更多的真金白銀。
大數據賦能農村,數據“遙感器”激活“金融活水”。要為農村注入新的活力,尤其需要有充足的“金融活水”。然而,因為信息互通存在的障礙,往往存在農民貸款和銀行放款“兩難”的問題。如今,通過數據“遙感器”,能夠讓銀行衛星圖像識別地塊的農作物面積、類型,更科學精準地評估價值,為農民提供貸款帶來了更多的方便,也讓躺在“賬上”的錢真正地活起來、動起來,在推動農村的發展中起到了巨大的推動作用。
“手機成了新農具,直播成了新農活,數據成了新農資”。“新農具、新農活、新農資”我們看到的是鄉村發展的新氣象,也折射了大數據在推動鄉村振興中的“動能作用”。要更好地推動鄉村振興戰略的落實,尤其需要我們加強大數據賦能,優化土地、金融、人力等資源配置,才能為發展智慧農業、建設數字鄉村、打造新型農民插上“數字翅膀”,實現農村產業興旺、農民生活富裕。