最新大數據時代讀書心得1000字八篇(優(yōu)秀)

字號:

    范文為教學中作為模范的文章,也常常用來指寫作的模板。常常用于文秘寫作的參考,也可以作為演講材料編寫前的參考。那么我們該如何寫一篇較為完美的范文呢?下面是小編幫大家整理的優(yōu)質范文,僅供參考,大家一起來看看吧。
    大數據時代讀書心得篇一
    有人說現在是讀圖時代,除去小說、心靈雞湯以外,現在的暢銷書基本都有圖片,這本書是一個特例(書里唯一的圖是出品方湛廬文化做的)
    首先嘗試解析一下作者的三大觀點,這三大觀點是大數據業(yè)者很喜歡引用的三句話:
    1 不是隨機樣本,而是全體數據
    我想所有人都能意識到對全體數據的分析優(yōu)于對隨機樣本的分析,但在現實中我們經常拿不到全體數據:一是對象的特性:比如炸彈的威力,你不可能把所有炸彈都炸掉來得到全體數據;二是數據的收集方法,每一種方法都有適用的范圍,不太可能包羅萬象;三是數據分析的角度,戰(zhàn)斗機只能統計到飛回來的飛機上的彈孔,而墜毀的則無法統計,沃德通過分析飛回來的戰(zhàn)斗機得出來最易導致墜毀的薄弱點;四是處理能力跟不上,就像以前的天氣預報太離譜是因為來不及算那些數據?!安蓸臃治鍪切畔⑷狈r代和信息流通受限制的模擬數據時代的產物”,作者顯然只關注了一部分原因。
    從語言的理解上看,什么是全體數據,究竟是“我們需要的所有數據”,還是“我們能收集到的所有數據”,書中的很多商業(yè)案例中,處理的只是“我們能收集到的所有數據”,或者說是“我們認為的全體數據”。人對自然的認識總是有限的,存在主義認為世界沒有終極的目標。書中舉例“farecast使用了每一條航線整整一年的價格數據來進行預測”,而“整整一年”就是一個采樣,或者是“我們需要的所有數據”。
    從歷史的角度看,國外的托勒密建亞歷山大圖書館唯一的目的是“收集全世界的書”,實現“世界知識總匯”的夢想,國內的乾隆匯編四庫全書,每個收集的過程都有主觀因素在里面,而他們當時都認為可以收集全部的書籍,到最后,我們也沒有得到那個夢中的全體。
    2 不是精確性,而是混雜性
    既然我們過去總是在抽樣,那本身就是在一個置信水平下,有明確的容錯度或者是偏差值。人類永遠知道我們是在精確性受限的條件下工作。同時,作者本身也承認 “錯誤并不是大數據固有的特性,而是一個亟需我們去處理的現實問題,并且有可能長期存在”。那大數據的特征究竟是精確性還是混雜性?
    由此衍生出一個問題,大數據的品質如何控制:一、本身就不要求精確,但是不精確到何種程度是需要定義的,否則就亂套了,換個角度,如果定義了容錯度,那符合條件的都是精確的(或者說我這句話還是停留在小數據時代?這里的邏輯我沒有理順)。就像品質管理大師克勞斯比提出過零缺陷理論,我一直覺得是一個偽命題,缺陷是一定存在的,就看如何界定了;二、大量非結構化數據的處理,譬如說對新聞的量化、情感的分析,目前對非sql的應用還有巨大的進步空間。
    “一個東西要出故障,不會是瞬間的,而是慢慢地出問題的”。“通過找出一個關聯物并監(jiān)控它,我們就能預測未來”。這句話當然是很認同,但不意味著我們可以放棄精確性,只是說我們需要重新定義精確度。之于項目管理行業(yè),如果一個項目出了嚴重的問題,我們相信,肯定是很多因素和過程環(huán)節(jié)中出了問題,我們也失去了很多次挽救的機會。而我們一味的`容忍混雜性的話,結果顯然是不能接受的。
    3 不是因果關系,而是相關關系
    這是本書對大數據理論的最大的貢獻,也是最受爭議的地方。連譯者都有點看不下去了。
    相關關系我實在是太熟了,打小就學的算命就是典型的“不是因果關系,而是相關關系”。算命其實是對趨向性的總結,在給定條件下,告訴你需要遠離什么,接近什么,但不會告訴你為什么那樣做。
    我們很多時候都在說科學,然而,什么是科學,沒有人能講清楚。我對科學的認識是:一、有一個明確的范圍;二、在這個范圍內樹立一個強制正確的公理;三、有明確的推演過程;四 可以復制??茖W的霸道體現在把一切不符合這四個條件的事物都斥為偽科學、封建迷信,而把自己的錯誤都用不符合前兩條來否決。從這個定義來看,大數據不符合科學。
    混沌學理論中的蝴蝶效應主要關注相關關系。它是指對初始條件敏感性的一種依賴現象,輸入端微小的差別會迅速放大到輸出端,但能輸出什么,誰也不知道。
    人類一旦放棄了對因果關系的追求,也就放棄了自身最優(yōu)秀的品質:意志力。很多人不愿意相信算命是擔心一旦知道了命運,就無法再去奮斗。即使我相信算命,也在探求相關關系中的因果要素。我放棄第一份工作的原因之一是厭倦了如此確定的明天:一個任務發(fā)出去,大概能預測到哪些環(huán)節(jié)會出問題,只要不去 follow,這些環(huán)節(jié)十有_會出問題。
    解析完這三大觀點,下面是我對大數據理論的一些疑惑。大數據是目前風行的反饋經濟中的重要一環(huán),在金融、互聯網行業(yè)的應用最為廣泛,而這些行業(yè)都是大家所認為的高薪領域。很多時候我就在想,所謂無形的手所產生的趨勢究竟是不是無形的。比如幾家公司強推一個概念,說這是趨勢,不久就真的變成趨勢了。我們身邊活生生的例子就是天貓的雙十一和京東的618,一個巨頭開路,無數人跟風,自然就生造出購物節(jié),至于合理不合理,追究的意義也不大,因為很多事情是沒有可比性的。這和沒有強制控制中心的蜂群思維又不一樣。
    1 數據獨裁。個人意志將受制于集體意志,個人的自由在哪里?用大數據預測來懲罰人的行為又確定的違反了無罪推定的原理。
    2 所有數據都來源于過去,大數據分析出來的確定性結果是否意味著我們在重復過去?拉普拉斯的決定論已經被認為是錯誤的,愛因斯坦也說過“上帝不會跟宇宙玩骰子”,但霍金不同意這句話。
    大數據時代讀書心得篇二
    在看《大數據》之前,我只知道社會越來越數字化了,看完之后,才覺悟到:人類將迎來一個新的時代。
    數字化已經把我們帶入一個信息時代,大數據卻把我們卷進了一場科技風暴之中,這本書中,作者為我們開啟了一個更包容更廣闊的新時代,大數據把社會的方方面面融合在了一起,曾經看似因果聯系緊密的事物,可能變得不再那么重要;毫無關聯的事物,可能隱藏著重要的信息,從科技、商業(yè),到醫(yī)療、政治、教育、文化,大數據一概席卷囊括,它改變著我們的傳統思維,為這個時代注入了新鮮的血液,就像作者書中所說:“這項技術終將改變我們所居住的星球上的許多東西?!?BR>    大數據最顯著的影響是對于電子商務,通過大數據,最先洞察出潛在市場的,也必然最先占領市場。而電子商務對實業(yè)的沖擊又是勢不可擋,可見,掌握了大數據就主導了市場,擁有了先進的科技才能擁有堅實的競爭力。在醫(yī)療方面,曾經的非典時期,就是一個很好的例證,正是有大數據的預測功能,才使疫情得到了控制。在更小的方面,他也同樣改變著我們的生活,書中提到美國著名計算機專家奧倫 · 埃齊奧尼發(fā)明了飛機機票價格預測軟件,就是利用大數據造福我們生活的很好例子。
    大數據不僅節(jié)省了時間,提高了效率,更將人類帶入一個新的文明階段。從分析因果總結經驗,轉變?yōu)樗鸭瘮祿A測未來;由原來的滯后性變?yōu)楝F在的預見性——大大提高了人類認識世界、改造世界的能力,變被動為主動。大數據為我們掀開了歷史新紀元,不敢想象它將會為我們帶來什么,或許會出現新奇的生活方式,從未有過的職業(yè),聞所未聞的商業(yè)模式,百家爭鳴的文化高峰;也或許會解開更多未解之謎,探索到宇宙之外的秘密??傊?,毫無疑問的是,大數據為我們帶來的未來是超乎想象的。
    這本書中作者提到最多的是:改變我們的傳統思維,摒棄精確性轉向宏觀。從總結因果轉向預測。這個世界正以驚人的速度向前發(fā)展,數據大爆炸的波及范圍遠超乎我們的想象,單純靠人類的主觀判斷力是多么的有限,大數據早晚會取而代之這一現象,這必將影響我們的生活和工作,我們也只有認清這種趨勢,改變思維,調整步伐,緊跟時代才行。即使不能與時代同步,也盡量做到避免固步自封,認識大數據、利用大數據趨利避害,為我們的生活造福!
    大數據時代讀書心得篇三
    ;
    竭誠為您提供優(yōu)質文檔/雙擊可除大數據時代讀書心得體會
    篇一:大數據時代讀書心得
    一部似乎還沒有寫完的書
    ——讀《大數據時代》有感及所思
    讀了《大數據時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰(zhàn)栗起來?!霸谛祿r代,我們會假象世界是怎樣運作的,然后通過收集和分析數據來驗證這種假想?!薄半S著由假想時代到數據時代的過渡,我們也很可能認為我們不在需要理論了?!睍袔缀蹩隙ㄒ嵏步y計學的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學的理論已經脫離實際”來“終結”量子力學。對此我很高興,因為統計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我
    頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認為”這樣的保護傘。
    近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統,跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數據是“通往未來的必然改變”,那我就必須“不受
    限于傳統的思維模式和特定領域里隱含的固
    有偏見”,跟作者一起先把統計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。
    當我們人類的數據收集和處理能力達到拍字節(jié)甚至更
    大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調查為基礎的統計學了。但是由統計學和量子力學以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!
    《大數據時代》第16頁“大數據的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關系規(guī)則。兩者似乎是做同一件事。可大數據要的“不是因果關系,而是相關關系”,“知道是什么就夠了,
    沒必要知道為什么”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基于因果關系。兩者好像又是對立的。在同一件事上兩種方法對立,應該只有一個結果,就是要否定掉其中之一。這就是讓我很擔心的原因。
    可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!
    更何況還有兩個更可怕的事情。
    其一:量子力學搞了一百多年,為了處理好混雜性問題,把質量
    和速度結合到能量上去了,為了調和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關系,因為爸爸就是爸爸,兒子就是兒子。那么大數據會不會通過正視混雜性,放棄因果關系最后反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?
    其二:人和機器的根本區(qū)別在于人有邏輯思維而機器沒有?!洞髷祿r代》也擔心“最后做出決策的將是機器而不
    是人”。如果真的那一天因為放棄邏輯思維而出現科幻電影上描述的機器主宰世界消滅人類的結果,那我還不如現在就趁早跳樓。
    還好我知道自己對什么統計學、量子力學、邏輯學和大數據來說都是門外漢,也許上面一大篇都是在胡說八道,所謂(:大數據時代讀書心得體會)的擔心根本不存在。但問題出現了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。
    所以想向《大數據時代》的作者提一個合理化建議:把這本書繼續(xù)寫下去,至少加一個第四部分——大數據時代的邏輯思維。
    合纖部車民
    20xx年11月10日
    篇二:大數據時代書面記錄與心得體會
    大數據時代書面記錄與心得體會
    20xx年5月12日,聽取了大數據時代相關技術的技術講座。當今,大數據的到來,已經成為現實生活中無法逃避的挑戰(zhàn)。每當我們要做出決策的時候,大數據就無處不在。大數據術語廣泛地出現也使得人們漸漸明白了它的重要性。大數據漸漸向人們展現了它為學術、工業(yè)和政府帶來的巨大機遇。與此同時,大數據也向參與的各方提出了巨大的挑戰(zhàn)。
    大數據,其影響除了經濟方面的,它同時也能在政治、
    文化等方面產生深遠的影響,大數據可以幫助人們開啟循“數”管理的模式,也是我們當下“大社會”的集中體現,三分技術,七分數據,得數據者得天下?!按髷祿钡挠绊?,增加了對信息管理專家的需求。事實上,大數據的影響并不僅僅限于信息通信產業(yè),而是正在“吞噬”和重構很多傳統行業(yè),廣泛運用數據分析手段管理和優(yōu)化運營的公司其實質都是一個數據公司。麥當勞、肯德基以及蘋果公司等旗艦專賣店的位置都是建立在數據分析基礎之上的精準選址。而在零售業(yè)中,數據分析的技術與手段更是得到廣泛的應用,傳統企業(yè)如沃爾瑪通過數據挖掘重塑并優(yōu)化供應鏈,新崛起的電商如卓越亞馬遜、淘寶等則通過對海量數據的掌握和分析,為用戶提供更加專業(yè)化和個性化的服務。大數據在個人隱私的方面,大量數據經常含有一些詳細的潛在的能夠展示有關我們的信息,逐漸引起了我們對個人隱私的擔憂。一些處理大數據公司需要認真的對待這個問題。例如美國天睿資訊給人留下比較深刻印象的是他的一個科學家提出,我們不應該簡單地服從法
    律方面的隱私保護問題,這些遠遠不夠的,公司都應該遵從谷歌不作惡的原則,甚至更應該做出更積極的努力。
    未來十年,決定中國是不是有大智慧的核心意義標準(那個"思想者"),就是國民幸福。一體現在民生上,通過
    大數據讓有意義的事變得澄明,看我們在人與人關系上,做
    得是否比以前更有意義;二體現在生態(tài)上,通過大數據讓有意義的事變得澄明,看我們在天與人關系上,做得是否比以前更有意義??傊屛覀儚那?0年的意義混沌時代,進入未來10年意義澄明時代。隨著具有語義網特征的數據基礎設施和數據資源發(fā)展起來,組織的變革就越來越顯得不可避免。大數據將推動網絡結構產生無組織的組織力量。最先反映這種結構特點的,是各種各樣去中心化的web2.0應用,如rss、維基、博客等。大數據之所以成為時代變革力量,在于它通過追隨意義而獲得智慧。生產者是有價值的,消費者是價值的意義所在。有意義的才有價值,消費者不認同的,就賣不出去,就實現不了價值;只有消費者認同的,才賣得出去,才實現得了價值。大數據幫助我們從消費者這個源頭識別意義,從而幫助生產者實現價值。這就是啟動內需的原理。
    篇三:《大數據時代》讀后感
    《大數據時代》讀后感
    ———大數據時代下的變革
    學號:20xx1300008姓名:嚴國立班級:12級4班這兩年,大數據這個詞突然變得很火,不僅出現在阿里巴巴、谷歌等互聯網公司的戰(zhàn)略規(guī)劃中,同時在我國國務院和其他國家的政府報告中多次提及,無疑成為當今互聯網世界中的新寵兒。我對大數據一直好奇已久,閱讀了很多資料仍不得其
    相關熱詞搜索:;
    大數據時代讀書心得篇四
    《大數據時代》是英國維克托·邁爾-舍恩伯格教授的著作,這本書也被尊為國外大數據研究的先河之作。這本書最大的優(yōu)點就在于作者利用上百個例子來對大數據的方方面面做了詳細解說,讓外行也很容易理解。結構上,作者通過大數據時代的思維變革、商業(yè)變革和管理變革三個角度依次闡述,條理清晰。
    所謂"大數據",按作者的說法,就是"所有數據"。隨著計算機運算速度和存儲能力的發(fā)展,收集數據變得越來越簡單,儲存數據的成本越來越低。在過去,由于技術限制,人們做統計時只能收集有限的數據做樣本,其中要考慮隨機樣本的選擇,努力減小因樣本問題出現的誤差;統計結果往往不能重復使用,造成數據利用率低。而現在則可以做到"樣本=總體"。數據的增多帶來不可避免的精確性問題。 "小數據"時代,一個樣本的錯誤就可以造成對總體估計的失敗,幸運的是,"大數據"時代對精確性不再那么要求苛刻——也無法要求太嚴格——數據的數量足以彌補這一缺陷。在對思維變革這一部分的闡述中,最重要也是全書的核心觀點就是大數據時代,我們應該從追求"因果關系"的舊思維方式向追求"相關關系"轉變。 在我看來,這實際上是通過大數據來透視一種事物的發(fā)展趨勢,而很多精確學科領域依然需要探尋"因果關系"解決更有針對性的問題,所以,這局限了這一轉變只能在特定的領域發(fā)生。作者自己也說,"大數據的相關性將人們指向了比探討因果關系更有前景的領域。"
    大數據時代的數據獲取方式是多種多樣,數據形式也是千變萬化,任何文字、行為、萬物都可以被數據化后用來分析。對這些數據的利用,不僅要考慮到其初次使用價值,更要放眼它未來可能的用途以提高數據的利用率。當然數據并不是無限使用,時效、環(huán)境的變化肯定會對數據提出新的要求,所以數據的折舊也是應當考慮的。這又引出了對數據這一無形資產的估值可能性。對于這樣的公司來說,數據就是他們的核心,如何在資產負債表上給他們一個公正的體現正是我們需要考慮的。
    大數據時代的價值鏈由三部分構成,我把它們簡化為"生產—分析—使用"三個環(huán)節(jié),這對應書中的三種類型公司: 第一種是基于數據本身的公司,第二種是基于技能,第三種則是基于思維。在大數據早期,技能和思維最有價值,但作者認為,最終,大部分的價值還是必須從數據本身來挖掘。這是假定了一個成熟的市場,人人都了解了大數據的用途。
    對于普通人來說,大數據時代最關心的還是隱私問題。不知不覺中,個人的一舉一動都暴露在政府甚至私人企業(yè)之下,還面臨潛在的泄露風險。對此,作者提出了使用者承擔責任的解決辦法,而不是過去那種流于形式的使用授權。大數據甚至能預測一個人的犯罪動機,這給監(jiān)管者帶來的難題是,預測一個人要犯罪,懲罰還是不懲罰?在這點上,社會達成"個人僅需對行為而非動機負責"的共識非常重要。
    大數據時代的風險控制靠的是"算法師",類似會計師一樣的職業(yè),對大數據的準確度或有效性進行鑒定。這能在一定程度上防止數據濫用的發(fā)生和數據獨裁。當今的法律亦需對大數據監(jiān)管進行修訂補充。
    當代大數據發(fā)展主要由科技公司推動,相信在不久的將來更多的傳統領域會意識到大數據的重要性。但我們也應該保持清醒,大數據并不是萬能藥,對某些領域或環(huán)節(jié),使用大數據是一種簡單且實用的選擇;但對某些領域,盲目使用大數據只會適得其反。
    大數據時代讀書心得篇五
    讀完《大數據時代》這本書后,我意識到:我們即將或正在迎接由書面到電子的跳躍之后的又一重大變革。
    這本書介紹了大數據時代來臨后,接踵而至的三項變革——商業(yè)變革、管理變革和思維變革。
    其實,這場變革已經打響。商業(yè)領域由于大數據時代的到來而推陳出新。前幾年,一家名為farecast的公司,讓預訂到更優(yōu)惠的機票價格不再是夢想。公司利用航班售票的數據來預測未來機票價格的走勢?,F在,使用這種工具的乘客,平均每張機票可以省大約50美元,這就是大數據給人們帶來的便利。
    大家應該都知道20_年出現的h1n1型流感,就拿美國為例,疾控中心每周只進行一次數據統計,而病人一般都是難以忍受病痛的折磨才會去醫(yī)院就診,因此也導致了信息的滯后。然而,對于飛速傳播的疾病,google公司卻能及時地作出判斷,確定流感爆發(fā)的地點,這便是基于龐大的數據資源,可見大數據時代對公共衛(wèi)生也產生了重大的影響!
    在我看來,如果想在在大數據時代里暢游,不僅要學會分析,而且還要能夠大膽地決斷。
    在美國,每到七、八月份時,正是臺風肆虐之時,防澇用品也擺上了商品貨架。沃爾瑪公司注意到,每到這時,一種蛋撻的銷售量較其他月份明顯增加。于是,商家作了大膽的推測,出現這樣的結果源于兩種物品的相關性,便將這種蛋撻擺在了防澇用品的旁邊。這樣的舉措大大增加了利潤,這就是屬于世界頭號零售商的大數據頭腦!
    大數據時代的到來,可以讓我們的生活更加便利。但是,如果讓大數據主宰一切,也存在一定的風險。
    大家應該都知道電子地圖,它可以為人們指引方向。但大家應該還不知道,它會默默地積累人們的行程數據,通過智能分析可以推斷出哪里是自己的家,哪里是工作單位。我們的隱私就這樣被不為人知地收集著。
    大數據時代的到來,讓我們的生活更安全,更方便,但與此同時,我們的隱私不再是隱私,數據的收集變得無所不包、無孔不入。世界已經向大數據時代邁進了一小步,一個嶄新的時代正向我們走來。讓我們用知識武裝大腦,做好準備,迎接新時代的到來!
    大數據時代讀書心得篇六
    未來的十年,將是大數據引領下的智慧科技時代。不管你是否意識到它的存在,大數據都將越來越快地改變我們這個時代,包括我們的生活方式。
    維克托·邁爾-舍恩伯格是最早洞見大數據時代發(fā)展趨勢的數據科學家之一。他通過一個大家熟知的事例,來幫助我們理解“大數據”的潛在影響力,那就是四個世紀之前望遠鏡和顯微鏡的發(fā)明。望遠鏡能夠讓我們感受宇宙,顯微鏡能夠讓我們觀測微生物,它們都是收集海量數據的新工具,因為這種工具的發(fā)明,人們同步更新了分析數據的技術和方法,促進了人們對世界更好的理解。如果說望遠鏡和顯微鏡是測量領域中的一場革命,那么今天的數據測量就相當于是現代版的望遠鏡、顯微鏡。隨著社交網絡的逐漸成熟,移動帶寬迅速提升,云計算、物聯網應用更加豐富,以及更多的傳感設備、移動終端接入到網絡,由此產生的數據及數據的增長速度比歷史上的任何時期都要多、都要快。一個大數據的時代,不經意間順理成章地翩然而至。
    一、什么是大數據?
    大數據是當前最熱門的話題之一。但什么是大數據,人們尚未給出確切的定義。首先,“大數據”是相對過去小的、局部性的數據而言的;其次,利用大數據進行分析和工作時,所依據的關于此事盡可能完整的數據,從而“一覽眾山小”,而不是采用局部的小數據,從局部推斷整體。
    維克托也并未直接給出大數據的定義。不過,他用三大轉變描述了大數據的特性:
    轉變之一:在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴于隨機采樣。例如一項針對相撲比賽中非法操縱比賽結果的研究對64000場比賽進行了分析,這算不上一個很大的數字,但由于這是過去十年所有的比賽,所以它是大數據。
    轉變之二:由于有了更多的數據,我們可以接受更多的混雜、更多數據上的不精確。如果我們對于一個事物只有50個數據點,那么每一個數據點都必須非常精確,因為每個數據點都是有用的;但是如果我們有5000萬個,去掉10個,甚至去掉1000個都沒有太大的問題。
    轉變之三:不再探求難以捉摸的因果關系,轉而關注事物的相關關系。分析大數據主要為了預測未來“是什么”,而不是“為什么”。因為很多時候我們以為我們找到了事情背后的原因,實際上卻沒有找到。更多時候知道了“是什么”就足夠了。例如知道流感將會擴散到哪里就足夠了,我不需要知道為什么;知道什么時候在網上購買機票能夠獲得最優(yōu)惠的價格就足夠了,我不需要知道為什么此時價格最低。
    二、大數據帶來的變化
    大數據從根本上改變我們認識世界和改變世界的方式。很多傳統的習慣將被顛覆,很多舊的制度將面臨挑戰(zhàn)。舉例來說:
    第一,科學探究的思路和方式受到挑戰(zhàn)
    探究是新課程改革中的一個熱詞,是促進學校教學與科學研究相融合的實踐舉措。科學探究的基本路徑是:發(fā)現問題,提出假設,制定方案,實踐探究,分析數據,得出結論。之所以會梳理出這樣一個探究的路徑,與我們對問題知曉的信息過少有關。換句話說,對所要研究的事物,我們知道的數據很少,需要從這些很小的數據出發(fā),通過猜想和假設,進行試探性的研究,如果研究得出的'結果和自己的假想是一致的,則說明我們的假說是正確的,這些假說會上升為對該事物描述的知識,我們掌握該事物的數據也隨之增加。
    利用測量所獲得的點滴數據,從一個局部來推測世界是怎樣的,這是科學探究的基本思路和方式。長期以來,我們總是通過這樣的方式來認識世界,對其有宗教般的信仰。盡管我們知道,決策者總是先有了想法,才會提出假設。如果決策者自身對所研究的事情存在著偏見,所提出的假設就很難得到實證的支持,這往往會導致探究花費了很長的時間、很大的物力和財力,也常常勞而無功。但科學研究者還是堅定不移地沿著這條道路前行,學校在教學中也將其作為科學研究的基本規(guī)范來傳授。
    在大數據時代,這樣的研究方式收到了極大的挑戰(zhàn)。先舉個事例來說吧。手機輻射是否能夠致癌?關于這個問題,無論我們的假設如何,實驗的設計都很難進行。首先,樣本選擇過少,沒有統計學上的意義;其次,不能拿人做研究對象;第三,短時間的研究很難觀察到變化。有了大數據之后,這樣的難題就可以迎刃而解了。前段時間,丹麥就進行了這樣的研究。丹麥擁有1985年手機推出以來所有手機用戶的數據庫。他們從這個數據庫中分析了1990年至2007年擁有手機的所用用戶的數據,同時,他們還收集了這一期間醫(yī)院收集的所有癌癥患者的數據,然后分析手機用戶是否比非手機用戶有更高的癌癥發(fā)病率。這兩個數據庫本身是完全獨立的,在作分析之前從來沒有想過可以做這樣的研究。結果表明,使用移動用戶和癌癥風險增加之間不存在任何關系。2011年10月,這一研究的結果發(fā)表在《英國醫(yī)學雜志》上。
    上述的案例告訴我們,在獲得了大量的數據,能夠對事物的整體進行全面的認識之后,假想就沒有意義了,我們可以直接根據全面的數據做出結論。
    大數據時代讀書心得篇七
    ;
    讀《大數據時代》心得體會
    根據公司《關于下發(fā)中國共產黨員全年學習計劃的通知》組織分公司全體黨員個人學習《大數據時代》,讀了《大數據時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰(zhàn)栗起來。
    “在小數據時代,我們會假象世界是怎樣運作的,然后通過收集和分析數據來驗證這種假想?!薄半S著由假想時代到數據時代的過渡,我們也很可能認為我們不在需要理論了?!睍袔缀蹩隙ㄒ嵏步y計學的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學的理論已經脫離實際”來“終結”量子力學。對此我很高興,因為統計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認為”這樣的保護傘。
    近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統,跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數據是“通往未來的必然改變”,那我就必須“不受限于傳統的思維模式和特定領域里隱含的固有偏見”,跟作者一起先把統計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。
    當我們人類的數據收集和處理能力達到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調查為基礎的統計學了。但是由統計學和量子力學以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!
    《大數據時代》第16頁“大數據的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關系規(guī)則。兩者似乎是做同一件事??纱髷祿摹安皇且蚬P系,而是相關關系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基于因果關系。兩者好像又是對立的。在同一件事上兩種方法對立,應該只有一個結果,就是要否定掉其中之一。這就是讓我很擔心的原因。
    可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!
    更何況還有兩個更可怕的事情。
    其一:量子力學搞了一百多年,為了處理好混雜性問題,把質量和速度結合到能量上去了,為了調和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關系,因為爸爸就是爸爸,兒子就是兒子。那么大數據會不會通過正視混雜性,放棄因果關系最后反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?
    其二:人和機器的根本區(qū)別在于人有邏輯思維而機器沒有。《大數據時代》也擔心“最后做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現科幻電影上描述的機器主宰世界消滅人類的結果,那我還不如現在就趁早跳樓。
    還好我知道自己對什么統計學、量子力學、邏輯學和大數據來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。
    相關熱詞搜索:;
    大數據時代讀書心得篇八
    ;
    《大數據時代》心得體會
    由咸陽市組織、廈門大學承辦的為期一個星期的“三五”人才綜合素質培訓已經結束,這次培訓讓我感觸頗深,受益匪淺。信息時代的到來,我們感受到的是技術變化日新月異,隨之而來的是生活方式的轉變,我們這樣評論著的信息時代已經變?yōu)樵?。如今,大數據時代成為炙手可熱的話題。針對這個話題,我從以下幾個方便談一下自己對于大數據的淺薄認識。
    一、大數據的概念
    信息和數據的定義。維基百科解釋:信息,又稱資訊,是一個高度概括抽象概念,是一個發(fā)展中的動態(tài)范疇,是進行互相交換的內容和名稱,信息的界定沒有統一的定義,但是信息具備客觀、動態(tài)、傳遞、共享、經濟等特性卻是大家的共識。數據:或稱資料,指描述事物的符號記錄,是可定義為意義的實體,它涉及到事物的存在形式。它是關于事件之一組離散且客觀的事實描述,是構成信息和知識的原始材料。數據可分為模擬數據和數字數據兩大類。數據指計算機加工的“原料”,如圖形、聲音、文字、數、字符和符號等。從定義看來,數據是原始的處女地,需要耕耘。信息則是已經處理過的可以傳播的資訊。信息時代依賴于數據的爆發(fā),只是當數據爆發(fā)到無法駕馭的狀態(tài),大數據時代應運而生。
    在大數據時代,大數據時代區(qū)別與轉變就是,放棄對因果關系的渴求,而取而代之關注相關關系。也就是說只要知道“是什么”,而不需要知道“為什么”。數據的更多、更雜,導致應用主意只能盡量觀察,而不是傾其所有進行推理。小數據停留在說明過去,大數據用驅動過去來預測未來。數據的用途意在何為,與數據本身無關,而與數據的解讀者有關,而相關關系更有利于預測未來。大數據更多的體現在海量非結構化數據本身與處理方法的整合。大數據更像是理論與現實齊頭并進,理論來創(chuàng)立處理非結構化數據的方法,處理結果與未來進行驗證。大數據是在互聯網背景下數據從量變到質變的過程。小數據時代也即是信息時代,是大數據時代的前提,大數據時代是升華和進化,本質是相輔相成,而并非相離互斥。
    二、大數據帶給生活的轉變
    大數據已經是信息產業(yè)發(fā)展的必然趨勢,可以說,大數據現在已經開始慢慢滲透入我們的生活,如:現在流行的打車軟件,三維立體化社區(qū)的建立,某些從事生產銷售的的行業(yè)利用大數據來優(yōu)化規(guī)模和實現離異最大化。而我們很多人對大數據都很陌生,只是被動的適應著大數據給生活帶來的改變。大數據是以云計算機為基礎的,所以,要實現大數據,相關的很多硬件設備都要更新換代,信息處理系統、信息傳輸系統、信息反饋系統、信息決策系統都將面臨新的挑戰(zhàn),相關產業(yè)都要重新調整產業(yè)結構,在那時,可以夸張的說,信息就是黃金,信息就是石油。大數據時代的到來會使人們的生活節(jié)奏急速加快,信息的時效性決定了它的流通速率,就不得不加快自己的節(jié)奏,人們會越來越忙。
    二、大數據的發(fā)展前景
    大數據的概念來源于、發(fā)展于美國,并向全球擴展,必將給我國未來的科技與經濟發(fā)展帶來深遠影響。根據idc統計,目前數據量在全球比例為:美國32%、西歐19%、中國13%,預計到2020年中國將產生21%的數據,我國是僅次于美國的數據大國,而我國大數據方面的研究尚在起步階段,如何開發(fā)、利用保護好大數據這一重要的戰(zhàn)略資源,是我國當前亟待解決的問題。
    三、數據未來的故事。數據的發(fā)展,給我們帶來什么預期和啟示?
    客戶數據、交易數據、管理數據等海量數據不斷增長,海量機遇和挑戰(zhàn)也隨之而來,適應變革,適者生存。我們可以有更廣闊的學習空間、可以有更精準的決策判斷能力這些都基于數據的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設“數據倉庫”,培養(yǎng)“數據思維”,養(yǎng)成“數據治理”,創(chuàng)造“數據融合”,實現“數據應用”才能擁抱“大數據”時代,從數據中攫取價值,笑看風云變換,穩(wěn)健贏取未來。
    總之,大數據正在以不可阻擋的磅礴氣勢,與同樣具有革命意義的最新科技
    進步(如納米技術、生物工程、全球化等)一起,揭開人類新世紀的序幕,大數據讓人類對一切事物的人事回歸本源,大數據通過影響經濟生活、政治博弈、、社會管理、文化教育科研、醫(yī)療保健等等行業(yè),與每個人產生密切的聯系。大數據基數技術離你我董并不遙遠,它已經來到我們身邊,滲透進我們每個人的日常生活、消費、工作之中時時刻刻、事事處處,我們無法逃遁,因為它無微不至。
    相關熱詞搜索:;