大數據,無疑是當前商業領域最為熱門的話題之一。作為舶來品,中國的“大數據”時代起步略晚,但無論是否理解“大數據”本身的含義,企業也都愿意和“大數據”扯上點關系,似乎不折騰點“大數據”,企業就被認為是落伍、就會被時代所淘汰;每一家企業無不希望在紛雜的數據中,找到些“元寶”,覓得一些行業內“彎道超車”的機會。
大數據分析的基礎是什么?是數據;數據的金礦又存在哪里?企業管理者自然而然會聯想到IT企業。誠然web2.0時代開啟后,網絡就不再是企業一方的舞臺,人人都可以通過一根網線在網絡上留下自己的痕跡。自然而然的,如今的互聯網企業擁有海量的數據,擁有大數據分析的天然基礎。
另一方面掌握“大數據”先機的則是使用“芯片”的各類設備制造企業,在機器中植入小小的芯片,就可以記錄用戶的各項操作使用行為,也為用戶行為分析積累了大量的數據基礎;當然,在大數據浪潮中少不了的是大型連鎖超市、金融服務中心等掌握具體消費信息的行業領域。因而我們也看到,在各類介紹“大數據”的書籍里,案例中大多出于以上的行業,因為它們的存在,天然的會積累大量的數據。那是不是游離在這些行業之外的企業就和“大數據”絕緣了呢?是不是這些企業擁有這樣的數據就夠了呢?
數據有五大類別,“大數據”并非只是互聯網企業的天下
企業掌握的數據通常有幾個類型:一類是網絡數據,通過互聯網加載代碼記錄用戶的瀏覽及點擊行為,從而記錄下海量的網絡瀏覽點擊痕跡數據;第二類數據是通過或者芯片記錄的產品使用痕跡數據,當然還有一類數據是消費行為痕跡數據,它為少數特定行業企業所有并且數據跨越了多類產品、多個行業,如超市掌握的每筆消費數據記錄、淘寶掌握的店主的銷售往來信息等。但這三類數據首先只集中在特定的行業或者企業中,互聯網行業或者設備的生產制造業、零售行業是掌握這類數據最多的行業,此外這三類數據的特點在于“人們在無意識下自然”產生的,因為它難以與消費與使用的“人”建立聯系而顯得“生硬而不夠鮮活”,因此使用這類海量數據進行分析能夠發現關聯但往往難以解釋為什么會有這樣的關聯,能夠發現消費特點但又往往難以在精準營銷的執行層面加以轉化—畢竟,我們往往不知道具有這些行為的都是什么樣的一群人,是男性還是女性、多大年齡,處在什么樣的家庭生活階段……當然,另一類數據能夠在一定程度上彌補這樣的缺陷,企業內部的銷售、客服部門往往會記錄更多這樣的信息,能夠對“人”本身進行更多的補充描摹,但這類數據往往數據時效性比較弱,數據庫不能及時更新導致信息錯誤率較高。
但企業似乎忘記了,社會化媒體時代下,個人自媒體爆發帶來了海量的數據,“粉絲”的關系讓企業得以區分社會化媒體中個人與企業品牌的遠近關系—作為第五類數據, “自發”的特點保證了信息準確性,“自媒體”特質對理解企業目標群體不乏一個近乎免費的通道,而它恰恰不受特定的行業限制,為一般行業企業涉水“大數據”提供了豐富的數據基礎。

“大數據”的基礎在于數據彼此的關聯
而當真正想借“大數據”之風的做點什么“挖掘”性工作的時候,企業又會發現,手中的數據又似乎有點無從下口;這種現象在企業中大為常見--大數據既然不必要求數據是規則的,那正好適合中國的大多數企業—在高速的發展中,積累了大量的信息,但由于重速度而輕規范,信息本身也會有很多的缺失或者模糊。因而我們常常能夠接到這樣的需求:我們企業幾年的發展,內部各個部門都有很多的數據,積累了幾萬條銷售的數據,積累了幾萬條客戶的信息,這些信息看看能不能盡快幫我們通過大數據的分析找到點有價值的信息。
但拿到這些數據后卻讓人大跌眼鏡—銷售數據只是看到每個被銷售的產品的銷售時間、價格、銷售店面信息,或者沒有購買者的任何信息或者只是簡單的記錄姓名;而客戶信息則對客戶個人的性別、年齡、聯系方式等信息較為完整,而對購買過的產品方面記錄較少。換而言之,企業提供的是彼此割裂的數據—這也確實符合中國大多數企業各個部門各自為戰的現狀,但不同部門數據之間缺乏聯系的通道,難以建立各個渠道數據的彼此關聯。
《大數據時代》作者維克托明確指出,大數據時代最大的轉變就是放棄對因果關系的渴求而取而代之關注相關關系;“尿片與啤酒”關聯的發現也是這兩個產品經常出現在一張超市購買單據上—如果購物的男人將紙尿褲和啤酒分別結賬,那顯然多么有效的數據挖掘工具也難以發現二者之間的關聯關系。因此,大數據挖掘的基礎是數據之間彼此的關聯,單獨的、片段化的數據再多,在大數據環境下也無法實現其本身的價值;而面對中國大多數企業內部各自為戰的現狀,如果企業需要將原有的數據進行深度分析的話,就首先需要建立數據彼此之間的聯系,或是以“人”的信息(姓名、手機號、身份證號、住址)或是以產品信息(如產品的唯一編碼),將企業中各個渠道的數據打通,才可能真正的找到“數據的相關關系”。
借助社會化媒體的海量數據,數據彼此的關聯也可以是“虛擬的”
但同時,這又帶來另外一個技術性問題—畢竟不是所有的數據之間都能建立類似的真實對應聯系,--對于近似快消品的行業(如運動服飾),消費群體本身是大眾化的,往往沒有建立完備的用戶信息數據庫(實際在銷售終端目前也難以實現),在這種條件下如何利用大數據為企業獲得增值信息呢?下圖給出一種利用社會化媒體進行模糊匹配的方式,幫助企業更好的理解目標群體—即便現有的數據不能全面反映人群的特質,但可以通過社會化媒體實現“信息轉化”,在社會化媒體中找到具有類似特質的“網絡虛擬人”,并通過這一特質人群在各類社交媒體的全面信息,從而間接“實現”對目標人群的全面描摹。
冷靜下來再看,社會化媒體的井噴為眾多沒有“先天數據條件”的企業提供了“卷入大數據浪潮”的機會,“大數據”必然將跳出“痕跡數據關聯分析”的處理模式,從“行為”的相關與預測發展到在web3.0上的360度分析與定位。而基于社會化媒體海量多維數據的“虛擬關聯”模式的開啟,為更多數據彼此關聯提供了一種可能,可以預言,在不久的將來將有更多的企業打破“數據格式”本身的束縛,從豐富的海量數據中找到屬于自己的寶藏!
文章來自網絡,版權歸作者所有,如有侵權請聯系刪除