九枝蘭專訪:百度數據專家分享企業如何利用數據創造營銷價值
Warning: Invalid argument supplied for foreach() in /data/cxweb/www/gupowang.com/public/article/view.html on line 71
來源|九枝蘭網絡營銷
導語:你也許知道數據分析價值巨大,但你一定不知道它能力的邊界有多大。想要更好的做傳播?想要成為一個更聰明的營銷人?這篇文章可以幫到你。
本期九枝蘭請來了百度資深數據技術專家畢然為你分享企業如何利用數據創造營銷價值。
九枝蘭:企業為什么要做數據分析,公司的業務哪些方面可以跟大數據進行接合? 九枝蘭:從上面的市場價格,可以從側面看出數據分析被企業認可。那么,數據分析價值具體體現在哪里? 畢然:數據技術有兩個分支:數據分析和數據建模。這兩點是很多企業“數據驅動業務”發展模式的核心,在業務發展的不同階段提供不同方面的價值。 數據分析對企業的巨大價值體現在業務發展的前期(探索期)或階段性改進期(顛覆期)。 當探索和變革業務模式時,企業需要數據分析去明確業務中的問題、機遇及解決方案。 企業最大的成本是決策成本,而數據分析是提高企業決策能力的關鍵。 當業務模式相對成熟時,企業則需要數據建模來提升業務效率,減少運營成本等。 兩者在不同階段的互相配合,才能使得業務的發展實現良性的循環,不斷上升。 九枝蘭:如何快速搭建數據分析框架,建立方法論,數據分析的常用工具有哪些? 畢然:《紅樓夢》一書中有一段“黛玉教香菱寫詩”的篇章十分經典,它道出了做好數據分析的“個中三味”。 黛玉道:“詞句究竟還是末事,第一是立意要緊。若意趣真了,連詞句不用修飾自是好的,這叫做‘不以詞害意’。” 香菱道:“我只愛陸放翁的‘重簾不卷留香久,古硯微凹聚墨多’,說的真切有趣。” 黛玉道:“斷不可看這樣的詩。你們因不知詩,所以見了這淺近的就愛,一入了這個格局,再學不出來的。你只聽我說,你若真心要學,我這里有《王摩詰全集》,你且把他的五言律一百首細心揣摩透熟了,然后再讀一百二十首老杜的七言律,次之再李青蓮的七言絕句讀一二百首。肚子里先有了這三個人做了底子,然后再把陶淵明、應、劉、謝、阮、庾、鮑等人的一看,你又是這樣一個極聰明伶俐的人,不用一年工夫,不愁不是詩翁了。” ——摘自《紅樓夢》 黛玉提出了學詩的一個重要觀點,要先學立意(格局)而不是辭藻(技巧)。陸游的詩不是不好,而是他早期的風格偏“藻繪”(注:色彩華麗)。這并不是貶低陸游,每個人的詩作都有自己的風格和美感。但如果初學者專看這樣的詩句,很容易過于追求修辭技巧,而忽略了詩的本質是為了抒發思想和情感。黛玉推薦的王維、杜甫、李白,無一不是以詩言志、詩句中有深刻內涵的典范。 同理,做好數據分析與學寫詩文一樣,真正的關鍵在技巧(統計技術)之外,而在于對業務的觀察、思考與感悟,即分析的思路。 四者的關系如下圖所示。“業務調研”是數據分析的起點,也是獲取分析思路的基礎,但需要兼具深度和廣度的“創新思考”,才能獲取更獨到的分析思路。分析思路也可以認為是統計數據的角度,完成數據統計后,需要“邏輯推理”來保證從數據到結論判斷的正確性。最后,用“可行建議”來保證分析結論的落地執行,產生可量化的業績。這就是數據分析從業務中來,回業務中去的完成過程。 一份優秀的分析報告,最終呈現的統計方法一定要簡單清晰(make it simple),切忌喧賓奪主。如果報告的閱讀者需要花80%的精力來搞清楚統計方法,而不是理解分析結論,這份報告就失敗了。 九枝蘭:從上面的分析中,我們看到,想做好數據分析比較復雜,所以,能否請你總結下,做好數據分析最基本的的流程是什么? 畢然:我認為做好數據分析如寫好詩一樣,在于立意而不是技術。下面逐一展開講解“業務調研”、“創新思考”、“邏輯推理”和“可行建議”這四個關鍵。 業務調研和創新思考決定了“分析主題”的高低和“方案思路”的好壞;邏輯推理決定了從統計數據得出的“分析報告”是否可信;可行建議決定了分析報告的“業務落地”效果。做好這四個關鍵。才能確保數據分析項目的每個步驟都卓有成效,最終產生業務改進。 理解大數據價值,首先要明確“大數據”中“大”意味著什么?數據統計、數據分析、數據挖掘都是上個世紀就存在的學科,為何到了這個世紀,這些學科紛紛戴上“大”的帽子,煥發出嶄新的生命力呢?大數據中的“大”有三個突出的經濟價值。 價值1:大數據使“精細刻畫”變成了可能 精細刻畫指用很多特征來描述一種關系。因為如果收集到的樣本量很少,就無法用較多的特征來細分樣本。因為落到每個細分格子中的樣本數過少使統計結論不置信,如“海淀區西二旗6~10歲的女童喜歡男性旅游鞋”的結論。雖然該結論很荒謬,但這種細致描述的方法還是很有價值的。市場細分意味著差異化需求,其中隱藏了巨大的商機。如果能夠獲取足夠大的樣本量,可以支撐更細致的結論,而不用擔心置信性。 這是“大數據”的第一個價值:有了“大數據”,一切統計模型都變得極其個性化。 如醫療領域的場景,當醫生遇到新病人時,一方面根據自己所學的理論知識進行分析,另一方面也會和以往接觸過的病例進行比對。如果之前遇見過與新病人很像的病例,當時的治療方案已經被印證效果良好,醫生會給出相近的診療方案。但每個醫生見過的病例是有限的。如果找不到完全一致的病例,就只能參考一些部分相似的病例,診療方案效果大概率會打折扣。這也是老中醫比年輕中醫受歡迎、一線城市的知名醫院比小城市的醫院更受歡迎的原因之一,因為前者經歷過更多的病例。大數據的價值類似于收集到足夠多的病例,對于每一個病人,均可以找到數量眾多的相似病例,那么對新病人的病情分析和治療方案會準確、有效得多。 很多互聯網企業都在業務中使用這樣細致刻畫的模型,比如搜索引擎的廣告點擊率預估、電商網站的推薦系統等等,這些模型將一次查詢或一次推薦的場景刻畫的非常細致,甚至用成千上萬維度的特征來描述規律(如:買了某本書并團購了某場電影票的年輕女性高概率會購買某件商品)。這種精細的刻畫沒有大數據的支持幾乎是不可能的,沒有大數據我們只能得到“女性喜歡A,男性喜好B”這樣很粗略的統計規律。 大樣本使大特征成為可能,大特征使大樣本發揮價值。 ——大數據時代 大數據使得“統計科學”的重心發生了變化。經典統計學更多探討“如何從抽樣的個體樣本推斷整體數據的統計結論”;而大數據時代,討論的主題則是“如何尋找合適的維度切分整體數據,以便更好的推斷個體行為”。 價值2:大數據使“智能學習”變成可能 人類基于觀測數據探索世間規律,共經歷了四個階段。 (注釋:階段3中的圖像圖片來自于Andrew Ng的報告《Machine Learning and AI via Brain simulations》第39頁) 階段1 規律=全部領域知識(用數學公式表示),數據用于啟發思路和驗證假說:科學家根據觀察到的現象提出假說(表達規律的數學公式),然后收集實驗數據來驗證假說。 典型如牛頓第二定律F=ma,物體的加速度與所受外力正比,與物體質量成反比。在生活中時有體會,推動一個物體,使用的力氣越大,它的加速越快;該物體越沉重(需排除摩擦力的干擾),它加速的越慢。相信大家對中學含有小車、砝碼與滑輪的物理實驗記憶猶新。這個階段,數據在人類學習的過程中,主要起“啟發科學家設計假說的思路”和“驗證假說有效性”的作用。 階段2 規律=大部分領域知識+小部分統計學習:人類將某個領域的知識梳理清楚,留下小部分內容交給機器基于數據來學習。 典型如自然語言處理(NLP)中的語法解析,首先由人類總結出語法規則,根據語法規則解析某句話,如“he drive down the street in the car“,這句話既可以解析成“他開車穿過街道”,也可以解析成“他穿過車里的街道”,兩種方式均滿足語法規則)。但前者是人類在該語境中習慣的表達方法,而后者則不是。哪個解析結果更符合語境,可以交由機器解決,它通過語料庫(大量資料、文獻、對話的文本記錄),判斷前者出現(被使用)的概率更高。最終,人類總結的語法規則和機器在語法規則上建立的統計模型一起完成了語法解析的任務。 階段3 規律=小部分領域知識+大部分統計學習:機器學習越來越智能,越來越多的領域知識不再需要人類梳理和總結,而可以通過機器自動學到。 典型如近些年火熱的深度學習模型,進一步減少了機器學習對領域知識的依賴。在圖像處理的人臉識別問題中,通過深層次的神經網絡,可以自動學習出從像素到邊界、從邊界到部位、再從部位到人臉的深層次圖像內涵,不再依賴人類的梳理總結。但網絡結構的設計和非線性變換的函數,依然需要人類基于圖像處理領域的特點去設定,所以不能說全部脫離領域知識。 階段4 規律=全部統計學習。 曾看過一篇科研報道,當一個人的聽覺細胞全部壞死后,部分視覺細胞開始承擔聽覺的功能。這說明人腦細胞的學習能力并不受領域知識結構的限制。人類從遠古到現今,沒有其他生命告訴人類世間的規律和道理。但我們從零開始,一代代的探索和積累,形成了對這個宇宙中各種規律的認知。如果機器有一天能夠完全不帶任何假設(前置的領域知識)的學習,它就真正具備人類的學習能力了。機器可以自動探索世界,代替人類做科學研究。 這四個階段的演變過程是統計學習越來越智能的過程,所需的數據量也由少變多。驗證一個規律,只需要采集少量實驗數據點即可。而在領域知識(假設)越來越少的情況下,統計學習則要承擔更多的探索,需要的數據量也越來越多。 所以,大數據帶來的第二個價值,是使“智能學習”變為可能。只有數據量足夠大,機器才能減少對領域知識的依賴,更加智能的學習。 注釋:使用機器學習領域的專業術語“越強大的模型,意味著越寬泛的假設空間,需要越多的數據樣本,否則模型會過擬合”。 價值3:數據疊加的價值是非線性增長:1+1>2 前兩種價值也可以這樣理解:單一種類的數據量增多,可以捕捉更加細致的規律(關系Y-X,Y與X的可能數量增多)和更加復雜的規律(Y-X之間的關系復雜)。此外,隨著數據種類的增多,信息會交織在一起,提供更豐富的內涵。 在移動互聯網與可穿戴設備興起的今天,幾乎每個人的生活都會在網絡上留下印記:個人數據、搜索數據、電商數據、社交數據、地圖數據,如果將這些數據整合在一起,幾乎可以完整的描繪一個人,他的所見所想、所需所求。 可見,在營銷領域,利用大數據可以讓企業主更精準的找到目標受眾,而在“智能學習”、非線性增長領域也發揮著重要價值。 如果大家在數據分析方面也有自己獨到的見解,歡迎和我交流,你可在行(www.zaih.com)搜索“畢然”,也可以發送郵件至:biran1983@qq.com。愿與更多的朋友一道,專注“大數據技術”,探索世界并有所創造。 4月中旬后,歡迎大家購買我的新書《大數據分析的道與術》,以上的內容在新書中均會覆蓋。 九枝蘭(www.jiuzhilan.com),一站式網絡營銷SaaS,集成了搜索引擎投放、搜索引擎優化、微信微博、H5模板、著陸頁、郵件短信、DSP、廣點通、APP消息推送等多個推廣渠道,結合用戶管理、營銷活動管理、營銷自動化、渠道分析、用戶分析、數據分析等功能,幫助企業主提高效率,節省營銷成本。 姑婆那些事兒ios快速審核服務 點擊 :http://www.3377on.com/zhuanti/3128.html 大家都愛搜:互聯網資訊類類有話說App推廣運營經驗線下推廣活動推薦微信營銷姑婆專題姑婆圈ASO校園推廣地推ASO100渠道刷量校園運營團隊 姑婆那些事兒(www.3377on.com)是互聯網推廣運營知識分享平臺,關注移動推廣(android,ios)運營,網站推廣運營、校園推廣及互聯網領域最新動態 。歡迎關注我們的微信(gupo520),新浪微博(姑婆那些事兒)。 版權聲明:本文來源于互聯網,僅作分享學習之用,姑婆那些事兒負責整理推薦。文章僅代表原作者獨立觀點,不代表本平臺運營者觀點與立場。如有版權問題,請聯系姑婆那些事兒—小秘書(微信號:gpxms001)協商解決,謝謝!
次分享
文章評論(0)