近期有不少人向大數(shù)匠教育,有關(guān)數(shù)據(jù)分析的職業(yè)發(fā)展問題,可見隨著大數(shù)據(jù)時代到來,數(shù)據(jù)分析師的職業(yè)發(fā)展也備受關(guān)注。數(shù)據(jù)分析的路線大致可以劃分成:數(shù)據(jù)分析,數(shù)據(jù)挖掘,數(shù)據(jù)產(chǎn)品,數(shù)據(jù)工程四大方向。
(一)數(shù)據(jù)分析/數(shù)據(jù)運營/商業(yè)分析
首先基礎(chǔ)的是業(yè)務(wù)方向的數(shù)據(jù)分析,也稱為數(shù)據(jù)運營或者商業(yè)分析。絕大部分人都是從這個崗位開始自己的數(shù)據(jù)之路,也是基數(shù)大的崗位。由于基數(shù)大,這類崗位通常魚龍混雜。雖然都叫數(shù)據(jù)分析師,有的每天只和Excel表格打交道。而另一種,通過將業(yè)務(wù)數(shù)據(jù)體系化,建立一套指標(biāo)框架,監(jiān)控數(shù)據(jù)的波動和異常,找出問題建立和優(yōu)化指標(biāo)體系,優(yōu)化和驅(qū)動業(yè)務(wù),推動數(shù)據(jù)化運營,找出可增長的市場或產(chǎn)品優(yōu)化空間。
數(shù)據(jù)思維和業(yè)務(wù)理解是分析師賴以生存的技能。很多時候,工具是錦上添花的作用。掌握Excel+SQL/hive,了解描述統(tǒng)計學(xué),知道常見的可視化表達,足夠完成大部分任務(wù)。對于Python和機器學(xué)習(xí)來說只是加分項。
數(shù)據(jù)分析師是一個基礎(chǔ)崗位,如果專精于業(yè)務(wù),更適合往管理端發(fā)展,單純的工具和技巧很難拉開差距。數(shù)據(jù)分析的管理崗,比較常見的有數(shù)據(jù)運營經(jīng)理/總監(jiān),數(shù)據(jù)分析經(jīng)理等,相對應(yīng)的能力是能建立指標(biāo)體系,并且解決日常的各類問題。
大數(shù)匠教育提示,作為新人,比較普適的發(fā)展路線是先成為一位數(shù)據(jù)分析師。積累相關(guān)的經(jīng)驗,在一兩年后,決定往后的發(fā)展,是數(shù)據(jù)挖掘,還是專精數(shù)據(jù)分析成為管理崗。
(二)數(shù)據(jù)挖掘/算法專家/深度學(xué)習(xí)
挖掘工程師要求更高的統(tǒng)計學(xué)能力、數(shù)理能力以及編程技巧。除了掌握算法,同樣需要編程能力去實現(xiàn),不論R、Python、Scala/Java,至少掌握一種。模型的實施,往往也要求Hadoop/Spark的工程實踐經(jīng)驗,精通SQL/Hive是必須的。因為要求高,所以數(shù)據(jù)挖掘的平均薪資高于數(shù)據(jù)分析師。
數(shù)據(jù)挖掘的業(yè)務(wù)領(lǐng)域一樣可以細分。金融行業(yè)的信用模型和風(fēng)控模型/反欺詐模型、廣告模型的點擊預(yù)估模型、電商行業(yè)的推薦系統(tǒng)和用戶畫像系統(tǒng)。從需求提出到落地,數(shù)據(jù)挖掘工程師除了全程跟進也要熟悉業(yè)務(wù)。數(shù)據(jù)挖掘的工作范疇可以用于解決優(yōu)化問題,例如外賣行業(yè),如何尋找騎手效率大化的優(yōu)路徑。在大數(shù)匠教育也有這樣的實戰(zhàn)項目。
數(shù)據(jù)挖掘工程師往后發(fā)展,稱為算法專家。后者對理論要求更嚴(yán)苛,幾乎都要閱讀國外的前沿論文。方向不局限于簡單的分類或者回歸,還包括圖像識別、自然語言處理、智能量化投顧這種復(fù)合領(lǐng)域。這里開始會對從業(yè)者的學(xué)校和學(xué)歷提出要求,名校+碩士無疑是一個大優(yōu)勢,也有很多人直接做數(shù)據(jù)挖掘。
深度學(xué)習(xí)則更前沿,它由神經(jīng)網(wǎng)絡(luò)發(fā)展而來,是機器學(xué)習(xí)的一個子集。因為各類框架開枝散葉,諸多模型百花齊放,也可以算一個全新的分支。除了要求熟悉TensorFlow, Caffe, MXNet等深度學(xué)習(xí)框架,對模型的應(yīng)用和調(diào)參也是必備的。
(三)數(shù)據(jù)產(chǎn)品經(jīng)理
這個崗位有兩種理解,一種是具備強數(shù)據(jù)分析能力的PM,一種是公司數(shù)據(jù)產(chǎn)品的規(guī)劃者。
前者,以數(shù)據(jù)導(dǎo)向優(yōu)化和改進產(chǎn)品。在產(chǎn)品強勢的公司,數(shù)據(jù)分析也會劃歸到產(chǎn)品部門,甚至運營也屬于產(chǎn)品部。這類產(chǎn)品經(jīng)理有更多的機會接觸業(yè)務(wù),屬于順便把分析師的活也干了,一專多能的典型。
他們會運用不同的數(shù)據(jù)源,對用戶的行為特征分析和挖掘,達到改進產(chǎn)品。典型的場景就是AB測試。大到頁面布局、路徑規(guī)劃、小到按鈕的顏色和樣式,均可以通過數(shù)據(jù)指標(biāo)評估。俗話說,再優(yōu)秀的產(chǎn)品經(jīng)理也跑不過一半AB測試。此類數(shù)據(jù)產(chǎn)品經(jīng)理,更多是注重數(shù)據(jù)分析能力,擅長用分析進行決策。數(shù)據(jù)是能力的一部分。
后者,是真正意義上的數(shù)據(jù)產(chǎn)品經(jīng)理。在公司邁大邁強后,數(shù)據(jù)量與日俱增,此時會有不少數(shù)據(jù)相關(guān)的產(chǎn)品項目:包括大數(shù)據(jù)平臺、埋點采集系統(tǒng)、BI、推薦系統(tǒng)、廣告平臺等。這些當(dāng)然也是產(chǎn)品,自然需要提煉需求、設(shè)計、規(guī)劃、項目排期,乃至落地。
從職業(yè)發(fā)展上看,數(shù)據(jù)分析師做數(shù)據(jù)產(chǎn)品經(jīng)理更合適。普通的產(chǎn)品經(jīng)理,對前端、后端的技術(shù)棧尚未熟悉,何況日新月異的數(shù)據(jù)棧。大數(shù)匠教育研究發(fā)現(xiàn),這個崗位,適合對數(shù)據(jù)特別感興趣,但是數(shù)理天賦不高的職場人,那么以溝通、項目管理和需求規(guī)劃為能力,也不錯。
(四)數(shù)據(jù)工程師
數(shù)據(jù)工程師其實更偏技術(shù),從職業(yè)道路上看,程序員走這條路更開闊。在很多中小型的公司,一方面數(shù)據(jù)是無序的、缺失的、原始的,另外一方面各種業(yè)務(wù)報表又嗷嗷待哺。沒辦法,分析師只能自己擼起袖子,一個人當(dāng)三個人用。兼做數(shù)據(jù)清洗+ETL+BI。
如果分析師在技術(shù)方面的靈性不錯,那么技能點會往技術(shù)棧方向遷移。從最初的SQL,到了解Hadoop集群、了解presto/impala/spark、了解ELK、了解分布式存儲和NoSQL……這也是一個不錯的發(fā)展方向,因為數(shù)據(jù)挖掘需要了解算法/模型,理論知識要求過高,不少碩士和博士還過來搶飯碗,自己不擅長容易遇到天花板。選擇更底層的工程實現(xiàn)和架構(gòu),也是出路,根據(jù)大數(shù)匠教育畢業(yè)學(xué)員情況,薪資也不會低于數(shù)據(jù)挖掘/算法專家。
數(shù)據(jù)工程師,可以從數(shù)據(jù)分析師的SQL技能,往數(shù)據(jù)的底層收集、存儲、計算、運維拓展。往后發(fā)展則是數(shù)據(jù)總監(jiān)、或者數(shù)據(jù)架構(gòu)師。因為數(shù)據(jù)分析出身,與純技術(shù)棧的程序員比,思考會更貼合業(yè)務(wù),比如指標(biāo)背后的數(shù)據(jù)模型,但是技術(shù)底子的薄弱需要彌補。
另外,DBA、BI這些傳統(tǒng)的數(shù)據(jù)庫從業(yè)者,也是能按這條路線進階,或者選擇數(shù)據(jù)產(chǎn)品經(jīng)理方向。
(五)總結(jié):
以上四個崗位就是大數(shù)匠教育總結(jié)數(shù)據(jù)分析的發(fā)展方向,它們互有關(guān)聯(lián),如果從整個架構(gòu)來看,我們可以將其劃分為數(shù)據(jù)收集—數(shù)據(jù)加工—數(shù)據(jù)運營—數(shù)據(jù)觸達。大數(shù)據(jù)工程師偏底層技術(shù),數(shù)據(jù)分析偏上層業(yè)務(wù),數(shù)據(jù)挖掘和數(shù)據(jù)產(chǎn)品處于中間形態(tài)。不同公司雖然業(yè)務(wù)形態(tài)不一致,架構(gòu)會有差異,但是職責(zé)不會偏差太大。