近期有不少人向大數(shù)匠教育,有關(guān)數(shù)據(jù)分析的職業(yè)發(fā)展問題,可見隨著大數(shù)據(jù)時(shí)代到來,數(shù)據(jù)分析師的職業(yè)發(fā)展也備受關(guān)注。數(shù)據(jù)分析的路線大致可以劃分成:數(shù)據(jù)分析,數(shù)據(jù)挖掘,數(shù)據(jù)產(chǎn)品,數(shù)據(jù)工程四大方向。
(一)數(shù)據(jù)分析/數(shù)據(jù)運(yùn)營/商業(yè)分析
首先基礎(chǔ)的是業(yè)務(wù)方向的數(shù)據(jù)分析,也稱為數(shù)據(jù)運(yùn)營或者商業(yè)分析。絕大部分人都是從這個(gè)崗位開始自己的數(shù)據(jù)之路,也是基數(shù)大的崗位。由于基數(shù)大,這類崗位通常魚龍混雜。雖然都叫數(shù)據(jù)分析師,有的每天只和Excel表格打交道。而另一種,通過將業(yè)務(wù)數(shù)據(jù)體系化,建立一套指標(biāo)框架,監(jiān)控?cái)?shù)據(jù)的波動(dòng)和異常,找出問題建立和優(yōu)化指標(biāo)體系,優(yōu)化和驅(qū)動(dòng)業(yè)務(wù),推動(dòng)數(shù)據(jù)化運(yùn)營,找出可增長的市場(chǎng)或產(chǎn)品優(yōu)化空間。
數(shù)據(jù)思維和業(yè)務(wù)理解是分析師賴以生存的技能。很多時(shí)候,工具是錦上添花的作用。掌握Excel+SQL/hive,了解描述統(tǒng)計(jì)學(xué),知道常見的可視化表達(dá),足夠完成大部分任務(wù)。對(duì)于Python和機(jī)器學(xué)習(xí)來說只是加分項(xiàng)。
數(shù)據(jù)分析師是一個(gè)基礎(chǔ)崗位,如果專精于業(yè)務(wù),更適合往管理端發(fā)展,單純的工具和技巧很難拉開差距。數(shù)據(jù)分析的管理崗,比較常見的有數(shù)據(jù)運(yùn)營經(jīng)理/總監(jiān),數(shù)據(jù)分析經(jīng)理等,相對(duì)應(yīng)的能力是能建立指標(biāo)體系,并且解決日常的各類問題。
大數(shù)匠教育提示,作為新人,比較普適的發(fā)展路線是先成為一位數(shù)據(jù)分析師。積累相關(guān)的經(jīng)驗(yàn),在一兩年后,決定往后的發(fā)展,是數(shù)據(jù)挖掘,還是專精數(shù)據(jù)分析成為管理崗。
(二)數(shù)據(jù)挖掘/算法專家/深度學(xué)習(xí)
挖掘工程師要求更高的統(tǒng)計(jì)學(xué)能力、數(shù)理能力以及編程技巧。除了掌握算法,同樣需要編程能力去實(shí)現(xiàn),不論R、Python、Scala/Java,至少掌握一種。模型的實(shí)施,往往也要求Hadoop/Spark的工程實(shí)踐經(jīng)驗(yàn),精通SQL/Hive是必須的。因?yàn)橐蟾撸詳?shù)據(jù)挖掘的平均薪資高于數(shù)據(jù)分析師。
數(shù)據(jù)挖掘的業(yè)務(wù)領(lǐng)域一樣可以細(xì)分。金融行業(yè)的信用模型和風(fēng)控模型/反欺詐模型、廣告模型的點(diǎn)擊預(yù)估模型、電商行業(yè)的推薦系統(tǒng)和用戶畫像系統(tǒng)。從需求提出到落地,數(shù)據(jù)挖掘工程師除了全程跟進(jìn)也要熟悉業(yè)務(wù)。數(shù)據(jù)挖掘的工作范疇可以用于解決優(yōu)化問題,例如外賣行業(yè),如何尋找騎手效率大化的優(yōu)路徑。在大數(shù)匠教育也有這樣的實(shí)戰(zhàn)項(xiàng)目。
數(shù)據(jù)挖掘工程師往后發(fā)展,稱為算法專家。后者對(duì)理論要求更嚴(yán)苛,幾乎都要閱讀國外的前沿論文。方向不局限于簡單的分類或者回歸,還包括圖像識(shí)別、自然語言處理、智能量化投顧這種復(fù)合領(lǐng)域。這里開始會(huì)對(duì)從業(yè)者的學(xué)校和學(xué)歷提出要求,名校+碩士無疑是一個(gè)大優(yōu)勢(shì),也有很多人直接做數(shù)據(jù)挖掘。
深度學(xué)習(xí)則更前沿,它由神經(jīng)網(wǎng)絡(luò)發(fā)展而來,是機(jī)器學(xué)習(xí)的一個(gè)子集。因?yàn)楦黝惪蚣荛_枝散葉,諸多模型百花齊放,也可以算一個(gè)全新的分支。除了要求熟悉TensorFlow, Caffe, MXNet等深度學(xué)習(xí)框架,對(duì)模型的應(yīng)用和調(diào)參也是必備的。
(三)數(shù)據(jù)產(chǎn)品經(jīng)理
這個(gè)崗位有兩種理解,一種是具備強(qiáng)數(shù)據(jù)分析能力的PM,一種是公司數(shù)據(jù)產(chǎn)品的規(guī)劃者。
前者,以數(shù)據(jù)導(dǎo)向優(yōu)化和改進(jìn)產(chǎn)品。在產(chǎn)品強(qiáng)勢(shì)的公司,數(shù)據(jù)分析也會(huì)劃歸到產(chǎn)品部門,甚至運(yùn)營也屬于產(chǎn)品部。這類產(chǎn)品經(jīng)理有更多的機(jī)會(huì)接觸業(yè)務(wù),屬于順便把分析師的活也干了,一專多能的典型。
他們會(huì)運(yùn)用不同的數(shù)據(jù)源,對(duì)用戶的行為特征分析和挖掘,達(dá)到改進(jìn)產(chǎn)品。典型的場(chǎng)景就是AB測(cè)試。大到頁面布局、路徑規(guī)劃、小到按鈕的顏色和樣式,均可以通過數(shù)據(jù)指標(biāo)評(píng)估。俗話說,再優(yōu)秀的產(chǎn)品經(jīng)理也跑不過一半AB測(cè)試。此類數(shù)據(jù)產(chǎn)品經(jīng)理,更多是注重?cái)?shù)據(jù)分析能力,擅長用分析進(jìn)行決策。數(shù)據(jù)是能力的一部分。
后者,是真正意義上的數(shù)據(jù)產(chǎn)品經(jīng)理。在公司邁大邁強(qiáng)后,數(shù)據(jù)量與日俱增,此時(shí)會(huì)有不少數(shù)據(jù)相關(guān)的產(chǎn)品項(xiàng)目:包括大數(shù)據(jù)平臺(tái)、埋點(diǎn)采集系統(tǒng)、BI、推薦系統(tǒng)、廣告平臺(tái)等。這些當(dāng)然也是產(chǎn)品,自然需要提煉需求、設(shè)計(jì)、規(guī)劃、項(xiàng)目排期,乃至落地。
從職業(yè)發(fā)展上看,數(shù)據(jù)分析師做數(shù)據(jù)產(chǎn)品經(jīng)理更合適。普通的產(chǎn)品經(jīng)理,對(duì)前端、后端的技術(shù)棧尚未熟悉,何況日新月異的數(shù)據(jù)棧。大數(shù)匠教育研究發(fā)現(xiàn),這個(gè)崗位,適合對(duì)數(shù)據(jù)特別感興趣,但是數(shù)理天賦不高的職場(chǎng)人,那么以溝通、項(xiàng)目管理和需求規(guī)劃為能力,也不錯(cuò)。
(四)數(shù)據(jù)工程師
數(shù)據(jù)工程師其實(shí)更偏技術(shù),從職業(yè)道路上看,程序員走這條路更開闊。在很多中小型的公司,一方面數(shù)據(jù)是無序的、缺失的、原始的,另外一方面各種業(yè)務(wù)報(bào)表又嗷嗷待哺。沒辦法,分析師只能自己擼起袖子,一個(gè)人當(dāng)三個(gè)人用。兼做數(shù)據(jù)清洗+ETL+BI。
如果分析師在技術(shù)方面的靈性不錯(cuò),那么技能點(diǎn)會(huì)往技術(shù)棧方向遷移。從最初的SQL,到了解Hadoop集群、了解presto/impala/spark、了解ELK、了解分布式存儲(chǔ)和NoSQL……這也是一個(gè)不錯(cuò)的發(fā)展方向,因?yàn)閿?shù)據(jù)挖掘需要了解算法/模型,理論知識(shí)要求過高,不少碩士和博士還過來搶飯碗,自己不擅長容易遇到天花板。選擇更底層的工程實(shí)現(xiàn)和架構(gòu),也是出路,根據(jù)大數(shù)匠教育畢業(yè)學(xué)員情況,薪資也不會(huì)低于數(shù)據(jù)挖掘/算法專家。
數(shù)據(jù)工程師,可以從數(shù)據(jù)分析師的SQL技能,往數(shù)據(jù)的底層收集、存儲(chǔ)、計(jì)算、運(yùn)維拓展。往后發(fā)展則是數(shù)據(jù)總監(jiān)、或者數(shù)據(jù)架構(gòu)師。因?yàn)閿?shù)據(jù)分析出身,與純技術(shù)棧的程序員比,思考會(huì)更貼合業(yè)務(wù),比如指標(biāo)背后的數(shù)據(jù)模型,但是技術(shù)底子的薄弱需要彌補(bǔ)。
另外,DBA、BI這些傳統(tǒng)的數(shù)據(jù)庫從業(yè)者,也是能按這條路線進(jìn)階,或者選擇數(shù)據(jù)產(chǎn)品經(jīng)理方向。
(五)總結(jié):
以上四個(gè)崗位就是大數(shù)匠教育總結(jié)數(shù)據(jù)分析的發(fā)展方向,它們互有關(guān)聯(lián),如果從整個(gè)架構(gòu)來看,我們可以將其劃分為數(shù)據(jù)收集—數(shù)據(jù)加工—數(shù)據(jù)運(yùn)營—數(shù)據(jù)觸達(dá)。大數(shù)據(jù)工程師偏底層技術(shù),數(shù)據(jù)分析偏上層業(yè)務(wù),數(shù)據(jù)挖掘和數(shù)據(jù)產(chǎn)品處于中間形態(tài)。不同公司雖然業(yè)務(wù)形態(tài)不一致,架構(gòu)會(huì)有差異,但是職責(zé)不會(huì)偏差太大。