數據科學、大數據和物聯網正在以令人炫目的速度發展和演進,而商業界正以緩慢的速度將更多來自不同渠道的數據整合起來,并能從中洞察更多信息。本文是 Andrew Dipper 對數據科學行業2017年的展望,并列舉了四大重要趨勢。
大數據技術的崛起
在過去一年,我們已經見證了大數據技術驚人的成長,但隨著大數據技術在企業界中被廣泛接受,下一年留給大數據技術的預算會快速增加。大多數企業已經確認需要在業務的數據方向上進行改進,這轉而會需要更多的數據科學家來處理企業需要檢索的大量額外數據。
如果你在追求一份數據科學領域的職業,那么有關大數據和數據框架的知識是必備的。你可以特別注意一下以下幾個平臺:Apache Hadoop, HDFS, Hbase, Spark, Storm, Solr 和 Kafka。
數據科學從業資格的變化
雖然 Elon Musk認為機器學習正在“召喚惡魔”,但是它仍將繼續發展。Amazon, Facebook 和 Google都在最近幾年加入到了人工智能的競賽中。在2017年,越來越多的企業會招募最頂尖的機器學習數據科學家。
但同時,工作崗位的競爭也變得更加激烈。在越來越多的大學將 AI 列入課程要求的背景下,從2017年開始,機器學習會成為數據科學行業入門的必備條件。如果你想在競爭中取得先機,有不少的AI和機器學習的認證課程供你選擇。雖然有一些課程的價格達到1萬美元,不過在 Coursera 或者 edX 上也有為數不少免費或低價的培訓課程。
如果你擁有很強的科技和編程能力,也能夠幫助你在數據科學領域獲得一席之地,尤其是 R 和 Python 語言。同時,SAS 和 MATLAB 的經驗自然也是加分項。
而且,你需要能夠自如地使用關系型數據庫,所以SQL也是一項非常重要的技能。在2015年一項綜合了 3500 個 Linkedin 招聘廣告的研究中,SQL被列為最重要的技能。另外,Hadoop, Python和 Java 也同樣流行。
物聯網和數據科學的融合
雖然存在一些關鍵的不同點,但是數據科學和物聯網經常被視為一個硬幣的兩面。數據科學家會更多地需要從設備中讀取實時數據,進行復雜的分析或以此作出決策。在這樣的背景下,這兩個行業在明年將會有更深的融合。