數據分析師用哪個數據庫比較好?
數據分析師用哪個數據庫比較好?
我感覺這個問題有點脫離數據分析師的工作職責。
Word軟件,尤其是ppt和excel,常數據分析師廣泛使用,數據存儲和處理可以結合access。目前一般公司還是廣泛使用mysql,免費,輕量級,現在更多的都在用pg(postgresql)。
其次,分析師使用一些專業的分析軟件spss,獲取數據自我分析的BI軟件平臺:tableau、dc等。
其實我想強調的是,分析師可能60%的時間都花在數據的獲取、處理和準備上,所以sql是必然要用到的。個人認為分析師學習sql比了解數據庫要好,因為sql是一種標準化的數據查詢語言,所有的關系型數據庫,包括一些開源數據庫,甚至公司內部的數據平臺,都有很好的支持和兼容性。
最后,對于一些第三方的數據采集或者一些跨平臺的數據處理,包括一些分析,使用python可以輕松上手。
推薦一個網站學習這些內容:菜鳥教程。
怎么學好數據結構?
個人經驗學習很多計算機基礎課程建議遵循這一點,先抓住主要知識,解決主要矛盾。
在數據結構領域,我們首先要關注每種數據結構的特點(結構和何時使用)
例如:
有了數組為什么還需要鏈表?
樹形結構和上面兩種在存儲數據上有什么區別?(插入刪除搜索復雜度權衡?)
為什么在一般二分搜索法樹的基礎上出現了各種各樣的平衡二分搜索法樹?它們之間有什么區別?
堆在什么場景下用于存儲數據?哈希表用在什么場景?
要了解這些數據結構的成因和使用場景,我們自然需要知道它們的結構,以及它們的插入、刪除和搜索最重要的時間復雜度是多少,代價是什么(比如更多的空間),能帶來的特殊性是什么(比如heapO(1)時間獲取的最大/最小值)?
了解了數據結構的特點后,建議學習如何在自己熟悉的語言中使用。
比如cvector、list、stack、queue、set、map、unordered_set、unordered_map、priority_queue的底層數據結構是什么,在什么場景下,如何使用?配合做一些題,你就掌握了。
先掌握主干知識,就是不要去深究一棵紅黑樹的細節,比如左右手的細節或者各種哈希函數的細節,或者有多少優化(國內很多數據結構課程在這上面花了很多功夫)。這并不是說它們不重要,而是你需要在骨干建立之后,根據自己的需求去豐富細節。從一開始就鉆牛角尖很可能會讓你學得稀里糊涂...而你沒有。;Idon'我不知道學完這門課程有什么用...
