data-science
資料科學家 L 的奇幻旅程 Vol.1 新人不得不問的 2 個問題
為了讓有志成為資料科學家,或是單純想要了解的讀者們能理解資料科學是如何實際被企業應用,以及讓自己多一點反思的機會,趁著最近開始在 SmartNews 的新工作,我打算開始紀錄自己平常的工作內容以及一些經驗分享。作為系列文的第一篇文章,我們將探討一個資料科學家在進入新公司熟悉環境的時候,除了問該裝什麼工具以外,可以問的兩個重要問題。
揭開資料科學的神秘面紗
市面上有大量資料科學相關課程、書籍供我們自由學習,但你有想過為何我們需要學習資料科學嗎?為什麼資料科學現在那麼夯?我們應該拿資料科學來做什麼?抽離技術實作或者分析手法的討論,這篇文章試著用簡單的經濟學解釋其背後原因。希望閱讀完本文的讀者能了解為何資料科學在資訊時代扮演重要角色,以及我們要怎麼有效率地把握「資料科學力」以創造更大的價值。
為何資料科學家需要學習 SQL
這篇將簡單討論資料科學家必備的能力之一:結構化查詢語言(SQL)在概念上跟命令式程式語言如 Python 有什麼不同之處,以及在什麼樣的情況下我們會想要利用 SQL 做資料分析。這篇注重在為何你會想要使用 SQL 做資料分析,而非 SQL 本身功能的教學。如果要學習 SQL 本身,可以參考本文最後面的推薦閱讀。
資料科學家為何需要了解資料工程
透過描述資料科學家的一天日常,本文將簡單介紹資料工程(Data Engineering)的概念、其如何跟資料科學相關。以及最重要的,作為一個資料科學家應該如何學習並善用這些知識來創造最大價值。身為一個資料科學家,擁有資料工程的知識可以提升工作效率,點亮你的方向並加速專案前進。
Google Data Studio 基礎
Google Data Studio 是 Google 推出的一個儀表板服務,讓我們可以利用多種連結器將儲存在如 Google Analytics、 Google 試算表及 Google BigQuery 等特定資料來源的資料做出漂亮的 visualization ,用資料講故事而不用自己設計 UI。這篇把學到的一些技巧以及使用心得記錄下來。
Pelican 實戰手冊(主題篇)
Pelican 是一個用 Python 寫的靜態網頁生成器, 可以幫我們把 reStructedText, Markdown file 甚至 Jupyer notebook 轉成靜態的 HTML 檔案。 有些人可能已經注意到這個部落格是用 Pelican 所寫成並且 host 在 Github 上的。這篇主要紀錄如何使用 Jinja2 自訂主題。