監控資本主義時代下的資料科學、AI 與你我的數位未來

這是一篇講述監控資本主義的驚悚輕小說與科普文。處在數位時代的每個人都需要了解谷歌、臉書與推特等科技巨頭如何形塑我們的數位現實以及其背後運作的商業邏輯與經濟誘因。文中也會清晰地呈現資料科學與監控資本主義之間的緊密關係。閱讀完本文的讀者將能重新找回數位時代中最重要的注意力並專注在真正重要的事情。

2020-01-06 (Mon)
137,554 views

世上最生動的 PCA：直觀理解並應用主成分分析

這篇文章用世上最生動且實務的方式帶你直觀理解機器學習領域中十分知名且強大的線性降維技巧：主成分分析 PCA。我們將重新回顧你所學過的重要線性代數概念，並實際應用這些概念將數據有效地降維並去除特徵間的關聯。你也將學會如何使用 NumPy 和 scikit-learn 等 Python 函式庫自己實作 PCA。文中也分享使用 PCA 分析線上遊戲《英雄聯盟》公開數據的有趣案例。

PCA 主成分分析機器學習線性代數 Python

2019-10-13 (Sun)
50,523 views

給所有人的深度學習入門：直觀理解神經網路與線性代數

這是篇透過大量動畫幫助你直觀理解神經網路的科普文。我們將介紹基礎的神經網路與線性代數概念，以及兩者之間的緊密關係。我們也將實際透過神經網路解決二元分類任務，了解神經網路的運作原理。讀完本文，你將能夠深刻地體會神經網路與線性代數之間的緊密關係，奠定 AI 之旅的基礎。

深度學習 Manim TensorFlow

2019-09-07 (Sat)
43,024 views

直觀理解 GPT-2 語言模型並生成金庸武俠小說

這篇文章將簡單向讀者介紹 OpenAI 的知名語言模型 GPT-2，並展示能夠生成金庸小說的 GPT-2 模型。文中也將透過視覺化工具 BertViz 來帶讀者直觀了解基於 Transformer 架構的 NLP 模型背後的自注意力機制。讀者也能透過文中提供的 GPT-2 模型及 Colab 筆記本自行生成全新的金庸橋段。

自然語言處理 NLP PyTorch

2019-07-27 (Sat)
199,305 views

資料科學家的 pandas 實戰手冊：掌握 40 個實用數據技巧

熟練地使用 pandas 是資料科學家處理數據與分析時不可或缺的重要技能之一。透過 40 個 pandas 實用技巧，這篇文章將帶你由淺入深地掌握最基礎且重要的 pandas 能力。文中也將介紹多個適合與 pandas 一起使用的強大函式庫，提升你的數據處理能力。

資料科學 Python pandas

2019-07-10 (Wed)
205,512 views

進擊的 BERT：NLP 界的巨人之力與遷移學習

這篇是給所有人的 BERT 科普文以及操作入門手冊。文中將簡單介紹知名的語言代表模型 BERT 以及如何用其實現兩階段的遷移學習。讀者將有機會透過 PyTorch 的程式碼來直觀理解 BERT 的運作方式並實際 fine tune 一個真實存在的假新聞分類任務。閱讀完本文的讀者將能把 BERT 與遷移學習運用到其他自己感興趣的 NLP 任務。

自然語言處理 NLP PyTorch

2019-06-17 (Mon)
87,662 views

淺談神經機器翻譯 & 用 Transformer 與 TensorFlow 2 英翻中

本文分為兩大部分。前半將帶讀者簡單回顧 Seq2Seq 模型、自注意力機制以及 Transformer 等近年在機器翻譯領域裡頭的重要發展與概念；後半段則將帶著讀者實作一個可以將英文句子翻譯成中文的 Transformer。透過瞭解其背後運作原理，讀者將能把類似的概念應用到如圖像描述、閱讀理解以及語音辨識等各式各樣的機器學習任務之上。

自然語言處理 NLP Tensorflow

2019-05-05 (Sun)
18,507 views