Menu
2019-07-10 (Wed)
3,933 views

進擊的 BERT:NLP 界的巨人之力與遷移學習

這篇是給所有人的 BERT 科普文以及操作入門手冊。文中將簡單介紹知名的語言代表模型 BERT 以及如何用其實現兩階段的遷移學習。讀者將有機會透過 PyTorch 的程式碼來直觀理解 BERT 的運作方式並實際 fine tune 一個真實存在的假新聞分類任務。閱讀完本文的讀者將能把 BERT 與遷移學習運用到其他自己感興趣的 NLP 任務。

2019-06-17 (Mon)
3,248 views

淺談神經機器翻譯 & 用 Transformer 與 TensorFlow 2 英翻中

本文分為兩大部分。前半將帶讀者簡單回顧 Seq2Seq 模型、自注意力機制以及 Transformer 等近年在機器翻譯領域裡頭的重要發展與概念;後半段則將帶著讀者實作一個可以將英文句子翻譯成中文的 Transformer。透過瞭解其背後運作原理,讀者將能把類似的概念應用到如圖像描述、閱讀理解以及語音辨識等各式各樣的機器學習任務之上。

2018-12-24 (Mon)
11,815 views

進入 NLP 世界的最佳橋樑:寫給所有人的自然語言處理與深度學習入門指南

在此文中,我們以一個假新聞分類的 Kaggle 競賽做為引子,不用深奧的數學計算式,而是直觀且高層次地理解目前常見的 NLP 手法以及基本的深度學習、機器學習概念。透過建立一個能夠分類假新聞的神經網路,你將會學到如文本數據前處理、循環神經網路以及深度學習 3 步驟等基礎知識,並在未來利用此基礎進一步探索 NLP 世界。

2018-11-26 (Mon)
3,380 views

Chartify:讓數據科學家效率加倍的 Python 資料視覺化工具

此文會展示如何利用 Chartify,一個直觀且貼心的 Python 繪圖函式庫,來對如 2018 臺北市候選人得票數、歷年各大洲來台人數等公開數據做資料視覺化。如果你想要學習利用 Python 實現資料視覺化,但還不知道怎麼開始;或是覺得目前使用的工具不太直覺,想要提升自己工作效率的話,這篇就是為你而寫的。

2018-11-09 (Fri)
799 views

資料科學家 L 的奇幻旅程 Vol.2 如何用資料工程當個時間旅人

「資料工程」與「時間旅行」,兩個看似毫無相關的詞能擦出什麼火花?在這篇文章裡頭,我想跟你分享一個輕鬆話題:身為資料科學家的我,是如何利用資料工程在公司裡頭當個「時間旅人」的。當然,實際上每家公司的 DS 以及 DE 的工作內容都會有所不同,了解這個事實並調整期待,將幫助你找到最適合自己的工作環境。

...