Menu

Hello There

I am Meng Lee,
a ML engineer / data
scientist based in Tokyo.

About

More About Me

現居東京的機器學習工程師 / 資料科學家。喜歡分析數據並做做有趣的 AI 實驗
假日在東京市區騎著腳踏車冒險、尋找美食。懶得動時就待在咖啡廳寫寫程式

All of us are unique.

依照不同業界與環境需求,一個機器學習工程師或是資料科學家所需的經驗以及點的技能都會有所不同。 更遑論是一個像我一樣在軟體工程、資料工程、資料科學以及機器學習領域打滾的人了。

資料科學是透過理解資料,從資料中萃取有意義的價值與洞見。而為了達到這目的, 有很多領域需要了解:大數據、BI、程式設計、資料分析、統計概念、資料視覺化、機器學習、雲端運算 ... 族繁不及備載。

要客觀且定量地衡量一個資料科學家在以上各領域的專業程度不容易。我試著以自己目前最為熟悉的深度學習為基準, 設置熟悉度為 100 %,則在與其他領域比較之後,可以得到對應的相對分數。最後就成了右邊(或者下面)這個超級主觀的衡量表,博君一笑。

歡迎跟我說說你在各領域的熟悉程度

I'm familiar with..

  • 100%
    深度學習
  • 75%
    資料視覺化
  • 60%
    資料工程
  • 65%
    程式設計
  • 70%
    資料分析
  • 80%
    機器學習

My Work Experience.

2018/06 - 現在

SmartNews

Data Scientist

「成為完美結合資料工程與資料科學的資料科學家」。
分析部分專注在建立預測顧客價值(Life Time Value)、每日活躍使用者人數等重要 KPI 的預測模型。 資料工程則包含改善並維護資料管理平台,以建立一個更有效率且可簡單共享分析結果的資料科學環境。

2017/01 - 2018/06

MarketEnterprise Co

Data Scientist

分析銷售資料以及實作資料工程。依不同專案進行 ad hoc 分析並直接提供洞見與建議給決策管理者,以增加營收或改善員工生產力; 實作企業用儀表板(Dashboard)背後所需的資料匯總、套用商業邏輯以及資料處理排程;建立非技術人員也能使用的 SQL 分析平台; 設計並實作預測模型以評估顧客成交率等 KPI。

2016/06 - 2017/01

MarketEnterprise Co

Software Engineer

主要專注在利用 Python 以及 AWS 來設計資訊系統以及開發企業內部系統所需的 API 。 如使用 AWS Lambda 進行資料流的處理(ETL)、開發並改善電子商務網站的搜尋引擎(主要使用 MongoDBElasticSearch )。

2013/09 - 2015/06

National Taiwan University

Master of Information Management

研究領域包含資料探勘以及推薦系統。 論文 An Effective Friend Recommendation Method Using Learning to Rank and Social Influence 的共同作者, 該論文被登錄在 Pacific Asia Conference on Information Systems (PACIS)。另擔任演算法、資料結構以及資料探勘等課程之助教。

Portfolio

See My Latest Projects.

一些閒暇時間做的小玩意兒,你或許會有興趣瞧瞧:)
點擊各圖片來查看細節或是利用各圖左上角的傳送門

從 COVID-19 看台灣與世界

了解如何開始使用 Python 視覺化並分析台灣與世界的 COVID-19 疫情

在這個專案裡頭,我透過一系列專欄文章引領讀者存取 COVID-19 的公開數據並了解如何繪製如衛福部疾管署首頁所呈現的疫情趨勢。 每篇專欄都有對應的 Colab 並包含用來生成圖表的 Python 程式碼,希望能鼓勵更多人深入探索數據,進而發現對社會有用的新洞見。

由淺入深的 AI 與深度學習資源

大量優質的 AI 與深度學習的線上資源,適合各個學習階段的你進一步探索

我將線上的深度學習資源做些整理並逐一介紹。你可以在由淺入深的深度學習資源整理了解細節,或者直接去專屬的 Github Repo 關注並查看所有資源。

GapMinder 中文版

利用公開數據來探索全世界以及台灣的動態資料視覺化工具

這是一個利用各國公開數據來探索世界以及台灣的資料視覺化工具。你可以在如何用 30 秒了解台灣發展與全球趨勢:用 GapMinder 培養正確世界觀實際使用此工具並了解細節

用 CartoonGAN 畫日本動漫

讓任何人都可以使用對抗生成網路 GAN 來生成動漫的一個 TensorFlow 2 專案

漫畫連載通知 App

透過 Airflow 以及 Slack 來通知最新漫畫連載的應用

這是一個透過 Airflow 以及 Slack 來通知最新漫畫連載的 App。你可以在一段 Airflow 與資料工程的故事:談如何用 Python 追漫畫連載了解細節,或者直接去 Github 查看程式碼。

Gist x Evernote 同步工具

利用 Selenium 將 Github Gists 同步到 Evernote 的生產工具

這是一個利用 Selenium 將 Github Gists 同步到 Evernote 的生產工具。你可以在 Github 查看細節。

天龍八部小說生成器

利用 TensorFlow 2.0 及 TensorFlow.js 生成似真似假的武俠小說

展示一個由 TensorFlow 2.0 以及 TensorFlow.js 實現的線上文本生成應用。你可以前往讓 AI 寫點金庸:如何用 TensorFlow 2.0 及 TensorFlow.js 寫天龍八部了解詳情。

AI 如何找出你的喵

一個利用 TensorFlow 以及 Flask 實做的貓狗辨識應用

這是一個利用 TensorFlow 以及 Flask 來分辨貓咪以及狗狗的圖片辨識應用,使用 Docker 封裝並部署在 Heroku 上。你可以閱讀 AI 如何找出你的喵:直觀理解卷積神經網路 來了解細節並實際使用該神經網路。

Journal

Latest From The Blog.

不只是資料科學家,處在資訊時代的各行各業都需要能活用資料科學的人才。
透過分享自己的學習心得以及業界經驗,我希望讓更多人接觸到資料科學的奧秘。
部落格主要會提及資料科學資料工程機器學習資料視覺化技巧

2021-01-25 (Mon)
6,405 views

監控資本主義時代下的資料科學、AI 與你我的數位未來

這是一篇講述監控資本主義的驚悚輕小說與科普文。處在數位時代的每個人都需要了解谷歌、臉書與推特等科技巨頭如何形塑我們的數位現實以及其背後運作的商業邏輯與經濟誘因。文中也會清晰地呈現資料科學與監控資本主義之間的緊密關係。閱讀完本文的讀者將能重新找回數位時代中最重要的注意力並專注在真正重要的事情。

2020-01-06 (Mon)
137,554 views

世上最生動的 PCA:直觀理解並應用主成分分析

這篇文章用世上最生動且實務的方式帶你直觀理解機器學習領域中十分知名且強大的線性降維技巧:主成分分析 PCA。我們將重新回顧你所學過的重要線性代數概念,並實際應用這些概念將數據有效地降維並去除特徵間的關聯。你也將學會如何使用 NumPy 和 scikit-learn 等 Python 函式庫自己實作 PCA。文中也分享使用 PCA 分析線上遊戲《英雄聯盟》公開數據的有趣案例。

2019-10-13 (Sun)
50,523 views

給所有人的深度學習入門:直觀理解神經網路與線性代數

這是篇透過大量動畫幫助你直觀理解神經網路的科普文。我們將介紹基礎的神經網路與線性代數概念,以及兩者之間的緊密關係。我們也將實際透過神經網路解決二元分類任務,了解神經網路的運作原理。讀完本文,你將能夠深刻地體會神經網路與線性代數之間的緊密關係,奠定 AI 之旅的基礎。

...

Get Latest Arrivals

跟資料科學相關的最新文章直接送到家。
只要加入訂閱名單,當新文章出爐時,
你將能馬上收到通知

46

Articles

549297

Curious Visitors

1363

Passion Subscribers

1406829

Page Views

Contact

Say Hello.

歡迎各種回饋以及建議 關於機器學習、人工智慧以及資料科學,可以跟我說說你有興趣了解的議題,或者提醒一些文章需要補足的地方,我會加以改進並撰寫相關文章。 另外如果你有任何有趣的資料科學專案、資源或者任何想要分享的東西,都歡迎透過以下表單聯絡我

發送訊息中...
Oh no!訊息寄送失敗,請查看你的網路連線並再度嘗試。
你的訊息成功寄出,我會盡快查看並與你聯絡:)

Email

b98705001 AT gmail.com
meng.lee AT smartnews.com

Address

東京都目黑區
日本