Menu

Hello There

I am Meng Lee,
a data scientist / engineer
based in Tokyo.

About

More About Me

現居東京的資料科學家。致力於將數據科學與資料工程做完美結合
假日在東京市區騎著腳踏車冒險、尋找美食。懶得動時就待在咖啡廳寫寫程式

All of us are unique.

依照不同業界、不同的環境需求,甚至是所處的企業的發展階段,一個資料科學家(Data Scientist)所累積的經驗、點的技能都會有所不同。 更遑論是一個像我一樣,從軟體工程做到資料工程,又轉到資料科學家的人了。

資料科學是透過理解資料,從資料中萃取有意義的價值與洞見。而為了達到這目的, 有很多領域需要了解:大數據、BI、程式設計、資料分析、統計概念、資料視覺化、機器學習、雲端運算 ... 族繁不及備載。

要客觀且定量地衡量一個資料科學家在以上各領域的專業程度不容易。我試著以最熟悉的資料工程為基準, 設置熟悉度為 100 %,則在與其他領域比較之後,可以得到對應的相對分數。最後就成了右邊(或者下面)這個超級主觀的衡量表,博君一笑。

歡迎跟我說說你在各領域的熟悉程度

I'm familiar with..

  • 50%
    商業智慧
  • 65%
    資料視覺化
  • 100%
    資料工程
  • 75%
    程式設計
  • 55%
    資料分析
  • 70%
    機器學習

My Work Experience.

2018/06 - 現在

SmartNews

Data Scientist

「成為完美結合資料工程與資料科學的資料科學家」。
分析部分專注在建立預測顧客價值(Life Time Value)、每日活躍使用者人數等重要 KPI 的預測模型。 資料工程則包含改善並維護資料管理平台,以建立一個更有效率且可簡單共享分析結果的資料科學環境。

2017/01 - 2018/06

MarketEnterprise Co

Data Scientist

分析銷售資料以及實作資料工程。依不同專案進行 ad hoc 分析並直接提供洞見與建議給決策管理者,以增加營收或改善員工生產力; 實作企業用儀表板(Dashboard)背後所需的資料匯總、套用商業邏輯以及資料處理排程;建立非技術人員也能使用的 SQL 分析平台; 設計並實作預測模型以評估顧客成交率等 KPI。

2016/06 - 2017/01

MarketEnterprise Co

Software Engineer

主要專注在利用 Python 以及 AWS 來設計資訊系統以及開發企業內部系統所需的 API 。 如使用 AWS Lambda 進行資料流的處理(ETL)、開發並改善電子商務網站的搜尋引擎(主要使用 MongoDBElasticSearch )。

2013/09 - 2015/06

National Taiwan University

Master of Information Management

研究領域包含資料探勘以及推薦系統。 論文 An Effective Friend Recommendation Method Using Learning to Rank and Social Influence 的共同作者, 該論文被登錄在 Pacific Asia Conference on Information Systems (PACIS)。另擔任演算法、資料結構以及資料探勘等課程之助教。

Portfolio

See My Latest Projects.

一些閒暇時間做的小玩意兒,你或許會有興趣了解:)

貓咪辨識 App

TensorFlow, Flask, Docker, Heroku

這是一個利用 TensorFlow 以及 Flask 來分辨貓咪以及狗狗的圖片辨識應用,使用 Docker 封裝並部署在 Heroku 上。你可以前往 Github 查看細節。

Gist x Evernote 同步工具

Selenium, Github GraphQL, Evernote Python SDK

這是一個利用 Selenium 將 Github Gists 同步到 Evernote 的生產工具。你可以在 Github 查看細節。

GapMinder 中文版

資料視覺化, 台灣, GapMinder

這是一個利用各國公開數據來探索世界以及台灣的資料視覺化工具。你可以在我的部落格文章如何用 30 秒了解台灣發展與全球趨勢:用 GapMinder 培養正確世界觀實際使用此工具並了解細節

漫畫連載通知 App

Airflow, Selenium, Slack

這是一個透過 Airflow 以及 Slack 來通知最新漫畫連載的 App。你可以在我的部落格文章一段 Airflow 與資料工程的故事:談如何用 Python 追漫畫連載了解細節,或者直接去 Github 查看程式碼。

Coming Soon

Coming Soon

Coming Soon

Coming Soon

Journal

Latest From The Blog.

不只是資料科學家,處在資訊時代的各行各業都需要能活用資料科學的人才。
透過分享自己的學習心得以及業界經驗,我希望讓更多人接觸到資料科學的奧秘。
部落格主要會提及資料科學資料工程機器學習資料視覺化技巧

2018-11-26 (Mon)
1,788 views

Chartify:讓數據科學家效率加倍的 Python 資料視覺化工具

此文會展示如何利用 Chartify,一個直觀且貼心的 Python 繪圖函式庫,來對如 2018 臺北市候選人得票數、歷年各大洲來台人數等公開數據做資料視覺化。如果你想要學習利用 Python 實現資料視覺化,但還不知道怎麼開始;或是覺得目前使用的工具不太直覺,想要提升自己工作效率的話,這篇就是為你而寫的。

2018-11-09 (Fri)
577 views

資料科學家 L 的奇幻旅程 Vol.2 如何用資料工程當個時間旅人

「資料工程」與「時間旅行」,兩個看似毫無相關的詞能擦出什麼火花?在這篇文章裡頭,我想跟你分享一個輕鬆話題:身為資料科學家的我,是如何利用資料工程在公司裡頭當個「時間旅人」的。當然,實際上每家公司的 DS 以及 DE 的工作內容都會有所不同,了解這個事實並調整期待,將幫助你找到最適合自己的工作環境。

2018-10-26 (Fri)
411 views

資料科學文摘 Vol.7 數據技能、深度學習以及 AI 的倫理道德

今天讓我跟你分享 4 篇跟數據以及人工智慧相關的文章。在第一篇文章,我們將看到如何用一個簡單、有效的方式來決定應該學習什麼「數據技能」;在第二篇文章,我們則會看到如何透過數據,了解網際網路是如何快速發展成為人們每天不可或缺的一部分。接著我們會聽聽在計算神經科學領域的先驅之一,泰瑞教授解釋何謂「深度學習」以及 AI 與人類智慧如何擦出火花;最後,我們將一窺 AI 的倫理道德議題以及著名的電車難題。

...

Get Latest Arrivals

跟資料科學相關的最新文章直接送到家。
只要加入訂閱名單,當新文章出爐時,
你將能馬上收到通知

34

Articles

33576

Curious Visitors

211

Passion Subscribers

75884

Page Views

Contact

Say Hello.

歡迎各種回饋以及建議 關於資料科學,可以說說你有興趣了解的議題,或者提醒一些文章需要補足的地方,我會加以改進並考慮寫相關文章。 另外如果你有任何有趣的資料科學專案、資源或者任何想要分享的東西,都歡迎透過以下表單聯絡我

Sending...
Something went wrong. Please try again.
Your message was sent, thank you!

Email

b98705001 AT gmail.com
meng.lee AT smartnews.com

Address

東京都目黑區
日本