長久以來,一提到 “美圖公司”,大家能想到的都是 “美圖秀秀”、“美顏相機”、“美拍” 這些美顏類產品,而為這些產品提供 AI 技術支持的美圖影像實驗室(以下簡稱 MTlab)一直鮮為人知。
成立於 2010 年的 MTlab,早已不止是一個實驗室 —— 它在美圖產品線背後扮演著 “大腦” 的角色。在 MTlab 的工具箱裏,深度學習模型和 TensorFlow 是最有效的利器。
美圖各個產品的功能決定了,MTlab 會大量使用到計算機視覺技術。
“2013 年開始,MTlab 就用機器學習做計算機視覺方麵的研發。最早做的是人臉相關技術,以及美顏算法。”MTlab 負責人萬鵬飛告訴 PingWest 品玩,“那時開源工具還沒有現在這麽豐富,很多算法和工具需要自己手動實現。”
采用傳統機器學習來做計算機視覺的好處是,整個訓練過程完全透明,允許研發人員更好地評估訓練出來的算法,是否在訓練環境之外依然有效。但不足的地方是,人工提取特征的工作量大,而且魯棒性差。
萬鵬飛對 PingWest 品玩表示,當時他們麵臨的主要技術挑戰,正是“算法在各種極端用戶使用場景下的魯棒性”。
利用深度學習的卷積神經網絡模型,能很好解決這個問題。“深度學習這種數據驅動的方法,在魯棒性方麵比傳統計算機視覺算法有明顯優勢。”萬鵬飛說。
決定采用深度學習後,他們最早使用的框架是 Caffe。這個深度學習框架於 2013 年在 Github 上發布,作者是加州大學伯克利分校的賈揚清博士。
2015 年,Google 發布深度學習開源框架 TensorFlow,“MTlab 馬上就去了解這個工具”。2016 年,MTlab 開始在項目中嚐試用 TensorFlow。
萬鵬飛介紹道,MTlab 用 TensorFlow 最早做的是圖像去噪,整體感覺比較靈活,對自定義的網絡結構比較友好。一個靈活的深度學習框架對於算法自研很重要,因為很多實際的問題需要通過一些創新的方法解決,而一個好用的深度學習框架無疑能提高計算機視覺算法研發的效率。
很快,TensorFlow 憑借著靈活的特性成為了他們主要的深度學習框架。2016 年 MTlab 在用深度學習做人像分割功能時,初期使用 Caffe 實現自定義的卷積神經網絡層不太方便,需要自己實現前向 / 反向傳播算法。Debug(調試)操作起來也比較麻煩。
“後來使用了 TensorFlow,其基於 dataflow graph(數據流向圖)的計算結構對於自定義的深度學習操作很友好,也便於 debug。” 萬鵬飛說,“另外對循環神經網絡的支持也比較好,大大提高了研發效率。”
如今,TensorFlow 已經被應用在美圖旗下產品多個功能的網絡訓練中,如肢體關鍵點檢測、五官分析、人像分割、圖像畫質增強、天空分割。萬鵬飛對 TensorFlow 評價頗高:“TensorFlow 的分布式訓練能力,大大提高了深度學習網絡的訓練效率。”
萬鵬飛同時還提及 TensorFlow 社區對 MTlab 的幫助。完善的官方文檔說明、豐富的課程、以及對新手友好的互助氛圍,都吸引著更多開發者加入 TensorFlow 社區。
TensorFlow 官方也在努力促進社區的壯大。在今年的世界人工智能大會上, TensorFlow將舉辦“智在啟無限”主題論壇,邀請國內外不同領域,數十位重量級嘉賓,共同探討機器學習如何在商業中應用,幫助企業和開發者解決現實生活的問題:
TensorFlow 全球產品總監將深度解析機器學習的內核;通用電氣貝克休斯高級總監將分享如何確保安全生產、預測組件壽命和係統異常、避免意外停機;網易嚴選算法總監將分享如何實現季節性商品銷量預測、提升用戶點擊、節約倉儲和供應鏈成本;騰訊醫療大數據科學家將分享如何優化用戶意圖理解、為醫院、醫生和病人提供更優質的服務。還有一些前沿的機器學習研究者們也將來到本次論壇,分享機器學習在文化和藝術領域取得突破的經驗。
本文由隔壁老李于2022-12-21发表在极致时空,如有疑问,请联系我们。
本文链接:http://www.sebisome.icu/Nftls6/1077.html
有话要说...