HomeProjects信息及通訊科技多媒體實驗室 — 人工智能研究先鋒

多媒體實驗室 — 人工智能研究先鋒

項目簡介

項目負責人

  • 湯曉鷗教授

    信息工程學系

  • 林達華教授

    信息工程學系

  • 周博磊教授

    信息工程學系

  • 王曉剛教授

    電子工程學系

  • 李鴻升教授

    電子工程學系

  • Award

    – 最佳論文獎,IEEE計算機視覺與模式識別國際大會2009
    – 最佳學生論文獎,AAAI人工智能國際大會2015
    – 第一名,物體檢測項目,COCO國際挑戰賽2018
    – 第一名,物體檢測、視頻中物體檢測、場景分割項目,ImageNet國際挑戰賽2016
    – 第一名,視頻中的物體檢測項目,ImageNet國際挑戰賽2015
    – 第一名,未修剪視頻分類項目,Activity國際挑戰賽2016

香港中文大學多媒體實驗室由湯曉鷗教授創辦於2001年7月。該實驗室目前有五名教授和超過40名博士研究生組成,研究方向包括計算機視覺、機器學習、深度學習。在世界科技峰會GTC 2016上,中大多媒體實驗室被評選為世界10大AI實驗室之一。實驗室成員在多個學術會議上獲得最佳論文獎(包括IEEE計算機視覺與模式識別國際大會2009最佳論文獎以及AAAI人工智能國際大會2015最佳學生論文獎),並在多個計算機視覺國際挑戰賽奪得第一名。因實驗室研究成果出眾,實驗室多位學生獲得谷歌博士研究生獎學金、微軟亞洲研究院獎學金、以及香港博士研究生獎學金等各類獎學金資助。湯曉鷗教授同時創立了商湯科技,目前是世界上估值最高的人工智能創業公司。

香港中文大學多媒體實驗室提出了世界上第一個超過人眼性能的人臉識別算法。2015年,在大規模人臉識別評測數據集LFW,中大多媒體實驗室提出的人臉識別算法準確率達到98.52%,首次超過人眼97.53%的準確率。
香港中文大學團隊(MMDet)獲得COCO 2018物體檢測國際挑戰賽冠軍,並且開源了他們的物體檢測及實例分割框架mmdetection,受到業界的廣泛關注與好評。物體檢測任務要求檢測圖片中屬於特定類別的所有物體並用邊界框標出,實例分割進一步要求標出邊界框內物體的輪廓。圖中展示了香港中文大學團隊演算法在COCO 2018物體檢測國際挑戰賽的效果。
圖像超分辨率是由低分辨率的輸入圖得到高分辨率的輸出圖。香港中文大學多媒體實驗室提出了世界上第一個將深度學習應用到圖像超分辨率上的算法SRCNN。 相關論文被頂級國際期刊TPAMI評選為2016年3月至今「最受歡迎文章」之一。 實驗室隨後的超分辨工作(ESRGAN)也繼續保持世界領先水準。
香港中文大學多媒體實驗室在很多底層圖像算法上有成果, 比如圖像風格轉換,圖像超分辨率等,並提出了連續可調節的圖像編輯算法,可以在多種任務上實現圖像的連續變換。
香港中文大學多媒體實驗提出了一項視覺問答系統,能夠自動回答關於一副輸入圖像的相關問題。提出的算法在VQA 2.0標準測試集上達到世界領先水平並被選為2019 IEEE計算機視覺與模式識別國際大會口頭報告論文。

Do you like our project?

MORE TO EXPLORE