報告題目:視覺Transformer模型結構設計及其應用
報 告 人: 張敬 副教授
報告時間:2024年01月11日(周四)10:00-11:00
報告地點:逸夫樓445A(線上)
研究生院 電氣與控制工程學院
2024年1月10日
報告人簡介:
張敬,博士,2015年畢業(yè)于中國科學技術大學自動化系,目前在悉尼大學計算機系從事博士后研究,主要從事計算機視覺與深度學習等人工智能領域的相關科學研究工作,在 CCF A類國際會議/期刊以及IEEE 匯刊等國際著名期刊已發(fā)表學術論文90余篇,谷歌學術引用6200余次。長期擔任著名國際學術期刊和會議審稿人、程序委員會委員、高級程序委員會委員及領域主席。2023年晉升為美國電氣和電子工程師協(xié)會(IEEE)高級會員。提出的ViTAE Transformer可廣泛應用于圖像分類、目標檢測、語義分割、視頻實例分割、圖像摳圖、目標跟蹤、文字檢測和識別、遙感圖像分析等多個領域,取得了非常有競爭力的結果,相關GitHub倉庫關注量超過5000。該模型在相關比賽或者公開數(shù)據(jù)集多次名列第一,受到廣泛關注。