報 告 人:張林峰,上海交通大學人工智能學院
報告時間:2024年11月23日(周六)14:00-16:30
報告地點:中國農業大學東區 信息與電氣工程學院 237會議室
聯 系 人:馬老師 13391809180
聯系郵箱:sockline@163.com
報告人簡介:
張林峰,上海交通大學人工智能學院助理教授,博士生導師。2024年6月在清華大學交叉信息研究院獲博士學位。他的研究方向為高效的人工智能(Efficient AI),包括大模型、圖像視頻生成模型、人工智能數據集的壓縮與加速等。他在CCF-A等高水平學術會議與期刊上發表第一作者和通訊作者論文二十余篇,被引用2000余次,擔任NeurIPS,ICLR,ICML,CVPR,ICCV等多個學術會議的審稿人,曾獲北京市優秀畢業生,清華大學優秀博士論文,微軟學者獎學金(亞洲共十二名)等。
報告摘要:
近年來,基于擴散模型的圖像、視頻生成技術迅速發展,掀起了AIGC(基于人工智能的內容創作)的浪潮,推動了內容創作領域的革命。然而,與傳統的生成式模型相比,擴散模型所具有的獨特的多步生成機制導致其計算成本極高,在實際應用中響應速度過慢,限制了擴散模型的商業化應用。另一方面,傳統模型壓縮技術中的剪枝、蒸餾方法雖然有效,但訓練成本極高,在實際應用中存在局限性。本次報告主要介紹張林峰助理教授在擴散模型在推理階段的加速方法,主要包括詞元裁剪技術與特征緩存技術。這些方法在不需要訓練和數據的前提下成功地將擴散模型的推理速度加速10倍以上,同時并不損失模型的生成效果。此外,該報告也將介紹在當前視覺生成加速領域仍然存在的諸多挑戰。