CIKM是人工智能領域的頂級國際會議,會議的目的是確定未來知識和信息系統(tǒng)發(fā)展面臨的挑戰(zhàn)性問題,并通過征集和審查高質量的應用和理論研究成果來塑造未來的研究方向,在學術和工業(yè)界都有巨大的影響力。此次入選意味著阿里云人工智能平臺 PAI自研的擴散模型算法和框架達到了全球業(yè)界先進水平,獲得了國際學者的認可,展現了中國人工智能技術創(chuàng)新在國際上的競爭力。
擴散模型在圖像生成領域的成功我們有目共睹。從 Latent Diffusion 到 Stable Diffusion,從驚艷的 Midjourney 到百花齊放的 Diffusion 開源社區(qū),擴散模型目前已然成為 AIGC 行業(yè)的最熱門研究方向之一。

圖 1:擴散模型的精美生成效果
然而,擴散模型生成精美圖像的代價是高昂的計算資源需求。與基于生成對抗網絡的方法不同,擴散模型的生成過程是迭代式的,因此需要多次調用模型,逐步消除圖像中的噪聲?,F有的一些加速算法通過設計“調度機”,構造完整生成過程的近似過程,減少迭代步數,提高生成速度。

圖 2:調度機算法構造的短步數近似過程
根據論文中的分析,調度機構造的近似過程本質上是線性子空間的擴張過程,論文中也給出了其中的幾何解釋,DDIM 算法在二維線性子空間中尋找近似解,而論文中提出的 OLSS 算法旨在更高維的線性子空間中求解。

圖 3:OLSS 算法的直觀幾何解釋
此外,OLSS 還使用一個路徑規(guī)劃算法進一步提升精度,在同等步數下,實現了更高的圖像質量。

圖 4:OLSS 算法與其他方法生成的圖像對比
目前,阿里云人工智能平臺 PAI已經上線了多種擴散模型的應用,例如快速部署AIGC Stable Diffusion SDWebUI繪畫的AI-Web應用及快速推理等。用戶可以登錄阿里云官網領取免費試用資源,快速體驗。
論文信息
論文標題:Optimal Linear Subspace Search: Learning to Construct Fast and High-Quality Schedulers for Diffusion Models
論文作者:段忠杰、汪誠愚、陳岑、黃俊、錢衛(wèi)寧
論文pdf鏈接:https://arxiv.org/abs/2305.14677

粵公網安備 44030702001206號