近日,一項與圖像生成技術相關的專利信息引起了業(yè)界的廣泛關注。據(jù)天眼查披露,該專利由北京百度網(wǎng)訊科技有限公司申請,具體名稱為“圖像生成模型的構建、生成方法及其相關裝置”。
該專利深入探討了圖像處理及人工智能領域的創(chuàng)新應用。其核心在于,通過一系列復雜的算法流程,實現(xiàn)圖像的高效、精準生成。具體而言,該方案首先收集大量的樣本圖像,并為之匹配相應的樣本提示詞。
接下來,這些樣本圖像會經(jīng)過一個名為第一預處理網(wǎng)絡的處理環(huán)節(jié),該環(huán)節(jié)能夠提取出圖像的控制條件和目標潛在空間編碼。與此同時,樣本提示詞則通過第二預處理網(wǎng)絡被轉換為文本向量,為后續(xù)步驟提供關鍵信息。
在獲取了上述關鍵信息后,專利提出了一種創(chuàng)新的訓練方法。該方法將目標潛在空間編碼、文本向量和控制條件作為輸入,送入一個待訓練的UNet網(wǎng)絡中。結合UNet網(wǎng)絡輸出的噪聲分布,進行多次迭代訓練,直至得到一個性能優(yōu)越的目標UNet網(wǎng)絡。
最終,基于第一預處理網(wǎng)絡、第二預處理網(wǎng)絡、訓練好的目標UNet網(wǎng)絡以及一個解碼器,構建出一個完整的圖像生成模型。這一模型不僅能夠根據(jù)給定的提示詞生成符合要求的圖像,還在圖像處理的效率和質量上實現(xiàn)了顯著提升。
這一專利的公布,標志著百度在圖像處理及人工智能領域的研究又邁出了重要一步。業(yè)界普遍認為,這一創(chuàng)新技術有望為圖像生成、圖像編輯等領域帶來革命性的變化,推動相關產業(yè)的進一步發(fā)展。