更多

    阿里雲 AI 繪畫大模型「通義萬相」 改變圖像風格生成新圖片

    生成式 AI 技術仍然在發展,從文字至影片編輯,再有繪畫創作。市場上的 AI 繪畫創作平台愈生愈多, Images.ai 、 GetIMG 、 NightCafe 、 Shutterstock 、 DALL-E 2 、 DeepAI 等等多到十隻手指數不完。阿里雲亦加入這行列,在 4 月發布 AI 語言模型「通義千問」後,再推出 AI 繪畫模型「通義萬相」,並已開放給中國內地企業客戶測試

    阿里雲使用其自行研發的大模型 Composer 開發「通義萬相」,可控制最終輸出圖像,如空間佈局和調色板,同時確保圖像合成兼具品質和創意。「通義萬相」目前能處理多種任務,可依據中英文文字指令生成不同風格的圖像,包括水彩畫、油畫、國畫、動畫、素描、平面插畫和 3D 卡通;亦可透過風格遷移改變圖像風格,即保留原始圖像的內容同時應用另一圖像的視覺效果變成新的圖像。此外,透過改善基於訊噪比的高解析度擴散過程,該模型可在構圖準確度及細節清晰度之間取得平衡。

    阿里雲智能首席技術官周靖人表示:「『通義萬相』將進一步令 AI 生成圖像於不同行業使用,協助電子商務、遊戲、設計和廣告等領域的企業開展創新的 AI 藝術創作和創意表達。」

    阿里雲同時宣布推出通用框架 ModelScopeGPT ,並使用語言大模型為控制器(controller),連接「魔搭」開源社區中的模型。企業和開發者可免費使用 ModelScopeGPT 訪問和執行切合用戶需求的模型,完成複雜度高的 AI 任務,例如開發多語言視頻。

    據阿里雲提供的資料,自 4 月發布語言大模型「通義千問」後,已收到來自金融科技、電子、運輸、時尚和乳製品等多個行業企業、超過 30 萬個內部測試申請。

    最新影片

    您會感興趣的內容

    相關文章