首頁 Biz.IT 企業應用 測試商湯日日新 AI 成生「秒畫」 胸有成竹的男人不再胸口生竹

測試商湯日日新 AI 成生「秒畫」 胸有成竹的男人不再胸口生竹

SenseTime_SenseMirage_001

AI 成生圖像技術進步神速,成為考驗大型模型的指標之一。 Stable DiffusionMidjourney 由 prompt 指示,不過要使用英文關鍵字。商湯由「日日新」支援的「秒畫」,讓用戶用中文關鍵字生成圖片,還可用少量圖片訓練風格。在商湯技術交流日測試「秒畫」,以百度「文心一言」出現過的蝦碌指令,「秒畫」卻能生成較情理之中的圖像。

「秒畫」的示範圖像。

「秒畫」展現光影真實、細節豐富、風格多變文字生成圖像能力,支援生成 6K 高清圖片。商湯科技行政總裁徐立稱,「秒畫」推理速度快,用單張 A100 GPU 執行可快至 2 秒生成 512K 解像度圖片。

徐立介紹由日日新支援的四個生成式 AI 服務。

客戶還可按需要訓練模型生成圖像。徐立指,僅用 20 張圖片可自訂模型,如用單張 A100 GPU 訓練,只需 5 分鐘便完成自訂的 LoRA 模型。在現場的示範,用 20 張 80 年代香港風格圖片即時訓練,再生成具有「港式風格」的圖像。而企業客戶亦可經 API 連接使用「秒畫」,產生所需要的圖片。

用大量中文字提示「秒畫」生成圖像。
即場上載 20 張八十年代香港風格圖片,叫「秒畫」生成同類風格。

AI 成生圖像先要解讀文字,再按其理解語意生成。商湯技術人員示範時,用上大量關鍵字輔助形容,令圖像生成更準確。百度的「文心一言」生成的圖像被喻為災難級,而「秒畫」用同一指令,卻有意想不到的效果。

胸有成竹的男人,「秒畫」取其意境生成,不再是男人胸口生竹。
「秒畫」生成的「披著國旗的貓」,主角的貓像真度高,重點在於國旗亦用新生成圖案。
Exit mobile version