8月5日|據AIGC開放社區,今天凌晨,阿里巴巴達摩院開源了最新文生圖模型Qwen-Image。Qwen-Image是一個200億參數的MMDiT模型,可生成寫實、動漫、賽博朋克、科幻、極簡、復古、超現實、水墨等幾十種類型的圖片,支持圖片的風格遷移、增刪改、細節增強、文字編輯,人物姿態調整等常規操作。Qwen-Image也可以生成OpenAI的GPT-4o爆火全網的吉卜力風格圖片。據測二者差距很小,尤其是在超複雜中文提示詞理解、文字嵌入方面Qwen-Image更好。
新聞來源 (不包括新聞圖片): 格隆匯