Ideogram发布首个开源权重图像模型Ideogram 4.0:9.3B参数、支持结构化JSON提示词

Ideogram推出首个开源权重图像基础大模型Ideogram 4.0,拥有93亿参数,采用单流diffusion transformer (DIT)架构,选择qwen3-vl-8b-instruct作为文本编码器。该模型开源NF4(CUDA支持,适用于24GB显存GPU)与FP8版本,推理代码采用Apache 2.0许可,权重在非商业和学术研究用途下免费开放,商业部署提供与业务规模相匹配的商用许可。核心亮点是首次引入结构化JSON提示词接口,用户可通过结构化JSON字符串精确控制图像布局、风格和成分。在权威基准测试中,该模型在7bench测试中得分0.69 MIoU,X-Omni英文OCR测试准确率达0.97,设计偏好盲测中排名开源模型第一。

上一篇:

下一篇:

发表回复

登录后才能评论