想让 AI 生成更好的图片?问题往往不在模型,而在 Prompt。
如果你用过 Nano Banana 2 或类似的 AI 图像模型,大概率遇到过这些问题:
其实核心原因只有一个:👉 Prompt 写得不够清晰
这篇文章会系统讲清楚:

Nano Banana Prompt 的本质是“用语言描述画面”,而不是堆关键词。
Nano Banana Prompt = 用自然语言描述你想要的画面,它不是关键词拼接,而更接近:“你在给摄影师下指令”
很多人是这样写的:
girl, beautiful, city, sunset, cinematic看起来信息很多,但对模型来说是:
👉 没有结构,没有重点
更好的写法是:
A young woman standing on a rooftop in a modern city at sunset, medium shot, warm golden lighting, cinematic photography style.差异在哪?
👉 这一步,直接决定生成质量上限
想写好 Prompt,可以直接套这个结构:
✅ 万能公式
👉 模型最容易理解这种“完整语义”
主体 + 动作 + 场景 + 构图 + 光线 + 风格👉示例(推荐直接参考)
A professional businesswoman wearing a tailored blazer, standing confidently in a modern office, medium shot, soft natural lighting, corporate photography style.👉适用:从0生成图片
主体 + 动作 + 场景 + 风格 + 构图示例:
A fashion model wearing a minimalist beige outfit, standing in a clean studio with a white background, full body shot, high-end fashion editorial style.👉 核心原则:改什么 + 保留什么
示例:
Remove the background crowd. Keep the main subject unchanged. Maintain original lighting and composition.👉适用场景:
👉 不写清关系 = 随机拼接
示例:
Use the first image as the character reference, the second image for outfit design, and the third image as background. Blend them naturally into a realistic scene.注意三点:
示例:
Create a poster with the text “SUMMER SALE” in bold white font, centered on a bright orange background.👉想让图更“高级”,补充下面的内容:
示例:
Portrait shot with a 50mm lens, shallow depth of field, soft cinematic lighting, warm color grading.错误:
car, night, neon, rain正确:
A car driving through a rainy city street at night, neon lights reflecting on wet pavement.不要一次写太复杂,建议:
第一步:
Make the scene look like nighttime第二步:
Add neon lights and reflections on the ground👉 更稳定、可控
no text, no watermark, no logo👉 不写 ≠ 不生成
提升质量的关键词:
示例:
Keep the face and pose unchanged. Replace the outfit with a black leather jacket.👉 非常适合电商 & AI换装
👉 电商产品图:自动生成商品图,降低拍摄成本
👉 社交媒体内容:小红书 / Youtube / Instagram / TikTok,批量生成适合自己的精美图片
👉 广告 & 营销素材:Banner,广告图
👉 AI绘画 & 插画:连续角色生成,IP设计
❓问:Nano Banana Pro 比其他图像生成模型更好吗?
💡答:Nano Banana Pro 在某些关键能力上表现突出,例如高级文本渲染、4K 输出以及多图一致性控制。但在部分风格(如超现实主义或特定艺术流派)上,其他模型可能更具优势。
❓问:我可以将 Nano Banana Pro 生成的图像用于商业用途吗?
💡答:可以。通过 Google API 生成的所有图像(包括通过 Crun AI 调用)均支持商业使用,但需遵守相关服务条款。
❓问:“思考模式”和标准生成有什么区别?
💡答:思考模式会增加一定处理时间(通常 5–15 秒),但在复杂提示词场景下能显著提升生成质量。该模式会在渲染前对构图与风格进行额外推理。
❓问:参考图像的最大文件大小是多少?
💡答:单张参考图像建议小于 20MB,支持 JPEG、PNG、WebP 等常见格式。分辨率并非越高越好,通常 1024×1024 是较优选择。
❓问:可以指定图像的纵横比吗?
💡答:可以。你可以在提示词中直接说明(例如:“16:9 横屏比例”),或使用 API 提供的纵横比参数(如支持)。
❓问:图像生成大概需要多长时间?
💡答:标准模式: 5–15 秒;思考模式: 10–25 秒;批量任务会按顺序执行。如需更高吞吐量,建议使用 Crun AI 提供的 API。
❓问:如何在多张图像中保持角色一致性?
💡答:建议在每次生成时:使用相同的参考图像、保持一致的描述性特征、尽量统一光照和构图方向。
❓问:如何打造统一的品牌视觉风格?
💡答:建议建立一个风格参考库(3–5 张图像),每次生成时使用 2–3 张作为参考,重点关注视觉元素的一致性,而非逐字复制,并根据结果持续迭代优化。
❓问:可以生成真实人物的图像吗?
💡答:不建议生成特定真实人物的图像。更推荐通过描述特征(如年龄、气质、风格等),让模型生成具有真实感的原创人物。