Nano Banana Pro 官方指南十大技巧

菜小编

AI绘画与短视频剪辑

2026-1-13

第0部分：提示的黄金法则

Nano Banana Pro(接下来俗称大香蕉)有强思考性，可以理解意图，物理原理，构图，所以不用罗列关键词，好好用自然语言，直接像创意总监那样连续创作即可。

模型擅长理解对话式修改，也就是说出图还能继续自然语言改图，不用重新抽卡了，提出具体要求吧。

比如：把图中女孩发型改成波浪发，灯光改成暖黄色。（不过汉字修改我没有试，有时候整体不太满意，确实不如直接重新来）

和别人聊天一样，别想麻烦，对话具体起来，要求越细致越可控。

比如：明确主题，角色特征，场景，光线，氛围，用一小段话交代清晰

提供背景，明确需求，更利于模型思考针对性产出。

比如：为一本巴西高端美食食谱创作一张三明治的图片

第一部分：可视化

目前最强的功能，就是把复杂的内容进行可视化，像是将一份比较复杂的PDF文件直接成概况图片

比如：上传一份PDF，写提示词，制作一份简洁现代的信息图，概括这份盈利报告的关键财务亮点。图表应包含‘营收增长’和‘净利润’，并在风格化的引言框中突出显示首席执行官的关键语录

比如：制作一张复古的、20世纪50年代风格的信息图，介绍美国餐馆的历史。信息图应包含‘食物’、‘点唱机’和‘装饰’等不同部分。确保所有文字清晰易读，并符合当时的风格

说白了，内容海报

绘制一份正投影蓝图，以平面图、立面图和剖面图的形式描述该建筑。用专业建筑字体清晰标注‘北立面’和‘正门’。格式为16:9

请用手绘白板图的形式概括“Transformer 神经网络架构”的概念，使其适用于大学讲座。编码器和解码器模块请使用不同颜色的马克笔，并清晰地标明“自注意力”和“前馈”

个人感觉对于专业性比较强的人来说，这方面帮助真是太大太大了，极容易用来提供解释材料，因为他们需要经常解释自己的专业嘛

我个人比较倾向于手绘风格，大家也注意一下，如果不是什么高大上的场景，越亲民的风格越好，而且更加醒目最好，内容不要积压太多，字数想都清晰的话，有个上限（下载下来的原图可以抵消部分模糊，一定要下载原图）

第二部分：角色一致性与病毒式传播的缩略图

大香蕉支持14张参考图，所以相当于一个小模型锁定角色了

上传角色之后就能好好利用起来，注意看提示词技巧

比如：使用图 1 中的人物设计一个病毒式传播的视频缩略图。面部一致性：保持人物面部特征与图 1 完全相同，但改变其表情，使其看起来兴奋和惊讶。动作：将人物置于画面左侧，手指指向画面右侧。主体：在画面右侧放置一张美味的牛油果吐司高清图片。图形：添加一个醒目的黄色箭头，连接人物的手指和吐司。文字：在画面中间叠加醒目的流行风格文字：“3 分钟搞定！”（3 分钟搞定！）。使用粗白线描边并添加阴影。背景：模糊明亮的厨房背景。高饱和度和高对比度。

要细！

比如：[输入3张不同毛绒玩具的图片] 请创作一个有趣的十页故事，讲述这三个毛茸茸的小伙伴去热带度假的故事。故事情节跌宕起伏，扣人心弦，最终以温馨的结局收尾。三个角色的服装和形象要保持一致，但他们的表情和角度在十幅图中要有所变化。每幅图中每个角色只能出现一次。

[输入一张产品图片] “请创作9张精美的时尚大片，风格应如同获奖时尚杂志大片。请以此为品牌风格参考，但需在风格上进行细微调整和丰富变化，以展现专业设计感。请一次创作一张，共创作九张图片。”

我个人感觉角色一致性并不是特别精准，经常一会一个样，但是大概还是凑合的

第三部分：搜索学习

大香蕉可以用谷歌搜到素材学习，然后再出图，比如天气，股票，新闻的可视化，也就是说，模型知道不会的先搜再做

比如：

事件可视化：“根据当前的旅游趋势，制作一张信息图，展示2025年游览美国国家公园的最佳时间。”

其实这个功能玩法相当多，他实际上属于即时数据可视化，大有可为，有待开发

第四部分：图片修复和着色

还是属于P图范畴，上色啊，老照片修复啊，只能说现在更精致了，还能改细节，直接说即可

物体移除与补绘：“将照片背景中的游客移除，并用与周围环境相协调的合理纹理（鹅卵石和店面）填充空间。”

漫画/漫画着色：[输入黑白漫画画面] “给这幅漫画分镜上色。使用鲜艳的动漫风格配色方案。确保能量光束的照明效果呈现霓虹蓝色，并且角色的服装颜色与其官方配色一致。”

本地化（文本翻译+文化适应）：[插入一张伦敦公交车站广告的图片] “将这个概念本地化到东京背景，包括将标语翻译成日语。将背景改为夜晚熙熙攘攘的涩谷街道。”

照明/季节控制：[输入一张夏季房屋的图片] “把这个场景变成冬天。保持房屋建筑风格不变，但在屋顶和院子里加上积雪，并将光线改为寒冷阴沉的午后。”

第五部分：维度转换2D-3D

将二维示意图转换为三维可视化图像，反之亦然。这对于室内设计师、建筑师和表情包创作者来说都非常理想，算是个老功能优化吧，大家还是注意学提示词的技巧

2D 平面图转 3D 室内设计图：

“根据上传的二维平面图，生成一张专业的室内设计展示图。布局：采用拼贴画形式，顶部为一张大型主图（客厅广角视图），下方为三张较小图片（主卧、家庭办公室和三维俯视图）。风格：所有图片均采用现代简约风格，搭配温暖的橡木地板和米白色墙面。质量：照片级渲染，柔和的自然光。”

2D 转 3D 表情包：

“把‘一切都好’狗狗表情包做成逼真的 3D 渲染图。保持构图不变，但让狗狗看起来像毛绒玩具，火焰看起来像真实的火焰。”

6、高分辨率

就是说，可以给非常精致的图片，不过请注意这是在AI Studio

https://aistudio.google.com/projects

中才能用的，需要有API，有一说一，这个功能确实太强了，因为很多AI生图，全是渣画质，渣画质不仅影响观感，还影响文字的清晰度！

4K 纹理生成：

“利用原生高保真输出，打造令人叹为观止、充满氛围的苔藓森林地面环境。掌控复杂的光照效果和细腻的纹理，确保每一根苔藓和每一束光线都以像素级分辨率渲染，满足 4K 壁纸的要求。”

复杂逻辑（思维模式）：

“制作一张超逼真的美食芝士汉堡信息图，将其拆解，展现烤过的奶油蛋卷面包的质地、肉饼煎至焦香的外皮以及闪闪发光的融化芝士。并为每一层标注其风味特征。”

第七部分：思考与推理

简单来说，就是过程展示，适合分析类图片

解方程：

“请在白板上用 C 语言求解方程组 log_{x^2+1}(x^4-1)=2。请清晰地写出解题步骤。”

视觉推理：

“分析这张房间图片，生成一张‘之前’的图片，展示房间在施工期间可能的样子，包括框架和未完成的石膏板。”

第八部分：连续艺术

直接说案例

请创作一个引人入胜的九部分故事，包含九张图片，故事中需出现一位女性和一位男性，他们正在拍摄一部屡获殊荣的豪华行李箱广告。故事应有跌宕起伏的情感，最后以一位女性手持品牌标识的优雅照片结尾。男女主角的身份和着装必须保持一致，但可以从不同的角度和距离拍摄。请逐一生成图片。请确保每张图片均为 16:9 横向格式。