Nano Banana Pro 官方指南十大技巧

第0部分:提示的黄金法则

Nano Banana Pro(接下来俗称大香蕉)有强思考性,可以理解意图,物理原理,构图,所以不用罗列关键词,好好用自然语言,直接像创意总监那样连续创作即可。
模型擅长理解对话式修改,也就是说出图还能继续自然语言改图,不用重新抽卡了,提出具体要求吧。
比如:把图中女孩发型改成波浪发,灯光改成暖黄色。(不过汉字修改我没有试,有时候整体不太满意,确实不如直接重新来)
和别人聊天一样,别想麻烦,对话具体起来,要求越细致越可控。
比如:明确主题,角色特征,场景,光线,氛围,用一小段话交代清晰
提供背景,明确需求,更利于模型思考针对性产出。
比如:为一本巴西高端美食食谱创作一张三明治的图片

第一部分:可视化

目前最强的功能,就是把复杂的内容进行可视化,像是将一份比较复杂的PDF文件直接成概况图片
比如:上传一份PDF,写提示词,制作一份简洁现代的信息图,概括这份盈利报告的关键财务亮点。图表应包含‘营收增长’和‘净利润’,并在风格化的引言框中突出显示首席执行官的关键语录
比如:制作一张复古的、20世纪50年代风格的信息图,介绍美国餐馆的历史。信息图应包含‘食物’、‘点唱机’和‘装饰’等不同部分。确保所有文字清晰易读,并符合当时的风格
说白了,内容海报
绘制一份正投影蓝图,以平面图、立面图和剖面图的形式描述该建筑。用专业建筑字体清晰标注‘北立面’和‘正门’。格式为16:9
请用手绘白板图的形式概括“Transformer 神经网络架构”的概念,使其适用于大学讲座。编码器和解码器模块请使用不同颜色的马克笔,并清晰地标明“自注意力”和“前馈”
个人感觉对于专业性比较强的人来说,这方面帮助真是太大太大了,极容易用来提供解释材料,因为他们需要经常解释自己的专业嘛
我个人比较倾向于手绘风格,大家也注意一下,如果不是什么高大上的场景,越亲民的风格越好,而且更加醒目最好,内容不要积压太多,字数想都清晰的话,有个上限(下载下来的原图可以抵消部分模糊,一定要下载原图)

第二部分:角色一致性与病毒式传播的缩略图

大香蕉支持14张参考图,所以相当于一个小模型锁定角色了
上传角色之后就能好好利用起来,注意看提示词技巧
比如:使用图 1 中的人物设计一个病毒式传播的视频缩略图。 面部一致性: 保持人物面部特征与图 1 完全相同,但改变其表情,使其看起来兴奋和惊讶。 动作: 将人物置于画面左侧,手指指向画面右侧。 主体: 在画面右侧放置一张美味的牛油果吐司高清图片。 图形: 添加一个醒目的黄色箭头,连接人物的手指和吐司。 文字: 在画面中间叠加醒目的流行风格文字:“3 分钟搞定!”(3 分钟搞定!)。使用粗白线描边并添加阴影。 背景: 模糊明亮的厨房背景。高饱和度和高对比度。
要细!
比如:[输入3张不同毛绒玩具的图片] 请创作一个有趣的十页故事,讲述这三个毛茸茸的小伙伴去热带度假的故事。故事情节跌宕起伏,扣人心弦,最终以温馨的结局收尾。 三个角色的服装和形象要保持一致 ,但他们的表情和角度在十幅图中要有所变化。每幅图中每个角色只能出现一次。
[输入一张产品图片] “请创作9张精美的时尚大片,风格应如同获奖时尚杂志大片。请以此为品牌风格参考,但需在风格上进行细微调整和丰富变化,以展现专业设计感。请一次创作一张,共创作九张图片。”
我个人感觉角色一致性并不是特别精准,经常一会一个样,但是大概还是凑合的

第三部分:搜索学习

大香蕉可以用谷歌搜到素材学习,然后再出图,比如天气,股票,新闻的可视化,也就是说,模型知道不会的先搜再做
比如:
事件可视化:“根据当前的旅游趋势,制作一张信息图,展示2025年游览美国国家公园的最佳时间。”
其实这个功能玩法相当多,他实际上属于即时数据可视化,大有可为,有待开发

第四部分:图片修复和着色

还是属于P图范畴,上色啊,老照片修复啊,只能说现在更精致了,还能改细节,直接说即可
物体移除与补绘:“将照片背景中的游客移除,并用与周围环境相协调的合理纹理(鹅卵石和店面)填充空间。”
漫画/漫画着色:[输入黑白漫画画面] “给这幅漫画分镜上色。使用鲜艳的动漫风格配色方案。确保能量光束的照明效果呈现霓虹蓝色,并且角色的服装颜色与其官方配色一致。”
本地化(文本翻译+文化适应):[插入一张伦敦公交车站广告的图片] “将这个概念本地化到东京背景,包括将标语翻译成日语。将背景改为夜晚熙熙攘攘的涩谷街道。”
照明/季节控制:[输入一张夏季房屋的图片] “把这个场景变成冬天。保持房屋建筑风格不变,但在屋顶和院子里加上积雪,并将光线改为寒冷阴沉的午后。”

第五部分:维度转换2D-3D

将二维示意图转换为三维可视化图像,反之亦然。这对于室内设计师、建筑师和表情包创作者来说都非常理想,算是个老功能优化吧,大家还是注意学提示词的技巧
2D 平面图转 3D 室内设计图:
“根据上传的二维平面图,生成一张专业的室内设计展示图。 布局: 采用拼贴画形式,顶部为一张大型主图(客厅广角视图),下方为三张较小图片(主卧、家庭办公室和三维俯视图)。 风格: 所有图片均采用现代简约风格,搭配温暖的橡木地板和米白色墙面。 质量: 照片级渲染,柔和的自然光。”
2D 转 3D 表情包:
“把‘一切都好’狗狗表情包做成逼真的 3D 渲染图。保持构图不变,但让狗狗看起来像毛绒玩具,火焰看起来像真实的火焰。”

6、高分辨率

就是说,可以给非常精致的图片,不过请注意这是在AI Studio
https://aistudio.google.com/projects
中才能用的,需要有API,有一说一,这个功能确实太强了,因为很多AI生图,全是渣画质,渣画质不仅影响观感,还影响文字的清晰度!
4K 纹理生成:
“利用原生高保真输出,打造令人叹为观止、充满氛围的苔藓森林地面环境。掌控复杂的光照效果和细腻的纹理,确保每一根苔藓和每一束光线都以像素级分辨率渲染,满足 4K 壁纸的要求。”
复杂逻辑(思维模式):
“制作一张超逼真的美食芝士汉堡信息图,将其拆解,展现烤过的奶油蛋卷面包的质地、肉饼煎至焦香的外皮以及闪闪发光的融化芝士。并为每一层标注其风味特征。”

第七部分:思考与推理

简单来说,就是过程展示,适合分析类图片
解方程:
“请在白板上用 C 语言求解方程组 log_{x^2+1}(x^4-1)=2。请清晰地写出解题步骤。”
视觉推理:
“分析这张房间图片,生成一张‘之前’的图片,展示房间在施工期间可能的样子,包括框架和未完成的石膏板。”

第八部分:连续艺术

直接说案例
请创作一个引人入胜的九部分故事,包含九张图片,故事中需出现一位女性和一位男性,他们正在拍摄一部屡获殊荣的豪华行李箱广告。故事应有跌宕起伏的情感,最后以一位女性手持品牌标识的优雅照片结尾。 男女主角的身份和着装必须保持一致 ,但可以从不同的角度和距离拍摄。请逐一生成图片。请确保每张图片均为 16:9 横向格式。

第九部分:构图和布局指导

设计师专属,类似于画板效果,涂鸦转精美图,提高可控性
从草图到最终广告:
请根据这张草图为[产品]创作一则广告。
根据线框图创建用户界面模型:
“请按照以下准则创建一个[产品]模型。”
像素艺术与 LED 显示屏:
“请绘制一个独角兽像素画,使其完美契合这幅 64x64 的网格图像。使用高对比度的颜色。”(提示:开发人员随后可以通过编程方式提取每个单元格的中心颜色,以驱动连接的 64x64 LED 点阵显示屏)
“一位女性在无人机上做后空翻的精灵图,3x3 网格,逐帧动画序列,正方形宽高比。请完全按照附件参考图像的结构进行绘制。” (提示:您可以提取每个单元格并制作成 GIF 动画)

第十部分:然后呢?

官方出图技巧就是上面的,还给出了一些额外的建议
比如可以用氛围编程工具,做一个喜欢的提示词小应用,我觉得这个还真挺值得试试的。
我说说我的看法吧
举一反三很重要,给你一个A,能生出BCDEFG,能生出,B1 B2 B3等等。这样的话,你看见一套提示词,就能有无数套提示词。
来源:DYOR AI实战营
THE END