新疆保温护角专用胶价格 谷歌北大联手学术版Banana爆火,论文图表精确生成

果好到刷屏的 Nano Banana新疆保温护角专用胶价格,学术版热乎出炉!
名字就是如此直观——PaperBanana,给你每天都在头痛的 Paper 用上 Banana。(试图押韵 skr )
而且这次是由谷歌北大强强联手造。
知道你想马上看果,别急,三个官案例这就给大搬上桌。
在相同输入下,人类绘制、原版 Nano Banana 与 PaperBanana 生成的论文插图对比如下:
综评估显示,PaperBanana 在美观、简洁与逻辑清晰度上均优于原版。
而且它还能直接优化人工绘制的插图,瞅瞅右边,是不是感下就上去了。
此外,由于 PaperBanana 还提供代码出图 (即利用 Gemini-3-Pro 自动生成并执行 Python 可视化代码出图),所以它还能用来生成需要数值 的各种图表。
好好好,既能拿捏感,又不忘度,应该没有学术人不吧 ~
论文作者表示,PaperBanana 为全自动生成可用于出版的插图铺平了道路。
我们希望这个框架能成为连接复杂科学概念与视觉叙事的桥梁,赋能每位研究者,用业的视觉语言清晰呈现其发现。
而在看到其果之后,众网友也纷纷感叹"学术插图"这个老大难总是要被攻克了。
想想以前的日子,真真是要落泪了 ~
研究人员花费 4 个小时在 Figma 中绘制张图,简直令人难以置信。
那么,学术版 PaperBanana 是如何炼造的呢?
个不够,那就 5 个!
用个模型生图怎么够,现在都是多智能体齐上阵了。
没错,PaperBanana 背后就是5 个分工明确的智能体在起作用。
Retriever Agent(检索智能体):从顶会论文库中,找到与你要画的图域、结构相似的参考案例。
Planner Agent(规划智能体):把论文文字描述新疆保温护角专用胶价格,转化为包含所有模块、逻辑的详细绘图说明书。
Stylist Agent(风格智能体):总结学术审美规范,给说明书加上配、排版等"美颜"标准。
Visualizer Agent(可视化智能体):根据说明书,直接画图或写代码出图,产出初稿。
Critic Agent(批判智能体):检查图的对错与美观度,提出修改意见,循环迭代 3 轮优化。
下面这张图清晰展示了它们的工作流程:
划,连这张图也是 PaperBanana 自己生成的。
论文作者表示,这过程参考了人类制作论文插图的流程。
以制作个模型架构图为例,通常研究人员会先去看看顶会里类似工作的图是怎么画的,找找灵感和规范。
这步就对应了检索智能体的工作。
然后就需要根据参考来规划自己的图该怎么画,"我的法有几个关键模块?"、"数据流和逻辑顺序是怎样的?",在想清所有关键问题后,脑子里大概就有幅架构蓝图了。
而到这步还不是真正动笔的时候,因为还需要结自己的图以及之前看过的"顶会审美"标准,来给蓝图加点设计感。
有了这两样东西(蓝图 + 审美),现在就可以真正出图了。
并且出完之后,研究人员往往还需要检查番,以确保出图正确误。
怎么样?是不是环扣环、且全都对应上了。
而在了解完 PaperBanana 的工作式后,接下来的问题在于:
怎么评估 PaperBanana 的生图果?
实验法及结果
对此,团队还门构建了个PaperBananaBench。该基准内容源自 NeurIPS 2025 ——
他们从 5275 篇论文中随机采样 2000 篇,经过滤、人工校验后,得到 584 个有样本,然后将其均分为 292 个测试样本和 292 个参考样本。
这 292 个参考样本,每个都提取了完整的(S, C, I)三元组:
S(源上下文):描述法的文本,如论文法论章节;
C(传达意图):图的标题 / 说明,保温护角专用胶如"我们的框架概述";
I(参考图像):论文中实际使用的、质量的对应图表。
参考样本集构成了个质量的"学术插图数据库"新疆保温护角专用胶价格,主要供检索智能体进行查询和匹配。
奥力斯 万能胶生产厂家 联系人:王经理 手机:13903175735(微信同号) 地址:河北省任丘市北辛庄乡南代河工业区
而与之对应的 292 个测试样本,在评估时则仅提供 S、C 作为输入。其对应的 I 作为隐藏的标准答案,不参与生成过程,仅用于终的质量比对与评分。
准备到这里,接下来就是具体生成和评估了。
裁判面,他们采用了" VLM-as-a-Judge "(大模型当裁判)的评估范式——
让强大的视觉语言模型(如 Gemini-3-Pro)作为评委,将 PaperBanana 生成的图与测试集中隐藏的标准答案 I 进行逐项对比。
对比的维度主要有四个:忠实、简洁、可读、美观。
若 PaperBanana 表现优于标准图得 100 分,劣于得 0 分,持平得 50 分,终计总分。
而实验结果表明,PaperBanana 在所有维度上越了传统的单模型直接生成(Vanilla)等基线法。
整体能碾压:总分相对基线提升了 17.0。其中,简洁提升为显著,达 37.2,说明它生成的图逻辑干净、突出;可读(+12.9)和美观(+6.6)也有大幅先。
获得人类盲测认可:在匿名的人类盲测中,研究员有 72.7 的情况认为 PaperBanana 生成的图比基线模型好。
统计图表表现优异:在需要精度的统计图表任务中,PaperBanana 的"代码生成模式"在数值忠实上与人类水平相当,而简洁和美观甚至略胜筹。
这里需要说明,在生成图表面,PaperBanana 有两种模式:
种是代码生成模式(默认)。让 Gemini-3-Pro 这类模型自动写 Python 可视化代码(如 Matplotlib),再运行代码出图。优点是可以保证数值对准确,适需要严格精度的场景。
另种是直接生图模式(可选式)。跳过代码,让图像生成模型直接根据文本描述生成图表。优点是视觉果顶,但数值容易出现幻觉问题。
左图直接生图模式下,红框圈选出来的就是些错误问题,而右侧的代码生图模式明显误,但美观度略逊。
后的消融实验证明,检索参考、风格优化、批判迭代这三个环节缺不可,它们共同保证了终图像的"准确"与"好看"。
不过也需要提醒,PaperBanana 目前仍有些局限,比如它作为生图还法编辑,同时在很多细节忠实度面仍比不上人类手工作业。
所以,保险的做法或许是,让它帮你优化以前绘制过的图。
在下面这套"手图蜕变"流程下,很多图都能变得美观、……当然也容易入顶会的眼(doge)。
谷歌 x 北大联手造
后介绍下 PaperBanana 背后的团队。
共 7 人,可以清晰分成两拨——
拨来自北大,主要提供 NLP 与多模态理解的学术根基;另拨来自 Google Cloud AI Research,负责多模态系统与工业化视角。
署名的 Dawei Zhu(兼通讯作者),本硕博均就读于北大,现为北大四年博士生。
他研究长上下文建模和多模态数据,之前在微软亚洲研究院实习过,目前是 Google Cloud AI Research 学生研究员,PaperBanana 也是他在谷歌期间参与的项目。
借着北大这条线,另外两位来自北大的分别是 Xiyu Wei 和 Sujian Li(兼通讯作者)。
Sujian Li 目前是北大计机学院长聘教授,也是 Dawei Zhu 的博,主要研究自然语言处理、信息抽取等。
而 Xiyu Wei 可能还是学生,目前只能看到 TA 和 Dawei Zhu 作过篇关于拓展上下文的论文。
而其他几位来自 Google Cloud AI Research 的分别是:
负责人 Tomas Pfister、研究科学 Yale Song、研究科学 Rui Meng 和 Jinsung Yoon(兼通讯作者)。
截至目前,PaperBanana 已在开源社区 GitHub 揽获上千 star,感兴趣可以继续关注。
项目主页:
https://dwzhu-pku.github.io/PaperBanana/
论文:
https://arxiv.org/abs/2601.23265
GitHub 地址:
https://github.com/dwzhu-pku/PaperBanana
参考链接:
[ 1 ] https://x.com/AlphaSignalAI/status/2018815238829928711
[ 2 ] https://x.com/dwzhu128/status/2018405593976103010
— 欢迎 AI 产品从业者共建 —
� �「AI 产品知识库」是量子位智库基于长期产品库追踪和用户行为数据出的飞书知识库,旨在成为 AI 行业从业者、投资者、研究者的核心信息枢纽与决策支持平台。
键关注 � � 点亮星标
科技前沿进展每日见新疆保温护角专用胶价格
相关词条:罐体保温 塑料挤出设备 钢绞线 超细玻璃棉板 万能胶