Gemini 2.5 Pro 为何突然“真香”了?|推理是钥匙,终局是生态

Gemini 2.5 Pro 为何突然“真香”了?|推理是钥匙,终局是生态

简要总结

本期节目主要讨论了谷歌的 Gemini 2.5 Pro 口碑反转的原因,以及 AI 领域的未来发展趋势。主要观点包括:

  • Gemini 2.5 Pro 凭借其强大的推理能力、超长上下文和原生多模态特性,实现了口碑逆转。
  • 谷歌在 AI 领域的策略更偏向 To B 服务,通过全栈自研降低成本,提升 AI 能力。
  • AI 的竞争最终将演变成生态的比拼,而目前 AI 更像是生产力工具,尚未出现真正的消费级 AI 应用。

Gemini 2.5 Pro 初体验

体验者表示,自从使用了 Gemini 后,大部分工作都依赖于它。最初对 Gemini 缺乏信任,会切换不同的模型来处理不同任务,例如使用 GPT 进行总结和头脑风暴,而使用 Gemini 进行深度研究和选题。但经过一周的磨合,Gemini 在日常使用中的占比超过 90%,解决问题的成功率非常高,效率显著提高。体验者表示自己从之前嫌弃谷歌到现在成为 Gemini 的拥护者。

口碑反转:从“嫌弃谷歌嫌弃的要命”到“现在打脸”,Gemini 2.5 Pro 如何一夜“真香”?

Gemini 2.5 Pro 口碑反转的原因在于其技术突破,包括更强的推理能力、100 万 token 的超强上下文和原生多模态。这些技术优势使其在实际应用中表现出色,例如处理带图 PDF 文件并生成可视化图表,准确理解用户意图并完成任务的概率达到 85%。此外,谷歌也调整了定价策略,允许大多数人免费使用新模型,而更深度的 2.5 版本则提供比 OpenAI 更便宜的付费选项。

技术宅 vs 产品经理:谷歌的发布偏技术化、工程化,UI 难用,体验反人类?

谷歌的 Gemini 在产品设计和用户体验方面存在不足,例如 UI 难用,需要用户具备工程化的使用方式。用户需要提升对 Gemini 的提示技巧,并人工拼接使用场景。Gemini 的操作方式反人类,例如先让用户选择模型,但普通用户并不了解不同模型之间的区别和用途。然而,一旦用户理解 Gemini 的能力,就会发现其真正的价值。

真香警告:一旦理解 Gemini 的能力(推理、长文本、原生多模态),就会开启真香模式。

Gemini 的技术优势在于其强大的推理能力、超长上下文和原生多模态。这些优势使其在处理复杂任务时表现出色,例如理解几十页带图的 PDF 文件并生成可视化图表,且无需用户过多干预。Gemini 能够通过推理完成任务,误差度较低,大约 85% 的情况下能够准确理解用户意图并达到目的。

底盘而非产品:Gemini 更像是谷歌 AI 能力的“底盘”,而非独立产品,旨在提升所有产品的“内力”。

Gemini 不像一个独立的产品,而更像是谷歌 AI 能力的“底盘”,旨在提升所有产品的“内力”。谷歌将 AI 作为底层技术,所有产品未来都将基于 AI 重新整合和开发。谷歌不会让客户或用户自己去做整合,而是自己完成,用户只需继续使用其产品即可,但每个产品都将被 AI 升级或重塑。

巨人转身的加速:谷歌内部迭代速度前所未有,“六个月以前的产品已经是上一代”。

谷歌内部的迭代速度前所未有,技术人员表示六个月以前的产品已经是上一代。这种快速迭代在以前的谷歌是没有发生过的。谷歌在数据训练、强化学习和人类反馈学习等方面都取得了进展。

推理的窗户纸:DeepSeek 如何捅破了“推理”这层窗户纸,让行业方向更加明确?

DeepSeek 开源了 R1 模型,捅破了“推理”这层窗户纸,让行业方向更加明确。许多公司开始意识到应该朝着推理的方向发展。谷歌也因此做了大量调整,例如降低 Gemini 2.0 的收费,并更加重视推理能力。

推理是钥匙:AI 下半场,解决实际问题需要推理能力,Agent 等概念都基于此。

AI 的下半场需要用 AI 解决实际问题,而推理是关键。许多概念,如 Agent,都基于推理的突破。Deep Research 本质上也是一个 Agent,它通过分析大量信息源,生成研究报告,并控制幻觉的产生。

To B 的野望:谷歌 Cloud 业务年增长30%,Gemini 的“硬核”能力是否主要为 To B 服务?

谷歌的重点可能不在 To C,而在于 To B。过去四年,谷歌 Cloud 业务平均每年增长 30%,业务占比也在逐年提升。谷歌在 To B 领域的 AI 策略非常激进,通过推理预算等功能控制推理成本和用量。谷歌 Cloud 大会上发布了 Gemini 2.5 和轻量级推理模型,这些都偏向 To B 能力。

全栈自研的底气:从芯片到应用再到云服务,谷歌的全栈投入是其成本和能力优势的关键。

谷歌是唯一一家在 Google Cloud 上提供所有跨平台模态和全栈自研的公司,从芯片设计到基础模型、应用程序社区再到云服务,全部自研。这种全栈投入是其成本和能力优势的关键。

形象比喻:GPT 像“聪明的孩子”,灵光幽默;Google 像“稳重的高材生”,全科但可能不那么有趣。

GPT 像一个聪明的孩子,说话幽默,带出去灵光,适合搞春晚。而 Google 像一个没有什么短板的全科高材生,特别稳重,适合搞科学竞赛。谷歌坚持自己的路线,将 AI 能力渗透到所有 To B 产业中,并告诉大家 AI 应该怎么用。

留住核心人才:谷歌成功留住 DeepMind CEO、谷歌云 CEO 等关键人物,并吸引人才回流。

谷歌成功留住了 DeepMind CEO 和谷歌云 CEO 等关键人物,并吸引了人才回流,例如 Character.AI 的 Norm 和 Attention is All You Need 的联合创作者。这些人才的回归对谷歌的 AI 发展至关重要。

终局之战:AI 的竞争最终是否会演变成生态的比拼?

AI 的竞争最终将演变成生态的比拼。前期可能拼模型和技术,但最终生态才是关键。大厂需要克服内部官僚和固区壁垒,让原有产品真正被 AI 赋能,并让用户使用上新 AI 功能的版本的产品。

被颠覆的品类:AI 将如何重塑现有产品?例如,NotebookLM 可能让传统笔记应用消失。

AI 将重塑现有产品,例如 Google 表格原生集成了 Gemini,NotebookLM 可能会让传统笔记应用消失。Notebook LM 可以帮助用户收集数据、进行头脑风暴并得出结论,无需做笔记。

生产者工具 vs 消费级产品:目前 AI 更像是生产力工具,尚未出现真正的消费级 AI 应用。

目前 AI 更像是一个生产力工具,可以节约时间、提高效率,但尚未出现真正的消费级 AI 应用。AI 还没有到每个人手边至少有两三个 AI 付费工具,或者每天打开 AI 工具几次的程度。

Watch the Video

Share

Stay Informed with Quality Articles

Discover curated summaries and insights from across the web. Save time while staying informed.

© 2024 BriefRead