开始前先卖个关子:朋友们知道ai.com这个 AI 时代看起来最贵的域名是谁的吗?其实我也不知道,它很神秘,又但会在不同时间指向最火的 AI 产品,而现在它指向了 DeepSeek ->神秘的 AI.com,真的被 DeepSeek 买下来了?话说回来,作为开发界看起来最贵的域名:ai.dev,朋友们知道现在它是谁家的吗?这个我知道,是财大气粗的 Google,它指向了Google AI Studio! 在 LLM 用户体验方面,Google 有些偏科,它在开发者体验方面投入很多,而在用户体验方面发力较晚。最早接触到 Google Deepmind 开发者体验,是前 OpenAI 开发者关系负责人 Logan 的加盟,后来全球最大开源模型社区 HuggingFace 的两位研究员也相继加入,Deepmind 开发者关系团队星光熠熠,几乎没有其他 AI 团队可以相比。印象很深的一次,是 Logan 和著名独立开发者在 X(Twitter) 上就 Google AI Studio 的上手开发体验问题很客观的讨论。大型公司的产品往往都会有一个问题:上手很难、很多集团性的授权、认证和页面跳转等,对新手很不友好。在 Logan 的推动下,Google AI Studio 把新手上手门槛做了很大的优化,进入网站后直接 Google 登录就可以在单个页面内完成 API Key 申请、Playground 体验、复制 Python 代码到 Colab 运行等完整流程。而在近期 Google Gemini 一系列全新能力的发布中,Google AI Studio 也都是首发位置,且都可以免费体验,没有付费门槛,咱们一起看看它都能做什么?最全的 Deepmind 模型可体验,包括 Gemini、Gemma 和其他最新体验类模型。每个模型都有一个模型卡片,把上下文长度、输入输出 token 单价、用途推荐、实际案例、知识截止、限额和延迟等都很明确的说明。另外调用过程还可以指定温度、Top P 等参数,以及标准化输出、方法调用、代码执行、Google 搜索等可选能力。对比两个不同模型在结果输出,调整参数后,选择在你的应用场景下更合适的模型和参数。https://ai.google.dev/gemini-api/docs/rate-limits也可以在 Google AI Studio 个人账号下查询:https://aistudio.google.com/plan_informationGemini live 推出之时非常惊艳,通过实时录制屏幕和语音通话,实时得到 Gemini 的 AI 语音响应,指导网站操作的流程、甚至现实世界中的动作引导等。这个官方示例也是后面很多实时音视频助手的标准做法,录屏后通过特定帧率传输图像和音频,连续理解用户意图和环境,做出有记忆的正确判断和输出。Github -https://github.com/google-gemini/starter-applets官方为开发者集成 Gemini 最新能力提供的示例应用,对场景的启发和新能力的实践都起到了很不错的打样的效果,目前提供了三个场景:1. 空间理解应用 - 展示 Gemini 的 2D 和 3D 空间实时理解与推理能力2. 视频分析 - 调用 Function Call 进行视频内容分析3. 地图探索 - 结合 Gemini 和 Google Map API 探索地图https://github.com/googleapis/python-genaifromgoogleimportgenaiclient=genai.Client(api_key="YOUR_API_KEY")response=client.models.generate_content(model="gemini-2.0-flash",contents="ExplainhowAIworksinafewwords")print(response.text) https://github.com/google-gemini/cookbook开发朋友们一定要关注这个 Cookbook,Google AI Studio 的能力都可以在这里找到对应的代码实现,更新也非常及时。还有一个很重要的功能是在 Colab 打开示例代码,它免去了自己创建 Colab 再粘贴代码的过程,而且预置了参数信息,开发验证非常便捷。这个 Prompt 集合,汇集了很多实用场景下的提示词,如果你想找一些提示词灵感,或想通过提示词来测试对比模型推理结果,这里是一个很不错的集合地。选择下面这个模型,就可以体验图像生成和编辑能力了。通过自然语言生成图像(和图像类模型的使用方法一样),再通过自然语言来局部微调、精修图像。比如下面我们生成钢铁侠的图片后,让 Gemini 把战甲颜色变为橘色,看生成结果是遵循了我的要求的。没想到这个开发者平台,做的效果比图像生成类产品更直接。。Gemini 作为面向 C 端用户的应用,我自己觉得它相比 Google AI Studio 和其他 AI 助手的两个比较大的亮点:Deep Research 和 Canvas。Gemini Deep Research 的强大,依托于 Google 强大的搜索数据,这一点相信任何产品都是不能相比的。它会先拟定一个研究计划,并得到我的许可后,开始执行研究。研究过程中,搜索到的参考网站非常全,一般会超过 100 个,且不会因为我输入了中文,而把 CSDN 等低质量网站纳入研究范围。在搜索数据源和数据源的质量判断上,Google 的能力还是非常值得信赖的。几分钟的搜索和 Gemini 解读整理后,会输出一篇非常完整的研究报告,无论从格式上还是内容详实程度、信息可溯源的角度,质量都非常的高。免费用户每个月都指定的使用次数,感兴趣的朋友可以试试,可以和 Grok-3、OpenAI 等 Deep Research/Search 作对比。Canvas 能力本身并不新鲜,OpenAI Canvas 和 Claude Artifacts 都有类似的能力。Gemini Canvas 可以生成并制定代码页面预览、可以生成文档、SVG 等内容,并支持通过自然语言来互动编辑。
|