返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

微软那个打爆 GPT4o的 14B 小模型Phi-4,上了 Ollama 了,但是我想劝退你

[复制链接]
链载Ai 显示全部楼层 发表于 半小时前 |阅读模式 打印 上一主题 下一主题

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 15px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">最近,微软发布了一个非常有意思的开源模型——ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: inherit;color: rgb(183, 110, 121);">Phi-4[1],据说这是个参数量只有ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: inherit;color: rgb(183, 110, 121);">140亿的「黑科技」,但是打爆了 GPT-4o。乍一听感觉挺酷炫,但它到底是干啥的?又有什么特别之处?


ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;color: rgb(183, 110, 121);">ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: inherit;color: rgb(183, 110, 121);">Phi-4 是个啥?

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 15px;text-indent: 2em;letter-spacing: 0.1em;color: rgb(63, 63, 63);">先来看两组图

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 15px;color: rgb(63, 63, 63);">ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 15px;margin: 0.1em auto 0.5em;border-radius: 8px;box-shadow: rgba(0, 0, 0, 0.1) 0px 4px 8px;height: auto !important;" title="null" src="https://api.ibos.cn/v4/weapparticle/accesswximg?aid=101126&url=aHR0cHM6Ly9tbWJpei5xcGljLmNuL21tYml6X3BuZy9vWHFHOEVUdkFlbTBEYXE2UVM4WVpKWGljVVM4Q05IdWJKZkJzTnAzaWF3WXRxM0g4MHMwTzJjQzE0OFpFUzFZV09XTFEwVDJWWkwxdkhYWnpoVXEyR3NnLzY0MD93eF9mbXQ9cG5nJmFtcA==;from=appmsg"/>
ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 15px;color: rgb(63, 63, 63);">ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 15px;margin: 0.1em auto 0.5em;border-radius: 8px;box-shadow: rgba(0, 0, 0, 0.1) 0px 4px 8px;height: auto !important;" title="null" src="https://api.ibos.cn/v4/weapparticle/accesswximg?aid=101126&url=aHR0cHM6Ly9tbWJpei5xcGljLmNuL21tYml6X3BuZy9vWHFHOEVUdkFlbTBEYXE2UVM4WVpKWGljVVM4Q05IdWJQa2JWbHc4am91RnZGaEVaNVVxTlJ5MnNCN0NrdHFCMFpoWWxRWFpkckdTbGs5VGlhU0RKS1JBLzY0MD93eF9mbXQ9cG5nJmFtcA==;from=appmsg"/>

简单来说,Phi-4 是微软推出的一个开源语言模型。140亿参数听起来可能不算业界最大(像 GPT-4 那种基本都是千亿级别),但它的目标是「精致小巧」,专注在一些特定场景中表现更佳。

Phi-4 的训练数据来源挺多样化,包括:

  • • 合成数据集(Synthetic datasets)
  • • 经过筛选的公共领域网站内容
  • • 学术书籍和问答数据集

这些数据让模型有了很好的通用性,同时它还经过了超级严格的调优流程

  1. 1.监督微调(Supervised Fine-Tuning):让模型学会按照特定指令回答问题;
  2. 2.直接偏好优化(Direct Preference Optimization):进一步提升回答的相关性和安全性。

最终,Phi-4 支持16k tokens的上下文长度,也就是它可以在一次对话中处理大约 12,000 个英文单词。这在中小规模模型中,算是相当大的提升。


微软造它是为了啥?

按照微软的官方描述,Phi-4 是为了解决以下几类问题而设计的:

  1. 1.资源受限的环境
    如果你的设备内存有限或者算力不高,比如在一些移动端设备或边缘计算场景下,Phi-4 仍能高效运行。
  2. 2.对响应速度要求高的场景
    想象一下,用户输入一个问题,你需要几乎零延迟地返回答案,这种「低延迟」需求也是 Phi-4 擅长的领域。
  3. 3.逻辑推理与复杂任务
    Phi-4 不光能聊聊天,还能应对需要逻辑推理或多步计算的任务,比如生成表格、处理复杂的文本分析任务等。

能不能用它做更酷的事?

老实说,Phi-4 的定位更像是一块「通用工具砖」,它适合搭建很多通用型的生成式 AI 系统,比如客服机器人、语言分析工具,或者轻量级的 AI 辅助功能。

但是,注意了!
Phi-4 并不是万能的,我就是来泼冷水的,我们看到问题一定要理性,不能只看他比较优秀的一面,在用他的时候,得看自己是否可以接受它不好的一面,没错,它也有很多局限性:

  1. 1.某些高风险场景慎用
    比如医疗诊断、金融分析这类对准确性和安全性要求特别高的领域,用之前得非常谨慎,自己也得做额外的测试。
  2. 2.非英语场景表现一般
    Phi-4 主打英文场景,对其他语言的支持相对较弱。如果你有多语言需求,可能需要结合其他模型。

开发者必看:Phi-4 的技术细节

为了让大家更直观地理解 Phi-4,我们总结了一些它的关键参数和特点,并用表格对比了市面上其他类似的模型。

模型名称参数量上下文长度适用场景开源协议
Phi-4
140亿
16k tokens
内存受限、低延迟、逻辑推理
MIT License
GPT-3.5
1750亿
4k tokens
通用 AI 应用
未开源
LLaMA 2
130亿
4k tokens
通用任务,性能优越
开源(部分限制)

运行环境建议
微软在设计 Phi-4 时特别考虑了硬件性能受限的场景,这点对普通开发者来说很友好。以下是模型的推荐配置:

{
"model":"phi4",
"params":{
"quantization":"Q4_K_M",// 支持低比特量化
"context_length":16000,// 上下文长度
"hardware_requirements":{
"RAM":">= 16GB",
"GPU":">= NVIDIA 2060"
}
}
}

此外,Phi-4 还支持多种部署方式,包括本地运行和云端 API 调用,灵活性很高。


实际使用体验如何?

微软官方提供了一些基准测试结果,根据他们的评估,Phi-4 的性能在同级模型中非常突出。它的特点是精准性高、响应速度快,特别适合一些对上下文理解要求高的任务。

不过,我们也在实际测试中发现了一些问题:

  1. 1.长上下文处理效果有时会退化
    当上下文长度超过 10k tokens 时,模型可能会出现一些「记忆力减退」的情况。
  2. 2.对复杂的推理任务偶尔不稳定
    比如多步逻辑推理中,如果中间过程有模糊表述,模型容易跑偏。

Phi-4 值得一试吗?

如果你是开发者,正在寻找一个轻量级、低成本的开源大模型来搭建生成式 AI 应用,那 Phi-4 绝对是一个值得一试的选择。尤其是在算力受限或需要高实时性的场景下,它能给你带来很大帮助。

当然,这个模型也有局限性,特别是在复杂推理或非英语任务中,可能还需要和其他模型配合使用。

一句话总结:好用,但别全指望它


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ