返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

四月及五一假期LLM KG RAG产研总结:开源的继续奔放与RAG等的转向

[复制链接]
链载Ai 显示全部楼层 发表于 前天 09:47 |阅读模式 打印 上一主题 下一主题

今天是20224年5月10日,星期五,北京,天气雨,雨过后的晚霞很漂亮。

今天我们来回顾4月份大模型进展,昨日,老刘说NLP社区顺利完成第十八讲《老刘说NLP2024年4月份及五一LLM+KG+RAG产研总结:有趣的开源项目、技术观点及产品进展》,从大模型关联总结【开源、产品流量变化等】,RAG、KG、RAG以及文档图表理解、Agent几个方面进行了回顾。

本文择报告中的部分内容,供大家一起参考,如果每月形式的技术汇报感兴趣,欢迎加入社区,一起看看,共享每日早报、社区交流及每月线上分享等活动。

一、四月份大模型关键进展

4月份在开源侧,其实出现了多个关键事件,尤其是llama3的开源,后续延生出来的数十个llama3中文微调模型。
此外,在音乐生成方面,4月份也有一些动作,也出来了一些很有影响力的整理工作,此外,也有lecun一直以来对当前自回归模型的不同看法。
当然,在综述总结侧,四月份也涌现出了一些可以学习的综述性论文、开放课程等,涉及大模型自身理论与实践,多模态prompt等,这块有一些指引,

二、四月份RAG、Agent、KG等的一些有趣的话题

当前,RAG已经进入稳态,RAG与知识图谱相关的进展并不是很多,大多的工作还是集中在评估、方案集成的思想上,随着RAG的不断发展,对文档进行预处理的工作,也逐步受到关注,例如文档的版式分析、阅读顺序等。
当然,目前也延伸出来很多有趣的话题,比如RAG的长文本压缩、大模型到底理不理解图表,RAG中如何引入时间相关性、Agent的实现范式及角色定位、RAG中的文档处理具象化理解、RAG文档处理中的语义分割问题,RAG后续的演化方向、一些值得参加和关注的RAG竞赛等,可以有十多个有趣话题。
而特别的,对于Agent的进展,我们认为,其实际上是一种工程上的花活。
关于这块,早上看到一个很有意思的总结工作,来自https://mp.weixin.qq.com/s/kCXZN7Wli-RCvZXRb6mF7g,其对Agent的一些总结很到位,感兴趣的可以点击原文查看,会更有收获,图片及部分摘录如下:
1、Agent 的规划能力依赖于prompt 工程能力,它比想象中更重要、执行起来也更琐碎。


2、目前 LLM 的数学、逻辑推理能力在 COT 的基础上也仅能勉强达到及格水平,所以不要让Agent一次性做复杂的推理性规划工作,而是把复杂任务人工拆解后再教给Agent。

3、Agent 的 Action 能力强烈依赖于基座模型的 function calling 能力。在规划 Agent 之前,对模型的 function calling 能力要充分调研。

关于我们

老刘,刘焕勇,NLP开源爱好者与践行者,主页:https://liuhuanyong.github.io。

老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。

对于想加入更优质的知识图谱、事件图谱、大模型AIGC实践、相关分享的,可关注公众号,在后台菜单栏中点击会员社区->会员入群加入。

 

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ