链载Ai

标题: Falcon OS 第一篇: 开源的 LLM 操作系统 [打印本页]

作者: 链载Ai    时间: 昨天 09:45
标题: Falcon OS 第一篇: 开源的 LLM 操作系统

当阿联酋的技术创新研究所于2023年5月宣布推出其Falcon 40B模型时,这对我的专业生涯产生了巨大的影响。作为AWS的生成性人工智能(GenAI)解决方案架构师,我与客户合作,使用大型语言模型(LLMs)构建解决方案,许多组织对于在私有(云)环境中托管开源模型感兴趣,而不是通过互联网向面向公众的API发送请求。

当时的问题是,对于许多常见的客户用例来说,开源LLM还不够好。Falcon模型改变了这一切:它是第一个具有商业许可的开源LLM,足够健壮,适用于客户演示。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: 0.544px;background-color: rgb(255, 255, 255);color: rgb(63, 63, 63);text-align: center;line-height: 1.75em;box-sizing: border-box !important;overflow-wrap: break-word !important;">发布公告

绍Falcon 40B

Falcon-40B是一个拥有400亿参数的因果解码器模型,可在Apache 2.0许可下使用,该许可允许商业使用而无需支付版税或限制。在发布时,它作为领先的开源模型脱颖而出,超越了LLaMA、StableLM、RedPajama和MPT等其他模型。Falcon支持多种语言,包括英语、德语、西班牙语、法语(以及意大利语、葡萄牙语、波兰语、荷兰语、罗马尼亚语、捷克语、瑞典语的有限能力)。Falcon发展的一个核心区别在于训练数据的质量。为Falcon 40B收集的预训练数据的大小近一万亿个标记,来自公共网络爬虫(约80%)、研究论文、法律文本、新闻、文学和社交媒体对话。由于LLM对其训练数据特别敏感,该团队建立了一个自定义数据管道,使用广泛的过滤和去重复,分别在样本和字符串级别实现,以提取高质量的预训练数据。Falcon团队最近发布了详细介绍数据整理和训练过程的综合研究论文:

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: 0.544px;background-color: rgb(255, 255, 255);color: rgb(63, 63, 63);text-align: center;line-height: 1.75em;box-sizing: border-box !important;overflow-wrap: break-word !important;">Falcon研究论文

Falcon的能力对我来说是一个游戏规则改变者 - 我终于能够为热门用例构建客户演示,例如私有文件聊天机器人:

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: 0.544px;background-color: rgb(255, 255, 255);color: rgb(63, 63, 63);text-align: center;line-height: 1.75em;box-sizing: border-box !important;overflow-wrap: break-word !important;">使用Falcon-40B的文件聊天机器人

简短演示:https://www.linkedin.com/posts/mtmancuso_aws-genai-awsswitzerland-activity-7079911261156585472-Wl17/GitHub仓库:https://github.com/marshmellow77/falcon-document-chatbot

Falcon 40B征集提案

意识到该模型的受欢迎程度后,2023年6月,Falcon团队发起了征集提案活动,邀请科学家、研究人员和创新者提交有影响力的用例和应用想法。最杰出的提案将获得培训计算能力的投资,以利用这个强大的模型开展塑造变革性解决方案的工作。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: 0.544px;background-color: rgb(255, 255, 255);color: rgb(63, 63, 63);text-align: center;line-height: 1.75em;box-sizing: border-box !important;overflow-wrap: break-word !important;">Falcon 40B征集提案

我的提案:Falcon OS

我的提案是开发一个以Falcon 48B作为核心处理单元的“操作系统”:“Falcon OS”。这类似于安德烈·卡帕西(Andrej Karpathy)为LLM扮演AI系统的指挥大脑所概述的概念。鉴于Falcon的开源性质,我希望探索将其用于这种能力,而不是像GPT-4这样的封闭专有模型。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: 0.544px;background-color: rgb(255, 255, 255);color: rgb(63, 63, 63);text-align: center;line-height: 1.75em;box-sizing: border-box !important;overflow-wrap: break-word !important;">来自安德烈视频的LLM OS

总的来说,Falcon OS有潜力引领未来,使Falcon模型不仅仅是一个特定任务的工具,而是编织进如何操作和互动计算机的方式中,使其对广泛应用更加直观和强大。

TII宣布Falcon 40B决赛选手几周前,技术创新研究所(TII)宣布了决赛选手,我很激动也很荣幸我的提案入围前五名:

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: 0.544px;background-color: rgb(255, 255, 255);color: rgb(63, 63, 63);text-align: center;line-height: 1.75em;box-sizing: border-box !important;overflow-wrap: break-word !important;">很荣幸成为决赛选手

作为决赛选手,我获得了培训计算积分,我可以使用它来追求我的Falcon OS想法?

潜在影响

我相信Falcon OS对组织的潜在影响可能是重大的。通过在其核心集成一个开源语言模型,Falcon OS为企业和机构提供了开发先进的AI驱动应用程序的机会,而无需受制于专有系统的约束。这种自由可能会引发创新浪潮,因为开发者和公司可以根据他们的特定需求和定制数据,定制和微调操作系统,创建由LLM驱动的界面。潜在用例包括:

Falcon的包容性质,得益于其宽松的许可证,为更加民主化的AI格局铺平了道路。这种易于使用意味着即使是资源有限的小型组织也可以实验和受益于这项技术和这个项目。因此,Falcon OS有潜力成为游戏规则的改变者,在AI领域平衡竞争环境,并促进社区驱动的AI开发和应用生态系统。

未来的旅程

我打算公开记录这个项目,包括学到的经验和失败,以便他人可以重新创建和贡献。我将使用博客文章更新进展情况,并设置GitHub仓库。我还考虑创建一个“Falcon OS GPT”(使用OpenAI的服务创建专门的GPT),以协助回答有关项目进展的专业问题。这对我自己或其他人查询有关项目内容的模型可能会有帮助。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: 0.544px;background-color: rgb(255, 255, 255);color: rgb(63, 63, 63);text-align: center;line-height: 1.75em;box-sizing: border-box !important;overflow-wrap: break-word !important;">OpenAI引入GPT

总的来说,我很兴奋能够探索Falcon作为复杂任务的开放工具生态系统基础的潜力,LLM作为协调核心。我将专注于制定提示和微调,以利用多种工具如数据库和文档存储库,赋予Falcon解决问题的能力。我希望这种透明的记录我的成功、挫折和教训可以帮助推动真正的OpenAI开发。






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5