传统的解决方案,如手写正则表达式,不仅复杂、易错,而且面对稍微变化的文本就可能全部崩溃。而直接使用大语言模型(LLM)呢?虽然强大,但输出格式常常随心所欲,结果难以保证稳定,更别提处理长篇文档了。Google Research最近开源了一个名为
https://github.com/google/langextract
LangExtract是一个基于大语言模型(LLM)的。你只需要:
LangExtract并非简单地调用了一下 LLM API,它内置的几大核心特性:
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |