项目简介
Firecrawl 是一个由 Mendable.ai 和其社区共同开发的 API 服务,它能够将整个网站转换成适用于大型语言模型(LLM)的 Markdown 或结构化数据。
该服务通过爬取网站及其所有可访问的子页面,提供干净的数据,无需网站地图。
1. API调用:
使用API密钥,通过cURL命令行工具或SDK调用Firecrawl API。
2. Python SDK
pip install firecrawl-pyfromfirecrawlimportFirecrawlApp
app=FirecrawlApp(api_key="YOUR_API_KEY")
crawl_result=app.crawl_url('mendable.ai',{'crawlerOptions':{'excludes':['blog/*']}})
forresultincrawl_result:
print(result['markdown'])
npm install @mendable/firecrawl-jsimportFirecrawlAppfrom"@mendable/firecrawl-js";
constapp=newFirecrawlApp({
apiKey:"fc-YOUR_API_KEY",
});
consturl='https://example.com';
constscrapedData=awaitapp.scrapeUrl(url);
console.log(scrapedData);
注意事项: 用户在使用Firecrawl进行抓取、搜索和爬取活动之前,应遵守适用的隐私政策和网站的使用条款。
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |