将PDF文档转换成音频播客、讲座或摘要PDF2Audio

显示全部楼层

项目简介

此代码可用于将 PDF 转换为音频播客、讲座、摘要等。它使用 OpenAI 的 GPT 模型进行文本生成和文本到语音的转换。您还可以编辑草稿记录（多次）并提供具体评论或有关如何调整或改进的总体指示。

请按照以下步骤使用 Conda 在本地计算机上设置 PDF2Audio：

gitclonehttps://github.com/lamm-mit/PDF2Audio.gitcdPDF2Audio

2. 安装 Miniconda（如果尚未安装）：

3. 创建一个新的Conda环境：

condacreate-npdf2audiopython=3.9

4. 激活Conda环境：

condaactivatepdf2audio

5. 安装所需的依赖项

pipinstall-rrequirements.txt

6. 设置您的 OpenAI API 密钥：在项目根目录中创建一个.env文件并添加您的 OpenAI API 密钥：

OPENAI_API_KEY=your_api_key_here

要运行 PDF2Audio 应用程序：

1.确保您位于项目目录中并且 Conda 环境已激活：

condaactivatepdf2audio

2. 运行启动 Gradio 界面的 Python 脚本：

pythonapp.py

3.打开 Web 浏览器并转到终端中提供的 URL（通常为http://127.0.0.1:7860）。

4. 使用 Gradio 界面上传 PDF 文件并将其转换为音频。

https://github.com/lamm-mit/PDF2Audio