diff --git a/README.md b/README.md index b77194e..c1c8cb0 100644 --- a/README.md +++ b/README.md @@ -26,7 +26,6 @@ ## 特别感谢 🙏 由于该项目的 **部署** 和 **使用**,对于一些小白用户来说,还是 **有一定的门槛**,在此特别感谢 - **录咖(AI智能 多媒体服务平台)** 网站基于该项目,提供的免费`AI视频生成器`服务,可以不用部署,直接在线使用,非常方便。 - 中文版:https://reccloud.cn @@ -34,6 +33,14 @@ ![](docs/reccloud.cn.jpg) +## 感谢赞助 🙏 + +感谢佐糖 https://picwish.cn 对该项目的支持和赞助,使得该项目能够持续的更新和维护。 + +佐糖专注于**图像处理领域**,提供丰富的**图像处理工具**,将复杂操作极致简化,真正实现让图像处理更简单。 + +![picwish.jpg](docs/picwish.jpg) + ## 功能特性 🎯 - [x] 完整的 **MVC架构**,代码 **结构清晰**,易于维护,支持 `API` 和 `Web界面` @@ -50,7 +57,8 @@ - [x] 视频素材来源 **高清**,而且 **无版权** - [x] 支持 **OpenAI**、**moonshot**、**Azure**、**gpt4free**、**one-api**、**通义千问**、**Google Gemini**、**Ollama** 等多种模型接入 - ❓[如何使用免费的 **OpenAI GPT-3.5** 模型?](https://github.com/harry0703/MoneyPrinterTurbo?tab=readme-ov-file#%E5%B8%B8%E8%A7%81%E9%97%AE%E9%A2%98-) + ❓[如何使用免费的 **OpenAI GPT-3.5 + ** 模型?](https://github.com/harry0703/MoneyPrinterTurbo?tab=readme-ov-file#%E5%B8%B8%E8%A7%81%E9%97%AE%E9%A2%98-) ### 后期计划 📅 @@ -59,15 +67,25 @@ - [ ] 增加视频转场效果,使其看起来更加的流畅 - [ ] 增加更多视频素材来源,优化视频素材和文案的匹配度 - [ ] 增加视频长度选项:短、中、长 -- [ ] 打包成一键启动包(Windows,macOS),方便使用 - [ ] 增加免费网络代理,让访问OpenAI和素材下载不再受限 - [ ] 可以使用自己的素材 - [ ] 朗读声音和背景音乐,提供实时试听 -- [ ] 支持更多的语音合成服务商,比如 OpenAI TTS, Azure TTS +- [ ] 支持更多的语音合成服务商,比如 OpenAI TTS - [ ] 自动上传到YouTube平台 ## 交流讨论 💬 - + + + +## 更新日志 + +### 2024-04-16 v1.1.2 + +- 支持azure新发布的9种语音合成声音(需要配置API + KEY) [9个更真实的AI对话声音](https://techcommunity.microsoft.com/t5/ai-azure-ai-services-blog/9-more-realistic-ai-voices-for-conversations-now-generally/ba-p/4099471) +- 优化字幕显示 +- 修复内存泄露问题 +- 一些其他的bug修复和优化 ## 视频演示 📺 @@ -77,12 +95,14 @@ ▶️ 《如何增加生活的乐趣》 +▶️ 《金钱的作用》
更真实的合成声音 ▶️ 《生命的意义是什么》 + @@ -106,16 +126,27 @@ ## 配置要求 📦 + - 建议最低 CPU 4核或以上,内存 8G 或以上,显卡非必须 - Windows 10 或 MacOS 11.0 以上系统 +## 快速开始 🚀 + +下载一键启动包,解压直接使用 + +### Windows + +- 百度网盘: https://pan.baidu.com/s/1bpGjgQVE5sADZRn3A6F87w?pwd=xt16 提取码: xt16 + +下载后,建议先**双击执行** `update.bat` 更新到**最新代码**,然后双击 `start.bat` 启动Web界面 + +### 其他系统 +还没有制作一键启动包,看下面的 **安装部署** 部分,建议使用 **docker** 部署,更加方便。 + ## 安装部署 📥 -> 不想部署的可以直接下载安装包,解压直接使用 -- **Windows** 版本下载地址 - - 百度网盘: https://pan.baidu.com/s/1BB3SGtAFTytzFLS5t2d8Gg?pwd=5bry - ### 前提条件 + - 尽量不要使用 **中文路径**,避免出现一些无法预料的问题 - 请确保你的 **网络** 是正常的,VPN需要打开`全局流量`模式 @@ -146,6 +177,7 @@ git clone https://github.com/harry0703/MoneyPrinterTurbo.git 如果未安装 Docker,请先安装 https://www.docker.com/products/docker-desktop/ 如果是Windows系统,请参考微软的文档: + 1. https://learn.microsoft.com/zh-cn/windows/wsl/install 2. https://learn.microsoft.com/zh-cn/windows/wsl/tutorials/wsl-containers @@ -224,6 +256,7 @@ webui.bat conda activate MoneyPrinterTurbo sh webui.sh ``` + 启动后,会自动打开浏览器 #### ④ 启动API服务 🚀 @@ -238,6 +271,8 @@ python main.py 所有支持的声音列表,可以查看:[声音列表](./docs/voice-list.txt) +2024-04-16 v1.1.2 新增了9种Azure的语音合成声音,需要配置API KEY,该声音合成的更加真实。 + ## 字幕生成 📜 当前支持2种字幕生成方式: @@ -250,17 +285,20 @@ python main.py 建议使用 `edge` 模式,如果生成的字幕质量不好,再切换到 `whisper` 模式 > 注意: + 1. whisper 模式下需要到 HuggingFace 下载一个模型文件,大约 3GB 左右,请确保网络通畅 2. 如果留空,表示不生成字幕。 > 由于国内无法访问 HuggingFace,可以使用以下方法下载 `whisper-large-v3` 的模型文件 下载地址: + - 百度网盘: https://pan.baidu.com/s/11h3Q6tsDtjQKTjUu3sc5cA?pwd=xjs9 - 夸克网盘:https://pan.quark.cn/s/3ee3d991d64b 模型下载后解压,整个目录放到 `.\MoneyPrinterTurbo\models` 里面, 最终的文件路径应该是这样: `.\MoneyPrinterTurbo\models\whisper-large-v3` + ``` MoneyPrinterTurbo ├─models @@ -284,19 +322,22 @@ MoneyPrinterTurbo ## 常见问题 🤔 ### ❓如何使用免费的OpenAI GPT-3.5模型? + [OpenAI宣布ChatGPT里面3.5已经免费了](https://openai.com/blog/start-using-chatgpt-instantly),有开发者将其封装成了API,可以直接调用 **确保你安装和启动了docker服务**,执行以下命令启动docker服务 + ```shell docker run -p 3040:3040 missuo/freegpt35 ``` + 启动成功后,修改 `config.toml` 中的配置 + - `llm_provider` 设置为 `openai` - `openai_api_key` 随便填写一个即可,比如 '123456' - `openai_base_url` 改为 `http://localhost:3040/v1/` - `openai_model_name` 改为 `gpt-3.5-turbo` - ### ❓AttributeError: 'str' object has no attribute 'choices'` 这个问题是由于 OpenAI 或者其他 LLM,没有返回正确的回复导致的。 @@ -416,7 +457,6 @@ pip install Pillow==8.4.0 点击查看 [`LICENSE`](LICENSE) 文件 - ## Star History [![Star History Chart](https://api.star-history.com/svg?repos=harry0703/MoneyPrinterTurbo&type=Date)](https://star-history.com/#harry0703/MoneyPrinterTurbo&Date) \ No newline at end of file diff --git a/docs/picwish.jpg b/docs/picwish.jpg new file mode 100644 index 0000000..d60d03a Binary files /dev/null and b/docs/picwish.jpg differ