diff --git a/README.md b/README.md
index b77194e..c1c8cb0 100644
--- a/README.md
+++ b/README.md
@@ -26,7 +26,6 @@
## 特别感谢 🙏
由于该项目的 **部署** 和 **使用**,对于一些小白用户来说,还是 **有一定的门槛**,在此特别感谢
-
**录咖(AI智能 多媒体服务平台)** 网站基于该项目,提供的免费`AI视频生成器`服务,可以不用部署,直接在线使用,非常方便。
- 中文版:https://reccloud.cn
@@ -34,6 +33,14 @@

+## 感谢赞助 🙏
+
+感谢佐糖 https://picwish.cn 对该项目的支持和赞助,使得该项目能够持续的更新和维护。
+
+佐糖专注于**图像处理领域**,提供丰富的**图像处理工具**,将复杂操作极致简化,真正实现让图像处理更简单。
+
+
+
## 功能特性 🎯
- [x] 完整的 **MVC架构**,代码 **结构清晰**,易于维护,支持 `API` 和 `Web界面`
@@ -50,7 +57,8 @@
- [x] 视频素材来源 **高清**,而且 **无版权**
- [x] 支持 **OpenAI**、**moonshot**、**Azure**、**gpt4free**、**one-api**、**通义千问**、**Google Gemini**、**Ollama** 等多种模型接入
- ❓[如何使用免费的 **OpenAI GPT-3.5** 模型?](https://github.com/harry0703/MoneyPrinterTurbo?tab=readme-ov-file#%E5%B8%B8%E8%A7%81%E9%97%AE%E9%A2%98-)
+ ❓[如何使用免费的 **OpenAI GPT-3.5
+ ** 模型?](https://github.com/harry0703/MoneyPrinterTurbo?tab=readme-ov-file#%E5%B8%B8%E8%A7%81%E9%97%AE%E9%A2%98-)
### 后期计划 📅
@@ -59,15 +67,25 @@
- [ ] 增加视频转场效果,使其看起来更加的流畅
- [ ] 增加更多视频素材来源,优化视频素材和文案的匹配度
- [ ] 增加视频长度选项:短、中、长
-- [ ] 打包成一键启动包(Windows,macOS),方便使用
- [ ] 增加免费网络代理,让访问OpenAI和素材下载不再受限
- [ ] 可以使用自己的素材
- [ ] 朗读声音和背景音乐,提供实时试听
-- [ ] 支持更多的语音合成服务商,比如 OpenAI TTS, Azure TTS
+- [ ] 支持更多的语音合成服务商,比如 OpenAI TTS
- [ ] 自动上传到YouTube平台
## 交流讨论 💬
-
+
+
+
+## 更新日志
+
+### 2024-04-16 v1.1.2
+
+- 支持azure新发布的9种语音合成声音(需要配置API
+ KEY) [9个更真实的AI对话声音](https://techcommunity.microsoft.com/t5/ai-azure-ai-services-blog/9-more-realistic-ai-voices-for-conversations-now-generally/ba-p/4099471)
+- 优化字幕显示
+- 修复内存泄露问题
+- 一些其他的bug修复和优化
## 视频演示 📺
@@ -77,12 +95,14 @@
| ▶️ 《如何增加生活的乐趣》 |
+▶️ 《金钱的作用》 更真实的合成声音 |
▶️ 《生命的意义是什么》 |
|
+ |
|
@@ -106,16 +126,27 @@
## 配置要求 📦
+
- 建议最低 CPU 4核或以上,内存 8G 或以上,显卡非必须
- Windows 10 或 MacOS 11.0 以上系统
+## 快速开始 🚀
+
+下载一键启动包,解压直接使用
+
+### Windows
+
+- 百度网盘: https://pan.baidu.com/s/1bpGjgQVE5sADZRn3A6F87w?pwd=xt16 提取码: xt16
+
+下载后,建议先**双击执行** `update.bat` 更新到**最新代码**,然后双击 `start.bat` 启动Web界面
+
+### 其他系统
+还没有制作一键启动包,看下面的 **安装部署** 部分,建议使用 **docker** 部署,更加方便。
+
## 安装部署 📥
-> 不想部署的可以直接下载安装包,解压直接使用
-- **Windows** 版本下载地址
- - 百度网盘: https://pan.baidu.com/s/1BB3SGtAFTytzFLS5t2d8Gg?pwd=5bry
-
### 前提条件
+
- 尽量不要使用 **中文路径**,避免出现一些无法预料的问题
- 请确保你的 **网络** 是正常的,VPN需要打开`全局流量`模式
@@ -146,6 +177,7 @@ git clone https://github.com/harry0703/MoneyPrinterTurbo.git
如果未安装 Docker,请先安装 https://www.docker.com/products/docker-desktop/
如果是Windows系统,请参考微软的文档:
+
1. https://learn.microsoft.com/zh-cn/windows/wsl/install
2. https://learn.microsoft.com/zh-cn/windows/wsl/tutorials/wsl-containers
@@ -224,6 +256,7 @@ webui.bat
conda activate MoneyPrinterTurbo
sh webui.sh
```
+
启动后,会自动打开浏览器
#### ④ 启动API服务 🚀
@@ -238,6 +271,8 @@ python main.py
所有支持的声音列表,可以查看:[声音列表](./docs/voice-list.txt)
+2024-04-16 v1.1.2 新增了9种Azure的语音合成声音,需要配置API KEY,该声音合成的更加真实。
+
## 字幕生成 📜
当前支持2种字幕生成方式:
@@ -250,17 +285,20 @@ python main.py
建议使用 `edge` 模式,如果生成的字幕质量不好,再切换到 `whisper` 模式
> 注意:
+
1. whisper 模式下需要到 HuggingFace 下载一个模型文件,大约 3GB 左右,请确保网络通畅
2. 如果留空,表示不生成字幕。
> 由于国内无法访问 HuggingFace,可以使用以下方法下载 `whisper-large-v3` 的模型文件
下载地址:
+
- 百度网盘: https://pan.baidu.com/s/11h3Q6tsDtjQKTjUu3sc5cA?pwd=xjs9
- 夸克网盘:https://pan.quark.cn/s/3ee3d991d64b
模型下载后解压,整个目录放到 `.\MoneyPrinterTurbo\models` 里面,
最终的文件路径应该是这样: `.\MoneyPrinterTurbo\models\whisper-large-v3`
+
```
MoneyPrinterTurbo
├─models
@@ -284,19 +322,22 @@ MoneyPrinterTurbo
## 常见问题 🤔
### ❓如何使用免费的OpenAI GPT-3.5模型?
+
[OpenAI宣布ChatGPT里面3.5已经免费了](https://openai.com/blog/start-using-chatgpt-instantly),有开发者将其封装成了API,可以直接调用
**确保你安装和启动了docker服务**,执行以下命令启动docker服务
+
```shell
docker run -p 3040:3040 missuo/freegpt35
```
+
启动成功后,修改 `config.toml` 中的配置
+
- `llm_provider` 设置为 `openai`
- `openai_api_key` 随便填写一个即可,比如 '123456'
- `openai_base_url` 改为 `http://localhost:3040/v1/`
- `openai_model_name` 改为 `gpt-3.5-turbo`
-
### ❓AttributeError: 'str' object has no attribute 'choices'`
这个问题是由于 OpenAI 或者其他 LLM,没有返回正确的回复导致的。
@@ -416,7 +457,6 @@ pip install Pillow==8.4.0
点击查看 [`LICENSE`](LICENSE) 文件
-
## Star History
[](https://star-history.com/#harry0703/MoneyPrinterTurbo&Date)
\ No newline at end of file
diff --git a/docs/picwish.jpg b/docs/picwish.jpg
new file mode 100644
index 0000000..d60d03a
Binary files /dev/null and b/docs/picwish.jpg differ