From f0c0716a4f9bd0d07f34c097ccf413413c381758 Mon Sep 17 00:00:00 2001
From: liuhuapiaoyuan <278780765@qq.com>
Date: Wed, 23 Oct 2024 15:42:30 +0800
Subject: [PATCH 1/4] fix: fix menu scrollbar

---
 frontend/src/App.tsx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)
diff --git a/frontend/src/App.tsx b/frontend/src/App.tsx
index e5fac99..ad9483e 100644
--- a/frontend/src/App.tsx
+++ b/frontend/src/App.tsx
@@ -36,7 +36,7 @@ function App() {
   }
   return (
     <div className="h-screen flex flex-col overflow-hidden">
-      <main className="flex-grow flex bg-[rgb(245,245,245)]">
+      <main className="flex-grow flex bg-[rgb(245,245,245)] h-full">
         <Menu
           handleGenerate={handleGenerate}
           isGenerating={isGenerating}

From 6ccc8b68c2881680c95b4a5b274b4e304be13212 Mon Sep 17 00:00:00 2001
From: liuhuapiaoyuan <278780765@qq.com>
Date: Wed, 23 Oct 2024 15:43:15 +0800
Subject: [PATCH 2/4] feat: add voice provider (adapter fishaudio)

---
 backend/.gitignore                  |   1 +
 backend/api/routes/chat.py          |  14 +++-
 backend/constants.py                |  38 ++++++++++-
 backend/fishaudio.py                |  34 ++++++++++
 backend/requirements.txt            |   1 +
 backend/utils.py                    |  41 +++++++++---
 frontend/src/components/content.tsx |   2 +
 frontend/src/components/menu.tsx    | 100 +++++++++++++++++++++++-----
 frontend/src/hooks/useSpeeker.ts    |  32 +++++++++
 9 files changed, 233 insertions(+), 30 deletions(-)
 create mode 100644 backend/fishaudio.py
 create mode 100644 frontend/src/hooks/useSpeeker.ts

diff --git a/backend/.gitignore b/backend/.gitignore
index 993dacd..e2c2b07 100644
--- a/backend/.gitignore
+++ b/backend/.gitignore
@@ -7,3 +7,4 @@ htmlcov
 .cache
 .venv
 .env
+tmp/cache/*
\ No newline at end of file
diff --git a/backend/api/routes/chat.py b/backend/api/routes/chat.py
index a5209ad..2a2dab5 100644
--- a/backend/api/routes/chat.py
+++ b/backend/api/routes/chat.py
@@ -3,6 +3,7 @@
 from fastapi.responses import StreamingResponse, JSONResponse
 import json
 from typing import Dict, Optional
+from constants import SPEEKERS
 from utils import combine_audio, generate_dialogue, generate_podcast_info, generate_podcast_summary, get_pdf_text
 
 router = APIRouter()
@@ -25,6 +26,12 @@ async def generate_transcript(
 def test():
     return {"message": "Hello World"}
 
+
+@router.get("/speekers")
+def speeker():
+    return JSONResponse(content=SPEEKERS)
+
+
 @router.post("/summarize")
 async def get_summary(
     textInput: str = Form(...),
@@ -67,12 +74,15 @@ async def get_pod_info(
 async def audio(
     background_tasks: BackgroundTasks,
     text: str = Form(...),
-    language: str = Form(...)
+    host_voice: str = Form(...),
+    guest_voice: str = Form(...),
+    language: str = Form(...) ,
+    provider: str = Form(...)
 ):  
     task_id = str(uuid.uuid4())
     task_status[task_id] = {"status": "processing"}
     
-    background_tasks.add_task(combine_audio, task_status, task_id, text, language)
+    background_tasks.add_task(combine_audio, task_status, task_id, text, language,provider , host_voice,guest_voice)
 
     return JSONResponse(content={"task_id": task_id, "status": "processing"})
 
diff --git a/backend/constants.py b/backend/constants.py
index 93ae7f3..da87af2 100644
--- a/backend/constants.py
+++ b/backend/constants.py
@@ -23,11 +23,14 @@
 
 SPEECH_KEY = os.getenv('SPEECH_KEY')
 SPEECH_REGION = "japaneast"
+
+FISHAUDIO_KEY = os.getenv('FISHAUDIO_KEY')
+
 # Fireworks API-related constants
 FIREWORKS_API_KEY = os.getenv('FIREWORKS_API_KEY')
-FIREWORKS_BASE_URL = "https://api.fireworks.ai/inference/v1"
+FIREWORKS_BASE_URL = os.getenv('FIREWORKS_BASE_URL',"https://api.fireworks.ai/inference/v1")
 FIREWORKS_MAX_TOKENS = 16_384
-FIREWORKS_MODEL_ID = "accounts/fireworks/models/llama-v3p1-405b-instruct"
+FIREWORKS_MODEL_ID = os.getenv('FIREWORKS_MODEL_ID',"accounts/fireworks/models/llama-v3p1-405b-instruct")
 FIREWORKS_TEMPERATURE = 0.1
 FIREWORKS_JSON_RETRY_ATTEMPTS = 3
 # Suno related constants
@@ -47,3 +50,34 @@
     "Turkish": "tr",
 }
 
+
+FISHAUDIO_SPEEKER = [
+    { "id": "59cb5986671546eaa6ca8ae6f29f6d22", "name": "央视配音" },
+    { "id": "738d0cc1a3e9430a9de2b544a466a7fc", "name": "雷军" },
+    { "id": "54a5170264694bfc8e9ad98df7bd89c3", "name": "丁真" },
+    { "id": "7f92f8afb8ec43bf81429cc1c9199cb1", "name": "AD学姐" },
+    { "id": "0eb38bc974e1459facca38b359e13511", "name": "赛马娘" },
+    { "id": "e80ea225770f42f79d50aa98be3cedfc", "name": "孙笑川258" },
+    { "id": "e4642e5edccd4d9ab61a69e82d4f8a14", "name": "蔡徐坤" },
+    { "id": "f7561ff309bd4040a59f1e600f4f4338", "name": "黑手" },
+    { "id": "332941d1360c48949f1b4e0cabf912cd", "name": "丁真（锐刻五代版）" },
+    { "id": "1aacaeb1b840436391b835fd5513f4c4", "name": "芙宁娜" },
+    { "id": "3b55b3d84d2f453a98d8ca9bb24182d6", "name": "邓紫琪" },
+    { "id": "7af4d620be1c4c6686132f21940d51c5", "name": "东雪莲" },
+    { "id": "e1cfccf59a1c4492b5f51c7c62a8abd2", "name": "永雏塔菲" },
+    { "id": "665e031efe27435780ebfa56cc7e0e0d", "name": "月半猫" },
+    { "id": "aebaa2305aa2452fbdc8f41eec852a79", "name": "雷军" },
+    { "id": "7c66db6e457c4d53b1fe428a8c547953", "name": "郭德纲" },
+    { "id": "99503144194c45ed8fb998ceac181dcc", "name": "贝利亚" },
+    { "id": "4462fa28f3824bff808a94a6075570e5", "name": "雷军" },
+    { "id": "188c9b7c06654042be0e8a25781761e8", "name": "周杰伦" },
+    { "id": "6ce7ea8ada884bf3889fa7c7fb206691", "name": "御女茉莉" }
+]
+SPEEKERS = {
+    "fishaudio":FISHAUDIO_SPEEKER,
+    "azure":[
+        {"id":"zh-CN-YunxiNeural","name":"云希"},
+        {"id":"zh-CN-YunzeNeural","name":"云哲"},
+        {"id":"zh-CN-YunxuanNeural","name":"晓萱"},
+    ]
+}
diff --git a/backend/fishaudio.py b/backend/fishaudio.py
new file mode 100644
index 0000000..bf20123
--- /dev/null
+++ b/backend/fishaudio.py
@@ -0,0 +1,34 @@
+from fish_audio_sdk import Session, TTSRequest, ReferenceAudio
+from pydub import AudioSegment
+import io
+
+from constants import FISHAUDIO_KEY,FISHAUDIO_SPEEKER
+
+
+
+import random
+
+def get_adapter_speeker_id(speaker_name):
+    speeker = FISHAUDIO_SPEEKER[0]
+    if speaker_name != "主持人": 
+        speeker = random.choice(FISHAUDIO_SPEEKER)
+    return speeker["id"]
+
+def fishaudio_tts(text, reference_id=None) -> AudioSegment:
+    """
+    将给定的文本转换为语音并返回AudioSegment对象。
+    
+    :param text: 要转换的文本
+    :param reference_id: 可选参数，使用的模型 ID
+    :return: 返回生成的语音的AudioSegment对象
+    """
+    print("reference_id:", reference_id)
+    session = Session(FISHAUDIO_KEY)
+    audio_buffer = io.BytesIO()
+    for chunk in session.tts(TTSRequest(
+        reference_id=reference_id,
+        text=text
+    )):
+        audio_buffer.write(chunk)
+    audio_buffer.seek(0)  # 重置缓冲区的位置
+    return AudioSegment.from_file(audio_buffer, format="mp3")
diff --git a/backend/requirements.txt b/backend/requirements.txt
index d6c5aa9..b3fb11b 100644
--- a/backend/requirements.txt
+++ b/backend/requirements.txt
@@ -18,3 +18,4 @@ numpy==2.1.1
 python-multipart==0.0.12
 PyPDF2==3.0.1
 azure-cognitiveservices-speech==1.41.1
+fish_audio_sdk
\ No newline at end of file
diff --git a/backend/utils.py b/backend/utils.py
index 3f08a8e..5d0a718 100644
--- a/backend/utils.py
+++ b/backend/utils.py
@@ -9,6 +9,7 @@
 from typing import Any, Dict, Generator
 import uuid
 from openai import OpenAI
+from fishaudio import fishaudio_tts
 from prompts import LANGUAGE_MODIFIER, LENGTH_MODIFIERS, PODCAST_INFO_PROMPT, QUESTION_MODIFIER, SUMMARY_INFO_PROMPT, SYSTEM_PROMPT, TONE_MODIFIER
 import json
 from pydub import AudioSegment
@@ -49,10 +50,12 @@ def generate_dialogue(pdfFile, textInput, tone, duration, language) -> Generator
         
     yield json.dumps({"type": "final", "content": full_response})
 
-async def process_line(line, voice):
-    return await generate_podcast_audio(line['content'], voice)
+async def process_line(line, voice,provider):
+    if provider == 'fishaudio':
+        return await generate_podcast_audio(line['content'], voice)
+    return await generate_podcast_audio_by_azure(line['content'], voice)
 
-async def generate_podcast_audio(text: str, voice: str) -> str:
+async def generate_podcast_audio_by_azure(text: str, voice: str) -> str:
     try:
         speech_config = speechsdk.SpeechConfig(subscription=SPEECH_KEY, region=SPEECH_REGION)
         speech_config.speech_synthesis_voice_name = voice
@@ -80,7 +83,27 @@ async def generate_podcast_audio(text: str, voice: str) -> str:
         print(f"Error in generate_podcast_audio: {e}")
         raise
 
-async def combine_audio(task_status: Dict[str, Dict], task_id: str, text: str, language: str) -> Generator[str, None, None]:
+async def generate_podcast_audio(text: str, voice: str) -> str:
+    return await generate_podcast_audio_by_fish(text,voice) 
+
+async def generate_podcast_audio_by_fish(text: str, voice: str) -> str:
+    try: 
+        return fishaudio_tts(text=text,reference_id=voice)
+    except Exception as e:
+        print(f"Error in generate_podcast_audio: {e}")
+        raise
+async def process_lines_with_limit(lines, provider , host_voice, guest_voice, max_concurrency):
+    semaphore = asyncio.Semaphore(max_concurrency)
+
+    async def limited_process_line(line):
+        async with semaphore:
+            voice = host_voice if (line['speaker'] == '主持人' or line['speaker'] == 'Host') else guest_voice
+            return await process_line(line, voice , provider)
+
+    tasks = [limited_process_line(line) for line in lines]
+    results = await asyncio.gather(*tasks)
+    return results
+async def combine_audio(task_status: Dict[str, Dict], task_id: str, text: str, language: str , provider:str,host_voice: str , guest_voice:str) -> Generator[str, None, None]:
     try:
         dialogue_regex = r'\*\*([\s\S]*?)\*\*[:：]\s*([\s\S]*?)(?=\*\*|$)'
         matches = re.findall(dialogue_regex, text, re.DOTALL)
@@ -93,13 +116,11 @@ async def combine_audio(task_status: Dict[str, Dict], task_id: str, text: str, l
         for match in matches
         ]
 
-        host_voice = "zh-CN-YunxiNeural"
-        guest_voice = "zh-CN-YunzeNeural"
-
         print("Starting audio generation")
-        audio_segments = await asyncio.gather(
-            *[process_line(line, host_voice if line['speaker'] == '主持人' else guest_voice) for line in lines]
-        )
+        # audio_segments = await asyncio.gather(
+        #     *[process_line(line, host_voice if line['speaker'] == '主持人' else guest_voice) for line in lines]
+        # )
+        audio_segments = await process_lines_with_limit(lines, host_voice, guest_voice, 10 if provider=='azure' else 5)
         print("Audio generation completed")
 
         # 合并音频
diff --git a/frontend/src/components/content.tsx b/frontend/src/components/content.tsx
index 931a943..cb5b9d3 100644
--- a/frontend/src/components/content.tsx
+++ b/frontend/src/components/content.tsx
@@ -66,6 +66,8 @@ export default function Content({
         const audioFormData = new FormData();
         audioFormData.append('text', transcriptFinalResult.content);
         audioFormData.append('language', formData.get('language') as string);
+        audioFormData.append('host_voice', formData.get('hostVoice') as string);
+        audioFormData.append('guest_voice', formData.get('guestVoice') as string);
 
         generateAudio(audioFormData)
       }
diff --git a/frontend/src/components/menu.tsx b/frontend/src/components/menu.tsx
index a673df2..fe80a52 100644
--- a/frontend/src/components/menu.tsx
+++ b/frontend/src/components/menu.tsx
@@ -1,8 +1,10 @@
-import React, { useState } from 'react';
+import React, {  useState } from 'react';
 import { Button } from "@/components/ui/button";
 import { Textarea } from "@/components/ui/textarea";
 import { Select, SelectContent, SelectItem, SelectTrigger, SelectValue } from "@/components/ui/select";
 import { Upload, FileText, Mic, Clock, Globe, Sparkles } from "lucide-react";
+import { Card, CardContent } from './ui/card';
+import { useSpeeker } from '@/hooks/useSpeeker';
 
 const MAX_FILE_SIZE = 5 * 1024 * 1024; // 5MB in bytes
 const DEMO_PDF_URL = '/demo.pdf'; // 替换为你的演示 PDF 文件的实际路径
@@ -13,7 +15,13 @@ export default function Menu({ handleGenerate, isGenerating }: { handleGenerate:
   const [tone, setTone] = useState('neutral');
   const [duration, setDuration] = useState('short');
   const [language, setLanguage] = useState('Chinese');
+  const [hostVoice, setHostVoice] = useState('zh-CN-YunxiNeural');
+  const [guestVoice, setGuestVoice] = useState('zh-CN-YunzeNeural');
+  const [provider, setProvider] = useState('azure');
   const [fileError, setFileError] = useState<string | null>(null);
+  const speekerReq = useSpeeker()
+
+
 
   const handleFileChange = (event: React.ChangeEvent<HTMLInputElement>) => {
     const file = event.target.files?.[0];
@@ -53,21 +61,23 @@ export default function Menu({ handleGenerate, isGenerating }: { handleGenerate:
     formData.append('tone', tone);
     formData.append('duration', duration);
     formData.append('language', language);
+    formData.append('hostVoice', hostVoice);
+    formData.append('guestVoice', guestVoice);
 
     handleGenerate(formData);
   };
 
   return (
     <div className="w-full md:w-1/5 p-6 border-r rounded-2xl m-3 border-gray-200 bg-white flex flex-col text-gray-800 hidden md:flex shadow-lg shadow-gray-300/50">
-      <div className="flex-grow overflow-y-auto space-y-8">
+      <div className="flex-grow flex-1 h-1 overflow-y-auto space-y-8">
         <div className="transition-all duration-300">
           <h2 className="text-sm font-semibold mb-3 flex items-center"><Upload className="mr-2 text-gray-600" size={20} /> 上传 PDF *</h2>
           <div className="border-2 border-dashed border-gray-300 rounded-xl p-8 text-center cursor-pointer hover:border-gray-400 bg-white hover:bg-gray-50 transition-all duration-300">
-            <input 
-              type="file" 
-              accept=".pdf" 
-              className="hidden" 
-              id="pdf-upload" 
+            <input
+              type="file"
+              accept=".pdf"
+              className="hidden"
+              id="pdf-upload"
               onChange={handleFileChange}
             />
             <label htmlFor="pdf-upload" className="cursor-pointer">
@@ -94,9 +104,9 @@ export default function Menu({ handleGenerate, isGenerating }: { handleGenerate:
 
         <div>
           <h2 className="text-sm font-semibold mb-3 flex items-center"><FileText className="mr-2 text-gray-600" size={20} /> 问题</h2>
-          <Textarea 
-            style={{"resize": "none"}}
-            placeholder="说点什么..." 
+          <Textarea
+            style={{ "resize": "none" }}
+            placeholder="说点什么..."
             className="w-full h-40 bg-white border-gray-200 text-gray-800 rounded-xl focus:border-gray-400 focus:ring-gray-400"
             value={textInput}
             onChange={(e) => setTextInput(e.target.value)}
@@ -106,7 +116,7 @@ export default function Menu({ handleGenerate, isGenerating }: { handleGenerate:
           <h2 className="text-sm font-semibold mb-3 flex items-center"><Mic className="mr-2 text-gray-600" size={20} /> 语气</h2>
           <Select onValueChange={setTone}>
             <SelectTrigger className="w-full bg-white border-gray-200 text-gray-800 rounded-xl">
-              <SelectValue placeholder="中立" defaultValue={tone}/>
+              <SelectValue placeholder="中立" defaultValue={tone} />
             </SelectTrigger>
             <SelectContent className="bg-white border-gray-200 rounded-xl" >
               <SelectItem value="neutral" className="cursor-pointer hover:bg-gray-100">中立</SelectItem>
@@ -121,7 +131,7 @@ export default function Menu({ handleGenerate, isGenerating }: { handleGenerate:
           <h2 className="text-sm font-semibold mb-3 flex items-center"><Clock className="mr-2 text-gray-600" size={20} /> 时长</h2>
           <Select onValueChange={setDuration}>
             <SelectTrigger className="w-full bg-white border-gray-200 text-gray-800 rounded-xl">
-              <SelectValue placeholder="短对话 (1-2分钟)" defaultValue={duration}/>
+              <SelectValue placeholder="短对话 (1-2分钟)" defaultValue={duration} />
             </SelectTrigger>
             <SelectContent className="bg-white border-gray-200 rounded-xl">
               <SelectItem value="short" className="cursor-pointer  hover:bg-gray-100">短对话 (1-2分钟)</SelectItem>
@@ -134,7 +144,7 @@ export default function Menu({ handleGenerate, isGenerating }: { handleGenerate:
           <h2 className="text-sm font-semibold mb-3 flex items-center"><Globe className="mr-2 text-gray-600" size={20} /> 语言</h2>
           <Select onValueChange={setLanguage}>
             <SelectTrigger className="w-full bg-white border-gray-200 text-gray-800 rounded-xl">
-              <SelectValue placeholder="中文" defaultValue={language}/>
+              <SelectValue placeholder="中文" defaultValue={language} />
             </SelectTrigger>
             <SelectContent className="bg-white border-gray-200 rounded-xl">
               <SelectItem value="English" className="cursor-pointer transition-colors duration-150 ease-in-out hover:bg-gray-100">英文</SelectItem>
@@ -142,16 +152,74 @@ export default function Menu({ handleGenerate, isGenerating }: { handleGenerate:
             </SelectContent>
           </Select>
         </div>
+
+        {speekerReq.data && <div>
+          <h2 className="text-sm font-semibold mb-3 flex items-center"><Globe className="mr-2 text-gray-600" size={20} /> 声音</h2>
+          <Card >
+            <CardContent className='p-3'>
+              <h2 className="text-sm font-semibold mb-3 flex items-center">Provider</h2>
+              <Select  value={provider} onValueChange={newProvider=>{
+                setProvider(newProvider)
+                const voices = speekerReq.data?.[newProvider];
+                if(voices){
+                  setHostVoice(voices[0].id)
+                  setGuestVoice(voices[1].id)
+                }
+              }}>
+                <SelectTrigger className="w-full bg-white border-gray-200 text-gray-800 rounded-xl">
+                  <SelectValue placeholder="Host" defaultValue={provider} />
+                </SelectTrigger>
+                <SelectContent className="bg-white border-gray-200 rounded-xl mt-3">
+                  {
+                   Object.keys(speekerReq.data ?? {}).map(item => <SelectItem
+                      key={item}
+                      value={item}
+                      className="cursor-pointer transition-colors duration-150 ease-in-out hover:bg-gray-100">{item}</SelectItem>)
+                  }
+                </SelectContent>
+              </Select>
+              <h2 className="text-sm font-semibold mb-3 flex items-center">Host</h2>
+              <Select value={hostVoice} onValueChange={setHostVoice}>
+                <SelectTrigger className="w-full bg-white border-gray-200 text-gray-800 rounded-xl">
+                  <SelectValue placeholder="Host" defaultValue={hostVoice} />
+                </SelectTrigger>
+                <SelectContent className="bg-white border-gray-200 rounded-xl">
+                  {
+                    speekerReq.data?.[provider].map(item => <SelectItem
+                      key={item.id}
+                      value={item.id}
+                      className="cursor-pointer transition-colors duration-150 ease-in-out hover:bg-gray-100">{item.name}</SelectItem>)
+                  }
+                </SelectContent>
+              </Select>
+              <h2 className="text-sm font-semibold mb-3 flex items-center">Guest</h2>
+              <Select value={guestVoice} onValueChange={setGuestVoice}>
+                <SelectTrigger className="w-full bg-white border-gray-200 text-gray-800 rounded-xl">
+                  <SelectValue placeholder="Guest" defaultValue={guestVoice} />
+                </SelectTrigger>
+                <SelectContent className="bg-white border-gray-200 rounded-xl">
+                  {
+
+                    speekerReq.data?.[provider].map(item => <SelectItem
+                      key={item.id}
+                      value={item.id}
+                      className="cursor-pointer transition-colors duration-150 ease-in-out hover:bg-gray-100">{item.name}</SelectItem>)
+                  }
+                </SelectContent>
+              </Select>
+            </CardContent>
+          </Card>
+        </div>}
       </div>
 
       <div className="mt-6">
-        <Button 
+        <Button
           disabled={isGenerating}
           className={`
             w-full rounded-xl transition-all duration-300 transform hover:scale-105
             flex items-center justify-center space-x-2
-            ${isGenerating 
-              ? 'bg-blue-300 cursor-not-allowed' 
+            ${isGenerating
+              ? 'bg-blue-300 cursor-not-allowed'
               : 'bg-blue-500 hover:bg-blue-600 active:bg-blue-700'}
             text-white font-semibold py-3 px-6 shadow-lg hover:shadow-xl
           `}
diff --git a/frontend/src/hooks/useSpeeker.ts b/frontend/src/hooks/useSpeeker.ts
new file mode 100644
index 0000000..b840e94
--- /dev/null
+++ b/frontend/src/hooks/useSpeeker.ts
@@ -0,0 +1,32 @@
+import { useCallback, useEffect, useState } from 'react'; 
+import { BASE_URL } from '@/lib/constant';
+type SPEEKERS = Record<string,Array<{id:string,name:string}>>
+
+export function useSpeeker() {
+    const [data, setData] = useState<SPEEKERS | null>(null);
+    const [error, setError] = useState<string | null>(null);
+    const [isLoading, setIsLoading] = useState(false);
+  
+    const load = useCallback(async () => {
+      setIsLoading(true);
+      setData(null);
+      setError(null);
+  
+      try {
+        const response = await fetch(BASE_URL + "/speekers" );
+        if (!response.ok) {
+          throw new Error(`HTTP error! status: ${response.status}`);
+        }
+        const jsonData = await response.json();
+        setData(jsonData);
+      } catch (error) {
+        setError('获取数据时发生错误: ' + (error as Error).message);
+      } finally {
+        setIsLoading(false);
+      }
+    }, []);
+
+    useEffect(()=>{load()},[load])
+  
+    return { data, error, isLoading, load };
+  }

From 381235b7f8f46e9e7d5bbda8f8b3b6f44d763e4b Mon Sep 17 00:00:00 2001
From: liuhuapiaoyuan <278780765@qq.com>
Date: Wed, 23 Oct 2024 16:14:45 +0800
Subject: [PATCH 3/4] fix: fix missing param  provider

---
 backend/utils.py                    | 2 +-
 frontend/src/components/content.tsx | 1 +
 frontend/src/components/menu.tsx    | 1 +
 3 files changed, 3 insertions(+), 1 deletion(-)

diff --git a/backend/utils.py b/backend/utils.py
index 5d0a718..f50fafc 100644
--- a/backend/utils.py
+++ b/backend/utils.py
@@ -120,7 +120,7 @@ async def combine_audio(task_status: Dict[str, Dict], task_id: str, text: str, l
         # audio_segments = await asyncio.gather(
         #     *[process_line(line, host_voice if line['speaker'] == '主持人' else guest_voice) for line in lines]
         # )
-        audio_segments = await process_lines_with_limit(lines, host_voice, guest_voice, 10 if provider=='azure' else 5)
+        audio_segments = await process_lines_with_limit(lines,provider, host_voice, guest_voice, 10 if provider=='azure' else 5)
         print("Audio generation completed")
 
         # 合并音频
diff --git a/frontend/src/components/content.tsx b/frontend/src/components/content.tsx
index cb5b9d3..0f8b7fc 100644
--- a/frontend/src/components/content.tsx
+++ b/frontend/src/components/content.tsx
@@ -68,6 +68,7 @@ export default function Content({
         audioFormData.append('language', formData.get('language') as string);
         audioFormData.append('host_voice', formData.get('hostVoice') as string);
         audioFormData.append('guest_voice', formData.get('guestVoice') as string);
+        audioFormData.append('provider', formData.get('provider') as string);
 
         generateAudio(audioFormData)
       }
diff --git a/frontend/src/components/menu.tsx b/frontend/src/components/menu.tsx
index fe80a52..ab753b3 100644
--- a/frontend/src/components/menu.tsx
+++ b/frontend/src/components/menu.tsx
@@ -63,6 +63,7 @@ export default function Menu({ handleGenerate, isGenerating }: { handleGenerate:
     formData.append('language', language);
     formData.append('hostVoice', hostVoice);
     formData.append('guestVoice', guestVoice);
+    formData.append('provider', provider);
 
     handleGenerate(formData);
   };

From d4b8e5673a60933bb269552c03d40a4ff48b4a40 Mon Sep 17 00:00:00 2001
From: liuhuapiaoyuan <278780765@qq.com>
Date: Wed, 23 Oct 2024 16:15:16 +0800
Subject: [PATCH 4/4] fix: remove console

---
 backend/fishaudio.py | 1 -
 1 file changed, 1 deletion(-)

diff --git a/backend/fishaudio.py b/backend/fishaudio.py
index bf20123..a526057 100644
--- a/backend/fishaudio.py
+++ b/backend/fishaudio.py
@@ -22,7 +22,6 @@ def fishaudio_tts(text, reference_id=None) -> AudioSegment:
     :param reference_id: 可选参数，使用的模型 ID
     :return: 返回生成的语音的AudioSegment对象
     """
-    print("reference_id:", reference_id)
     session = Session(FISHAUDIO_KEY)
     audio_buffer = io.BytesIO()
     for chunk in session.tts(TTSRequest(