Add files via upload

lonngxiang · web-flow · commit a5d5b6b628d3 · 2023-10-17T20:51:10.000+08:00
diff --git a/configs.py b/configs.py
@@ -0,0 +1,10 @@
+
+## variable vlaue
+
+faiss_key = False
+vector_store = None
+
+
+## model address
+embedding_model_address = "" ## "shibing624/text2vec-base-chinese"
+
diff --git a/model.py b/model.py
@@ -0,0 +1,24 @@
+"""
+model deploy : faschat
+  run:
+    1.python -m fastchat.serve.controller
+    2.python -m fastchat.serve.model_worker --model-path ./chatglm2-6b --num-gpus 2 --host=0.0.0.0 --port=21002
+
+calling interface : requests.post
+"""
+
+import requests
+
+
+def get_response(text):
+    headers = {"Content-Type": "application/json"}
+    pload = {
+        "model": "chatglm2-6b",
+        "prompt": text,
+        "stop": "###",
+        "max_new_tokens": 8000,
+    }
+    print("pload",pload)
+    response = requests.post("http://*****:21002/worker_generate_stream", headers=headers, json=pload, stream=True)
+    # print(response.text)
+    return response
diff --git a/split.py b/split.py
@@ -0,0 +1,44 @@
+
+from typing import List
+
+import re
+from langchain.document_loaders import UnstructuredFileLoader
+from langchain.text_splitter import CharacterTextSplitter
+
+
+class ChineseTextSplitter(CharacterTextSplitter):
+    def __init__(self, pdf: bool = False, **kwargs):
+        super().__init__(**kwargs)
+        self.pdf = pdf
+
+    def split_text(self, text: str) -> List[str]:
+        if self.pdf:
+            text = re.sub(r"\n{3,}", "\n", text)
+            text = re.sub('\s', ' ', text)
+            text = text.replace("\n\n", "")
+        sent_sep_pattern = re.compile(
+            '([﹒﹔﹖﹗．。！？]["’”」』]{0,2}|(?=["‘“「『]{1,2}|$))') 
+        sent_list = []
+        for ele in sent_sep_pattern.split(text):
+            if sent_sep_pattern.match(ele) and sent_list:
+                sent_list[-1] += ele
+            elif ele:
+                sent_list.append(ele)
+        return sent_list
+
+
+
+def load_file(filepath):
+    print("filepath:",filepath)
+    if filepath.endswith(".md"):
+        loader = UnstructuredFileLoader(filepath, mode="elements")
+        docs = loader.load()
+    elif filepath.endswith(".pdf"):
+        loader = UnstructuredFileLoader(filepath)
+        textsplitter = ChineseTextSplitter(pdf=True)
+        docs = loader.load_and_split(textsplitter)
+    else:
+        loader = UnstructuredFileLoader(filepath, mode="elements")
+        textsplitter = ChineseTextSplitter(pdf=False)
+        docs = loader.load_and_split(text_splitter=textsplitter)
+    return loader,docs
diff --git a/web.py b/web.py
@@ -0,0 +1,210 @@
+import json
+import time
+from tempfile import NamedTemporaryFile
+import os
+
+
+import streamlit as st
+from langchain.embeddings import HuggingFaceEmbeddings
+from langchain.vectorstores import FAISS
+
+import configs
+from model import get_response
+from split import load_file
+
+
+# langchain embedding
+embedding = HuggingFaceEmbeddings(model_name=configs.embedding_model_address)
+
+
+st.set_page_config(page_title="LLM-RAG-WEB")
+st.title("LLM-RAG-WEB")
+
+
+
+def clear_chat_history1():
+    del st.session_state.messages
+    st.session_state.history1 = [st.session_state.history1[0]]  # 保留初始记录
+    # placeholder.empty()
+
+def clear_chat_history2():
+    del st.session_state.messages
+    st.session_state.history2 = []  
+
+def init_chat_history1():
+    with st.chat_message("assistant", avatar='🤖'):
+        st.markdown("您好，我是AI助手，很高兴为您服务🥰")
+
+    if "messages1" in st.session_state:
+        for message in st.session_state.messages1:
+            avatar = '🧑‍💻' if message["role"] == "user" else '🤖'
+            with st.chat_message(message["role"], avatar=avatar):
+                st.markdown(message["content"])
+    else:
+        st.session_state.messages1 = []
+
+    return st.session_state.messages1
+
+def init_chat_history2():
+    with st.chat_message("assistant", avatar='🤖'):
+        st.markdown("您好，我是AI助手，很高兴为您服务🥰")
+
+    if "messages2" in st.session_state:
+        for message in st.session_state.messages2:
+            avatar = '🧑‍💻' if message["role"] == "user" else '🤖'
+            with st.chat_message(message["role"], avatar=avatar):
+                st.markdown(message["content"])
+    else:
+        st.session_state.messages2 = []
+
+    return st.session_state.messages2
+
+
+# 初始化变量
+if 'history1' not in st.session_state:
+    st.session_state.history1 = [["Human","你的昵称为小杰"],["Assistant","好的，小杰明白"]]
+
+# 初始化变量
+if 'history2' not in st.session_state:
+    st.session_state.history2 = []
+
+# 初始化 session_state
+if "enter_pressed" not in st.session_state:
+    st.session_state.enter_pressed = False
+
+
+
+def main():
+
+    if "vector_store" not in st.session_state:
+        st.session_state.vector_store = configs.vector_store
+    
+    if "faiss_key" not in st.session_state:
+        st.session_state.faiss_key = configs.faiss_key
+    print("first faiss_key:",configs.faiss_key)
+
+    # 创建侧边栏布局
+    sidebar_selection = st.sidebar.selectbox("选择对话类型", ("模型对话", "文件对话"))
+
+
+    if sidebar_selection == "模型对话":
+        st.session_state.faiss_key = False
+        messages1 = init_chat_history1()
+        print("history1:",st.session_state.history1)
+        if prompt := st.chat_input("Shift + Enter 换行, Enter 发送"):
+            with st.chat_message("user", avatar='🧑‍💻'):
+                st.markdown(prompt)
+            messages1.append({"role": "user", "content": prompt})
+            print(f"[user] {prompt}", flush=True)
+            with st.chat_message("assistant", avatar='🤖'):
+                placeholder = st.empty()
+
+                
+                st.session_state.history1.append(["Human",prompt])
+                st.session_state.history1.append(["Assistant",None])
+                print("history1:",st.session_state.history1)
+                start=time.time()
+                results = get_response(st.session_state.history1)
+                for chunk in results.iter_lines(chunk_size=1024,decode_unicode=False, delimiter=b"\0"):
+                    if chunk:
+                        # print(chunk.decode("utf-8"))
+                        response = json.loads(chunk.decode("utf-8"))["text"]
+                        # print(response) 
+
+                        placeholder.markdown(response[(len(prompt)+1):])
+                end=time.time()
+                cost = end-start
+                length = len(response[(len(prompt)+1):])
+                print(f"{length/cost}tokens/s")
+                # print(prompt,response[(len(prompt)+1):])
+                st.session_state.history1[-1][1] =response[(len(prompt)+1):]
+                
+                
+                messages1.append({"role": "assistant", "content": response[(len(prompt)+1):]})
+
+
+                print(json.dumps(messages1, ensure_ascii=False), flush=True)
+            
+
+            st.button("清空对话", on_click=clear_chat_history1)
+
+    elif  sidebar_selection == "文件对话":
+        ## uploaded_file
+        uploaded_file = st.file_uploader("Choose a file")  
+
+        print("st.session_state.faiss_key:",st.session_state.faiss_key)
+        if not st.session_state.faiss_key:
+            st.session_state.messages2 = []
+            messages2 = init_chat_history2()
+        else:
+            messages2 = init_chat_history2()
+        
+             
+        if uploaded_file is not None:
+             
+            if not st.session_state.faiss_key:
+                print("faiss_key1:",st.session_state.faiss_key)
+
+                # 临时文件保留原文件格式比如pdf后缀
+                temp_file = NamedTemporaryFile(delete=False, suffix=os.path.splitext(uploaded_file.name)[1])
+                temp_file.write(uploaded_file.getvalue())
+                # 构造包含扩展名的临时文件路径
+                file_path = temp_file.name 
+                with st.spinner('Reading file...'):
+                    text_loader, texts = load_file(file_path)
+                st.success('Finished reading file.')
+                temp_file.close()
+                ## 保存文件向量
+                
+                st.session_state.vector_store = FAISS.from_documents(texts, embedding)
+                st.success('Finished save embedding.')
+                st.session_state.faiss_key = True
+                
+
+            if st.session_state.faiss_key:
+                print("faiss_key2:",st.session_state.faiss_key)
+                
+                if prompt := st.chat_input("Shift + Enter 换行, Enter 发送"):
+                    with st.chat_message("user", avatar='🧑‍💻'):
+                        st.markdown(prompt)
+                    messages2.append({"role": "user", "content": prompt})
+                    print(f"[user] {prompt}", flush=True)
+                    with st.chat_message("assistant", avatar='🤖'):
+                        placeholder = st.empty() 
+                        sim_result = st.session_state.vector_store.similarity_search(prompt)[0].page_content
+                        new_prompt = f"""请根据下面单引号内信息简短回答：{prompt}？   '{sim_result}' \n"""
+                        # new_prompt =f"""基于以下已知信息，简洁和专业的来回答用户的问题。
+                                        
+                        #                 已知内容:
+                        #                 {sim_result}
+                        #                 问题:{prompt}"""
+                        st.session_state.history2 = [["Human","你的昵称为小杰"],["Assistant","好的，小杰明白"]]
+                        st.session_state.history2.append(["Human",new_prompt])
+                        st.session_state.history2.append(["Assistant",None])
+                        print("history2:",st.session_state.history2)
+                        start=time.time()
+                        results = get_response(st.session_state.history2)
+                        for chunk in results.iter_lines(chunk_size=1024,decode_unicode=False, delimiter=b"\0"):
+                            if chunk:
+                                # print(chunk.decode("utf-8"))
+                                response = json.loads(chunk.decode("utf-8"))["text"]
+                                # print(response) 
+
+                                placeholder.markdown(response[(len(new_prompt)+1):])
+                        end=time.time()
+                        cost = end-start
+                        length = len(response[(len(new_prompt)+1):])
+                        print(f"{length/cost}tokens/s")
+                        # print(prompt,response[(len(prompt)+1):])
+                        st.session_state.history1[-1][1] =response[(len(new_prompt)+1):]
+                        
+                        
+                        messages2.append({"role": "assistant", "content": response[(len(new_prompt)+1):]})
+                        print(json.dumps(messages2, ensure_ascii=False), flush=True)
+
+                    st.button("清空对话", on_click=clear_chat_history2)
+                
+
+
+if __name__ == "__main__":
+    main()