GitHub - Mercytopsy/pdf-rag-chatbot-streamlit: A Retrieval-Augmented Generation (RAG) pipeline for efficient document processing and retrieval

📌 Overview

This project implements a Retrieval-Augmented Generation (RAG) pipeline for efficient document processing and knowledge retrieval. It extracts text and tables from PDFs using the Unstructured library, stores raw PDFs in Redis, and indexes extracted embeddings in PGVector for semantic search. The system leverages MultiVector Retriever for context retrieval before querying an LLM (GPT model).

🚀 Features

Unstructured Document Processing: Extracts text and tables from PDFs.
Redis for Raw Storage: Stores and retrieves raw PDFs efficiently, to implement persistent storage.
PGVector for Vector Storage: Indexes and retrieves high-dimensional embeddings for similarity search.
MultiVector Retriever: Optimized for retrieving contextual information from multiple sources.
LLM Integration: Uses a GPT model to generate responses based on retrieved context.

🛠️ Tech Stack

Programming Language

Python

Libraries

unstructured
pgvector
redis
langchain
openai

Databases

Redis: For raw PDF storage
PostgreSQL + PGVector: For embeddings storage

LLM

GPT (via OpenAI API or local model)

Name		Name	Last commit message	Last commit date
Latest commit History 66 Commits
data		data
.gitignore		.gitignore
.gitpod.yml		.gitpod.yml
Architectural Diagram.png		Architectural Diagram.png
RAG.ipynb		RAG.ipynb
RAG_with_streamlit.py		RAG_with_streamlit.py
README.md		README.md
database.py		database.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

📌 Overview

🚀 Features

🛠️ Tech Stack

Programming Language

Libraries

Databases

LLM

About

Releases

Packages

Languages

Mercytopsy/pdf-rag-chatbot-streamlit

Folders and files

Latest commit

History

Repository files navigation

📌 Overview

🚀 Features

🛠️ Tech Stack

Programming Language

Libraries

Databases

LLM

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages