Multilingual RAG System

A simple Retrieval-Augmented Generation (RAG) system that supports both English and Bengali queries, designed to fetch relevant information from PDF documents and generate meaningful answers.

🎯 Objective

Develop a basic RAG pipeline capable of understanding and responding to both English and Bengali queries by retrieving relevant information from a PDF document corpus and generating grounded answers.

✨ Features

Core Functionality

Multilingual Support: Accepts user queries in both English and Bengali
Document Retrieval: Fetches relevant document chunks from knowledge base
Contextual Answers: Generates responses based on retrieved information
Memory Management: Maintains both short-term and long-term memory

Knowledge Base

Source: HSC26 Bangla 1st Paper (Bengali textbook)
Processing: Advanced pre-processing and data cleaning for improved chunk accuracy
Storage: Document chunking and vectorization in vector database

Memory System

Short-Term Memory: Recent chat sequence inputs
Long-Term Memory: PDF document corpus stored in vector database

🚀 API Endpoints

Conversation API

POST /chat

Request Body:

{
  "query": "অনুপমের ভাষায় সত্যপুরুষ কাকে বলা হয়েছে?"
}

Response:

{
  "answer": "শুভনাথ",
  "sources": ["chunk_id_1", "chunk_id_2"],
  "confidence": 0.85
}

📋 Sample Test Cases

Query (Bengali)	Expected Answer
অনুপমের ভাষায় সত্যপুরুষ কাকে বলা হয়েছে?	শুভনাথ
কাকে অনুপমের ভাগ্য দেবতা বলে উল্লেখ করা হয়েছে?	মামাকে
বিয়ের সময় কল্যাণীর প্রকৃত বয়স কত ছিল?	১৫ বছর

🛠️ Installation

# Clone the repository
git clone <repository-url>
cd multilingual-rag-system

# Install dependencies
pip install -r requirements.txt

# Set up environment variables
cp .env.example .env
# Edit .env with your configuration

📖 Usage

Command Line Interface

python main.py --query "অনুপমের ভাষায় সত্যপুরুষ কাকে বলা হয়েছে?"

REST API

# Start the server
python app.py

# Make requests
curl -X POST http://localhost:5000/chat \
  -H "Content-Type: application/json" \
  -d '{"query": "কাকে অনুপমের ভাগ্য দেবতা বলে উল্লেখ করা হয়েছে?"}'

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
app		app
config		config
docs		docs
scripts		scripts
tests		tests
.env		.env
.env.example		.env.example
.gitignore		.gitignore
README.md		README.md
main.py		main.py
output_chunks.jsonl		output_chunks.jsonl
requirements.txt		requirements.txt
structure.md		structure.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Multilingual RAG System

🎯 Objective

✨ Features

Core Functionality

Knowledge Base

Memory System

🚀 API Endpoints

Conversation API

📋 Sample Test Cases

🛠️ Installation

📖 Usage

Command Line Interface

REST API

About

Uh oh!

Releases

Packages

Languages

SRafi007/multilingual-rag-system

Folders and files

Latest commit

History

Repository files navigation

Multilingual RAG System

🎯 Objective

✨ Features

Core Functionality

Knowledge Base

Memory System

🚀 API Endpoints

Conversation API

📋 Sample Test Cases

🛠️ Installation

📖 Usage

Command Line Interface

REST API

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages