- LangChain
- LLaMAIndex
- VectorDB: Chroma
- Embedding Model: sentence-transformers/all-MiniLM-L6-v2
- LLM: OpenAI GPT3.5 Turbo
- pre-retrieval, retrieval, and post-retrieval optimization
- 故宮博物館展品資料 (format: PDF, Text File)
- Internet (format: HTML)
- Translate Tool: Google Cloud Translate API
- Basic RAG
- Google Cloud Translate API
- Advanced RAG
- Question Answering in RAG using Llama-Index: Part 1
- Extracting Metadata for Better Document Indexing and Understanding
CAP
├─ .DS_Store
├─ .env
├─ README.md
├─ __pycache__
│ └─ main.cpython-310.pyc
├─ app
│ ├─ __init__.py
│ ├─ __pycache__
│ │ ├─ __init__.cpython-310.pyc
│ │ └─ api.cpython-310.pyc
│ ├─ api.py
│ └─ services
│ ├─ __init__.py
│ ├─ __pycache__
│ │ ├─ __init__.cpython-310.pyc
│ │ └─ translate_service.cpython-310.pyc
│ └─ translate_service.py
├─ assets
│ ├─ .DS_Store
│ ├─ 康侯方鼎_故宮.txt
│ ├─ 毛公鼎_故宮.txt
│ ├─ 翠玉白菜_故宮.txt
│ └─ 肉形石_wiki.txt
├─ chroma
│ ├─ 379e7f20-dc49-4092-af32-3ee328736706
│ │ ├─ data_level0.bin
│ │ ├─ header.bin
│ │ ├─ length.bin
│ │ └─ link_lists.bin
│ └─ chroma.sqlite3
├─ main.py
├─ rag
│ ├─ __init__.py
│ ├─ __pycache__
│ │ ├─ __init__.cpython-310.pyc
│ │ ├─ langchain.cpython-310.pyc
│ │ ├─ llama_index.cpython-310.pyc
│ │ ├─ rag.cpython-310.pyc
│ │ └─ retrieval.cpython-310.pyc
│ ├─ langchain.py
│ ├─ llama_index.py
│ └─ rag.py
├─ requirements.txt
└─ store
├─ __init__.py
├─ __pycache__
│ ├─ __init__.cpython-310.pyc
│ └─ store.cpython-310.pyc
└─ store.py