<aside>
📢 有些Medium文章是只有開放給會員,目前Medium有個新功能可以產生連結給非會員,非Medium會員請點選「Friend Link」
</aside>
基本概念
目前的大型語言模型,由於訓練的資料相當龐大,所以,幾乎有問必答,然而,當我們詢問比較冷門的問題時,目前的大型語言模型會給我們一個不正確的答案,主要的原因是大型語言模型並沒有這方面的知識。Retrieval Augmented Generation (RAG)就是在回答問題前,先去檢索資料,檢索後,再透過大型語言模型統整檢索的內容並產生回答。可以看一下 Felo Search、Proplexity,大概就可以理解這樣的概念,然而, Felo Search、Proplexity是去檢索網頁,一般的RAG則是去檢索非公開資料集。
進階RAG
從RAG的概念提出到現在已經有很多的進階發展,解決RAG各式各樣的問題。
- RAG (Retrieval Augmented Generation): 為自然語言處理揭開新篇章 ** 推薦 **
- 擷取(Retrieval)
- 建立準確語意空間的方法
- 區塊優化 (Chunk optimization)
- 微調嵌入模型 (Fine-tuning Embedding Models)
- 如何協調查詢和文件的語意空間?
- Query Rewriting
- Embedding Transformation
- 根據 LLM 的需求調整擷取結果
- Fine-tuning Retrievers
- Adapters
- 生成(Generation)
- 如何優化擷取到的訊息?
- 資訊壓縮 (Information Compression)
- 重排序 (Reranking)
- 如何根據擷取到的訊息優化生成器?
- 通用優化流程 (General Optimization Process)
- 利用對比學習 (Utilizing Contrastive Learning)
- Four-module Synergy for Enhancing RAG (Friend Link)
- Query Rewriter+
- Knowledge Filter
- Memory Knowledge Reservoir
- Retriever Trigger
- RAG 開發知識庫 (ihower整理) **
- Designing RAGs (Friend Link)
- Indexing: Embedding external data into a vector representation.
- Data processing mode
- Indexing model
- Text splitting method
- Chunking hyperparameters
- Storing: Persisting the indexed embeddings in a database.
- Database choice
- Metadata selection
- Retrieval: Finding relevant pieces in the stored data.
- Retrieval strategy
- Retrieval hyperparameters
- Query transformations
- Synthesis: Generating answers to user’s queries.
- Synthesis model
- System prompt
- Synthesis hyperparameters
- Evaluation: Quantifying how good the RAG system is.
- Evaluation protocol
- Evaluator prompts
- Model guidelines
- RAG analysis
- A Complete Guide to RAG
- Unlocking LLM’s Potential with RAG: A Complete Guide from Basics to Advanced Techniques
- Introduction
- RAG Using OpenAI
- RAG Using Google Gemini Pro
- Using Knowledge Retrieval from OpenAI
- Load Multiple PDF files or Folder
- RAG Using Ollama(Local) — Mistral Model
- RAG Using Huggingface Pipeline and Mistral Model
- RAG — Semistructured Data — Extracting Text and Tables
- Tools and Process
- LLM Frameworks
- LangChain
- Llamaindex
- Haystack
- RAG Evaluation
- Potential RAG Issues and Solutions
- Major Cloud Vendors — RAG and Vector Stores
- LLM-RAG Research Papers