如今,AI早已經走進了我們生活,文心一言、通義千問、豆包、還有最近非常火爆的DeepSeek等大模型讓人們意識AI并不是那么神秘,這里,我們用RAG就可以自己搭建一個PG向量數據庫AI機器人。
RAG概念
RAG(Retrieval Augmented Generation)顧名思義,通過檢索的方法來增強生成模型的能力。
檢索(Retrieval ): 根據用戶請求從外部知識源檢索相關上下文。
增強(Augment): 用戶查詢和檢索到的附加上下文被填充到提示模板中。
生成(Generate): 檢索增強提示被饋送到 LLM。
它是一個為大模型提供外部知識源的概念,這使它們能夠生成準確且符合上下文的答案,同時能夠減少模型幻覺。
使用RAG的優點
提高準確性: 通過檢索相關的信息,RAG可以提高生成文本的準確性。
減少訓練成本:與需要大量數據來訓練的大型生成模型相比,RAG可以通過檢索機制來減少所需的訓練數據量,從而降低訓練成本。
適應性強:RAG模型可以適應新的或不斷變化的數據。由于它們能夠檢索最新的信息,因此在新數據和事件出現時,它們能夠快速適應并生成相關的文本。
RAG系統工作流程圖解
流程描述:
1. 加載,讀取文檔
2. 文檔分割
3. 文檔向量化
4. 用戶輸入內容
5. 內容向量化
6. 文本向量中匹配出與問句向量相似的 top_k 個
7. 匹配出的文本作為上下文和問題一起添加到 prompt 中
8.提交給 LLM 生成答案
......
完整文檔鏈接:
文檔:RAG-大模型&向量數據庫.pdf
網盤鏈接:
https://pan.baidu.com/s/1b4yXjlyw2uF7K-iOSnpGYQ
提取碼: qanz
B站在線視頻:
https://www.bilibili.com/video/BV1WsNZe6EVp/
元宵特惠!
元宵佳節,CUUG為您獻上好禮!
購買信創PostgreSQL管理員認證課程,贈送PGCP和PGCM一次補考機會,活動還有7天,【閱讀原文】聯系客服報名!