vLLM及相关内容
什么是vLLMvLLM(VectorizedLargeLanguageModelServingSystem)是由加州大学伯克利分校团队开发的高性能、易扩展的大语言模型推理引擎。它专注于通过创新的内存管理和计算优化技术,实…
一、框架选择1.大模型应用平台Dify网址:https://dify.aiDify是一个开源的LLM应用开发平台,提供从Agent构建到AI工作流编排、RAG检索、模型管理等能力,轻松构建和运营生成式AI原生应用。比La…
AIAgent构建系统对比 1.MaxKB1.1官网https://maxkb.cn/1.2系统架构1.3技术栈-前端:vue.js、LogicFlow-后端:Python/Django、langchain-向…
我之前是不会自己写油猴脚本的,当遇到可以使用油猴解决问题的时候通常需要使用搜索引擎搜索相关的代码,然后导入到油猴中进行使用。但是遇到搜索不到相关脚本的时候就没有办法了,最近遇到一个需求:需要劫持页面的websocket,…
1.简介Chroma是AI原生开源矢量数据库。Chroma通过为LLM提供知识、事实和技能,使构建LLM应用程序变得容易。同时也是实现大模型RAG技术方案的一种有效工具。Chrome提供以下能力:存储嵌入类型数据(emb…
1简介-官网https://www.langflow.org/-文档https://docs.langflow.org/-开源地址https://github.com/langflow-ai/langflow …
1. 效果演示演示地址http://192.168.2.34:3000/2. 软硬件配置系统Windows10内存16G磁盘50G显卡1660TI(6G)软件Docker 3. 安装Ollama3.1 下载OllamaO…
简介PaddleOCR是由百度研发的一个基于深度学习的开源OCR(OpticalCharacterRecognition,光学字符识别)工具库。官方文档地址:https://paddlepaddle.github.io/…
背景 1.原来的博客中制作了一个AI助手,可以通过聊天的方式对某一篇博客进行问答,为了方便在博客中进行集成AI助手,前端使用的技术方案是在页面中通过iframe的方式进行嵌入,这样只需要在原来的页面中添加一行代码即可。…
上一章讲到了RAG的基本流程,但是如果只是完成一个基本流程,想要在商业上使用还是不行,因为正常商业上的使用其准确度至少有个90%甚至更高。那么如何提高RAG的准确度,那么需要看看RAG有哪些关键点。 1RAG结…