#RAG | cosine - 前端人の日常频道

呜啦！日常碎碎念，偶尔掉落优质前端博文推荐、学习资源等
网页：https://tg.cosine.ren
本频道的搜索Bot 来辣 👉 @cosSearchBot
私聊直接发消息就可以搜索啦～
🔖tags
#优质博文 #资源推荐 #博客更新 #碎碎念 #项目更新 #手工 #书摘 #阮一峰的科技周刊 #新动态

图频：Cosine 🎨 Gallery @CosineGallery
猫片： @cosine_cat
联系频道主：@cosine_yu

11:20 · Aug 5, 2025 · Tue

#优质博文 #AI #RAG #NodeJS #向量检索 #NLP
浅谈 RAG 并基于 NodeJS 实现基础向量检索服务

本文系统介绍了 RAG（Retrieval-Augmented Generation，检索增强生成）模型的基本原理、实际应用场景及其在 NodeJS 环境下的基础实现。作者围绕文本数据的预处理、向量化、向量检索、多路召回、召回重排，以及 LLMs（大语言模型）在流程中的作用展开，详细讲解了如何以轻量级工具搭建一个实用的 RAG 检索服务，并讨论了分片策略、编码方法、检索优化及与开箱即用方案的取舍，为构建定制化AI知识问答系统提供了开源思路和技术参考。

1. RAG 简介与应用场景
• RAG 是结合检索（Retrieval）与生成（Generation）的 AI 架构，能提升对专业领域、高时效性内容的问答、代码生成等场景的回答质量。
• 适用于最新知识获取、特定领域知识补充、提升透明度与可解释性、长尾数据检索、垂直智能问答等实际需求。
• RAG 以内容检索为核心，兼容多种方式（如向量检索、倒排索引、图谱检索等），并与 LLMs 配合工作。

2. 文本向量化流程设计
• 数据预处理包括文本清洗和分片，分片方式有固定长度、overlap 重叠、句段分割、结构分片等，应兼顾语义完整性与检索效率。
• 分片时建议结合元信息（如标题、作者、时间等）以辅助召回与重排。
• 编码方式的演变从 one-hot，TF-IDF，到更先进的 Word2Vec、Transformer-based Embedding。实际项目推荐使用现成高效模型如 all-MiniLM-L6-v2。
• 分片及编码细节优化显著影响检索召回质量和成本。

3. 向量检索与多路召回机制
• 检索的核心是计算 Query 与候选文本的向量相似度，常用余弦相似度（Cosine Similarity），因其只关注方向信息，适合高维稀疏空间。
• 采用 hnswlib-node 快速完成高维向量检索，实际实现还需与实际内容并行存储，便于元数据同步。
• 多路召回建议综合关键词检索、向量召回、图谱召回等互补方式，通过加权、融合、重排序等策略提升检索全面性和精度。

4. 召回重排（Re-Ranking）及其优化
• 初次召回后需对候选结果做重排，提升真正相关内容在前，常见方法如下：
• 传统交叉编码器（如 BERT NSP）精排。
• LLMs 或专门 ReRanker 模型（如 BGE-Reranker）基于上下文深度理解排序。
• 分片元信息和人工打标可进一步增强重排效果，提升系统最终响应准确性和相关性。
• 重排虽可提升体验，但不可避免加大系统复杂度和响应耗时，需按场景权衡。

5. LLMs 在 RAG 流程中的多重角色
• 查询改写：修正拼写、分解多意图、格式化表达、扩展关键词等，显著提高召回精准度。
• 输入优化：用LLMs提升分片、编码智能化水平，以及用于多模态信息抽取、知识图谱构建等。
• 生成增强：将高相关检索片段作为上下文，辅助 LLMs 生成更自然、连贯、有据可溯的答案，并可提升系统的可用性与信任度。
• LLMs 贯穿流程多环节，兼具结构化与半结构化内容的处理与优化能力。

6. 方案总结与工程实践建议
• RAG 作为 AI Infra 基础模块，值得深入学习和灵活定制。开箱服务适用于通用场景，复杂定制或增量优化建议自行实现。
• 流程各节点（分片、编码、检索、重排、生成）都可精调优化，针对需求选择技术方案、服务模型和参数设定。
• RAG 在提升 LLMs 时效性、知识深度、成本控制等方面具备不可替代优势。

author WindRunnerMax

优质博文 AI RAG NodeJS 向量检索 NLP

11:13 · May 8, 2025 · Thu

#优质博文 #前端 #node #新动态
Node Weekly #577

AI 摘要：本期 Node Weekly 聚焦 Node.js 24 发布、AI Agent 开发、JavaScript 生态工具更新（如 Bun、Deno、Llama Stack），以及社区动态（如 Node.js Next 10 调查）等。

1. 社区动态
• Node.js 24 发布成为新的 Current 版本，替代 EOL 的 v18 和 v23，附带：npm 11、V8 13.6（支持 RegExp.escape、Float16Array 等）、默认暴露 URLPattern API、Undici 7。
• Llama Stack 应用：Meta 的 Llama Stack 是一组统一的 API，用于处理现代 LLM 驱动的堆栈的众多部分，支持 RAG（检索增强生成），Michael Dawson 提供实践指南。 #AI #RAG
• Node.js Next 10 调查：Linux Foundation 发起，征集未来十年 Node.js 发展方向意见。
• Redis 重新开源：v8.0 恢复开源许可。
• GSAP 免费：商业动画库 GSAP 全面开放免费使用。
• ECMAScript 提案：显式资源管理（Stage 3）已在 Chrome 134+ 和 Node 24 实现。
• npm 恶意软件：攻击者仿冒知名库名发布恶意包。

2. 运行时与工具更新
• Bun v1.2.12：增强 Node 兼容性、现在可以通过终端上的 Bun 将浏览器控制台日志流式传输回去。
• Deno 2.3：改进单二进制编译，支持 FFI、Node 原生附加组件和本地 npm 包。
• PGlite 0.3：基于 WASM 的 Postgres，可在浏览器或 Node 中运行。 #WASM
• Prisma v6.7：加速从 Rust 转向 TypeScript。
• SVGO 4.0（SVG 优化）、Jira.js（Jira API 封装）、RedisSMQ（Redis 消息队列）……
• Josh Ceau 的 Operator Lookup 网站使得 JavaScript 运算符查找变得容易，甚至可以找到您以前从未遇到过的运算符，例如 >>>=。

Red Hat Developer

Retrieval-augmented generation with Llama Stack and Node.js | Red Hat Developer

With Llama Stack being released earlier this year, we decided to look at how to implement key aspects of an AI application with Node.js and Llama Stack. This post covers retrieval-augmented generation

优质博文前端 node 新动态 AI RAG WASM

17:04 · Feb 21, 2025 · Fri

#AI #parser #transform
LlamaParse: 将非结构化数据转换为 LLM 优化格式
https://www.llamaindex.ai/llamaparse

最好的 genAI 原生解析平台，专为将复杂文档（包含表格、图表、图像、流程图等）转化为适用于 LLM 应用程序的简洁数据而构建

#开源
https://github.com/run-llama/llama_index

#RAG #优质博文
利用LlamaParse从文档中创建知识图谱 https://zhuanlan.zhihu.com/p/699456593

LlamaParse是一款专有的解析工具，用于处理具有嵌入式对象（如表格和图表）的复杂文档，与 Llamalndex*的摄取和检索功能无缝集成。此集成能够构建针对复杂、半结构化文档的检索系统，有助于回答以往难以处理的复杂问题。此外，引入可管理的摄取和检索API，简化RAG应用的加载、处理和存储数据的流程。本文将演示如何将LlamaParse与Neo4j集成创建知识图谱，从而使RAG应用更加准确和强大。

www.llamaindex.ai

LlamaParse | AI Document Parsing Software

LlamaParse uses VLM-powered OCR and self-correcting reasoning loops to process complex docs, handling layout, tables, charts, handwriting, and images, with industry-leading accuracy

AI parser transform 开源 RAG 优质博文

08:51 · Feb 15, 2025 · Sat

#优质博文 #前端 #tools
1. CSS 的 backdrop-filter 属性（英文）本文介绍 backdrop-filter 属性，可以产生毛玻璃的效果。 #css

backdrop-filter 是一个强大的 CSS 属性，它可以对元素后面的内容应用模糊、亮度调整等滤镜效果，从而创造出玻璃拟态（Glassmorphism）等视觉效果。文章介绍了 backdrop-filter 的基本用法，如 blur() 进行模糊处理，以及 brightness() 进行亮度调整。同时，作者强调了 backdrop-filter 仅影响元素背景，不会影响其自身内容。此外，文章探讨了浏览器兼容性问题，指出 Safari 早期支持较好，而部分浏览器（如 Firefox）需要启用实验性功能才能使用。最后，作者提供了示例代码，并建议开发者结合 background 颜色和 backdrop-filter 以获得最佳视觉效果。

2. 基于 signal 的 Web 组件（英文） #html #WebComponents
作者介绍自己写的一个 Web 组件，可以在不加其他 JS 库的情况下，实现 signal 功能。

本文探讨了在 HTML 中直接定义 信号（Signals） 的可能性，提出 <x-signal> 自定义元素，使其能够管理状态并自动更新 UI，而无需依赖 JavaScript 框架。该方法基于 HTML-based state 概念，直接从 HTML 解析初始值，并支持类型转换、动态渲染、自定义格式化及派生状态计算。最终，作者认为 <x-signal> 代表了一种更细粒度的 **Islets 架构**，在静态 HTML 中提供轻量级的响应式交互能力。

3. 鸿蒙 ArkTS VSCode 插件 #vscode #ArkTS #插件 #鸿蒙
ArkTS 是华为鸿蒙系统的开发语言，属于 TypeScript 的超集，这是它的 VSCode 插件。
4. RAG Web UI #AI #RAG
一个开源的 AI 桌面应用，可以上传文档，生成本地的知识库问答系统，基于 RAG（检索增强生成）技术。
5. TEN Agent #AI #agent #语音
一个 AI 的工具框架，快速打造语音相关的 AI 应用。
6. 富文本编辑器比较2025版（英文） #富文本 #编辑器
这个页面详细比较了 JS 的富文本"所见即所得"编辑器，一共十几个库，详细介绍每个库的特点

本文分析了主流的富文本编辑器框架，帮助开发者在 2025 年做出最佳选择。文章涵盖 Lexical、ProseMirror、Slate、Tiptap、Quill 等编辑器，并从 可扩展性、性能、易用性、社区支持 等方面进行了对比。
• Lexical （Meta 开源）：高性能、模块化、适合复杂应用，但生态仍在发展中。
• ProseMirror ：功能强大、灵活，但 API 复杂，入门门槛较高。
• Slate ：React 友好，完全可定制，但文档有限，维护情况不稳定。
• Tiptap （基于 ProseMirror）：提供更简洁的 API 和更好的 TypeScript 支持，适合现代 Web 应用。
• Quill ：易用，适合基本需求，但扩展性受限。
结论: 如果你需要高扩展性和现代化 API，Lexical 或 Tiptap 是更好的选择；如果追求稳定和成熟方案， ProseMirror 仍然值得考虑。

via #阮一峰的科技周刊 337

优质博文前端 tools css html WebComponents vscode ArkTS 插件鸿蒙 AI RAG AI agent 语音富文本编辑器阮一峰的科技周刊