呜啦!日常碎碎念,偶尔掉落优质前端博文推荐、学习资源等
网页:https://tg.cosine.ren
本频道的搜索Bot 来辣 👉 @cosSearchBot
私聊直接发消息就可以搜索啦~
🔖tags
#优质博文 #资源推荐 #博客更新 #碎碎念 #项目更新 #手工 #书摘 #阮一峰的科技周刊 #新动态

图频:Cosine 🎨 Gallery @CosineGallery
猫片: @cosine_cat
#优质博文 #AI #RAG #NodeJS #向量检索 #NLP
浅谈 RAG 并基于 NodeJS 实现基础向量检索服务

本文系统介绍了 RAG(Retrieval-Augmented Generation,检索增强生成)模型的基本原理、实际应用场景及其在 NodeJS 环境下的基础实现。作者围绕文本数据的预处理、向量化、向量检索、多路召回、召回重排,以及 LLMs(大语言模型)在流程中的作用展开,详细讲解了如何以轻量级工具搭建一个实用的 RAG 检索服务,并讨论了分片策略、编码方法、检索优化及与开箱即用方案的取舍,为构建定制化AI知识问答系统提供了开源思路和技术参考。

1. RAG 简介与应用场景
RAG 是结合检索(Retrieval)与生成(Generation)的 AI 架构,能提升对专业领域、高时效性内容的问答、代码生成等场景的回答质量。
• 适用于最新知识获取、特定领域知识补充、提升透明度与可解释性、长尾数据检索、垂直智能问答等实际需求。
RAG 以内容检索为核心,兼容多种方式(如向量检索、倒排索引、图谱检索等),并与 LLMs 配合工作。

2. 文本向量化流程设计
• 数据预处理包括文本清洗和分片,分片方式有固定长度、overlap 重叠、句段分割、结构分片等,应兼顾语义完整性与检索效率。
• 分片时建议结合元信息(如标题、作者、时间等)以辅助召回与重排。
• 编码方式的演变从 one-hot,TF-IDF,到更先进的 Word2Vec、Transformer-based Embedding。实际项目推荐使用现成高效模型如 all-MiniLM-L6-v2。
• 分片及编码细节优化显著影响检索召回质量和成本。

3. 向量检索与多路召回机制
• 检索的核心是计算 Query 与候选文本的向量相似度,常用余弦相似度(Cosine Similarity),因其只关注方向信息,适合高维稀疏空间。
• 采用 hnswlib-node 快速完成高维向量检索,实际实现还需与实际内容并行存储,便于元数据同步。
• 多路召回建议综合关键词检索、向量召回、图谱召回等互补方式,通过加权、融合、重排序等策略提升检索全面性和精度。

4. 召回重排(Re-Ranking)及其优化
• 初次召回后需对候选结果做重排,提升真正相关内容在前,常见方法如下:
• 传统交叉编码器(如 BERT NSP)精排。
• LLMs 或专门 ReRanker 模型(如 BGE-Reranker)基于上下文深度理解排序。
• 分片元信息和人工打标可进一步增强重排效果,提升系统最终响应准确性和相关性。
• 重排虽可提升体验,但不可避免加大系统复杂度和响应耗时,需按场景权衡。

5. LLMs 在 RAG 流程中的多重角色
• 查询改写:修正拼写、分解多意图、格式化表达、扩展关键词等,显著提高召回精准度。
• 输入优化:用LLMs提升分片、编码智能化水平,以及用于多模态信息抽取、知识图谱构建等。
• 生成增强:将高相关检索片段作为上下文,辅助 LLMs 生成更自然、连贯、有据可溯的答案,并可提升系统的可用性与信任度。
• LLMs 贯穿流程多环节,兼具结构化与半结构化内容的处理与优化能力。

6. 方案总结与工程实践建议
RAG 作为 AI Infra 基础模块,值得深入学习和灵活定制。开箱服务适用于通用场景,复杂定制或增量优化建议自行实现。
• 流程各节点(分片、编码、检索、重排、生成)都可精调优化,针对需求选择技术方案、服务模型和参数设定。
RAG 在提升 LLMs 时效性、知识深度、成本控制等方面具备不可替代优势。


author WindRunnerMax
#优质博文 #前端 #node #新动态
Node Weekly #577

AI 摘要:本期 Node Weekly 聚焦 Node.js 24 发布、AI Agent 开发、JavaScript 生态工具更新(如 Bun、Deno、Llama Stack),以及社区动态(如 Node.js Next 10 调查)等。

1. 社区动态
• Node.js 24 发布 成为新的 Current 版本,替代 EOL 的 v18 和 v23,附带:npm 11、V8 13.6(支持 RegExp.escape、Float16Array 等)、默认暴露 URLPattern API、Undici 7。
Llama Stack 应用:Meta 的 Llama Stack 是一组统一的 API,用于处理现代 LLM 驱动的堆栈的众多部分,支持 RAG(检索增强生成),Michael Dawson 提供实践指南#AI #RAG
Node.js Next 10 调查:Linux Foundation 发起,征集未来十年 Node.js 发展方向意见。
• Redis 重新开源:v8.0 恢复开源许可。
• GSAP 免费:商业动画库 GSAP 全面开放免费使用。
• ECMAScript 提案:显式资源管理(Stage 3)已在 Chrome 134+ 和 Node 24 实现。
npm 恶意软件:攻击者仿冒知名库名发布恶意包。

2. 运行时与工具更新
• Bun v1.2.12:增强 Node 兼容性、现在可以通过终端上的 Bun 将浏览器控制台日志流式传输回去。
• Deno 2.3:改进单二进制编译,支持 FFI、Node 原生附加组件和本地 npm 包。
• PGlite 0.3:基于 WASM 的 Postgres,可在浏览器或 Node 中运行。 #WASM
• Prisma v6.7:加速从 Rust 转向 TypeScript。
• SVGO 4.0(SVG 优化)、Jira.js(Jira API 封装)、RedisSMQ(Redis 消息队列)……
• Josh Ceau 的 Operator Lookup 网站使得 JavaScript 运算符查找变得容易,甚至可以找到您以前从未遇到过的运算符,例如 >>>=
Retrieval-augmented generation with Llama Stack and Node.js | Red Hat Developer
#AI #parser #transform
LlamaParse: 将非结构化数据转换为 LLM 优化格式
https://www.llamaindex.ai/llamaparse

最好的 genAI 原生解析平台,专为将复杂文档(包含表格、图表、图像、流程图等)转化为适用于 LLM 应用程序的简洁数据而构建

#开源
https://github.com/run-llama/llama_index

#RAG #优质博文
利用LlamaParse从文档中创建知识图谱 https://zhuanlan.zhihu.com/p/699456593
LlamaParse是一款专有的解析工具,用于处理具有 嵌入式对象(如表格和图表)的复杂文档,与 Llamalndex*的摄取和检索功能无缝集成。此集成 能够构建针对复杂、半结构化文档的检索系统,有 助于回答以往难以处理的复杂问题。此外,引入可 管理的摄取和检索API,简化RAG应用的加载、处 理和存储数据的流程。 本文将演示如何将LlamaParse与Neo4j集成创建知 识图谱,从而使RAG应用更加准确和强大。
LlamaParse: Transform unstructured data into LLM optimized formats — LlamaIndex - Build Knowledge Assistants over your Enterprise…
#优质博文 #前端 #tools
1. CSS 的 backdrop-filter 属性(英文) 本文介绍 backdrop-filter 属性,可以产生毛玻璃的效果。 #css
backdrop-filter 是一个强大的 CSS 属性,它可以对元素后面的内容应用模糊、亮度调整等滤镜效果,从而创造出玻璃拟态(Glassmorphism)等视觉效果。文章介绍了 backdrop-filter 的基本用法,如 blur() 进行模糊处理,以及 brightness() 进行亮度调整。同时,作者强调了 backdrop-filter 仅影响元素背景,不会影响其自身内容。此外,文章探讨了浏览器兼容性问题,指出 Safari 早期支持较好,而部分浏览器(如 Firefox)需要启用实验性功能才能使用。最后,作者提供了示例代码,并建议开发者结合 background 颜色和 backdrop-filter 以获得最佳视觉效果。

2. 基于 signal 的 Web 组件(英文) #html #WebComponents
作者介绍自己写的一个 Web 组件,可以在不加其他 JS 库的情况下,实现 signal 功能。
本文探讨了在 HTML 中直接定义 信号(Signals) 的可能性,提出 <x-signal> 自定义元素,使其能够管理状态并自动更新 UI,而无需依赖 JavaScript 框架。该方法基于 HTML-based state 概念,直接从 HTML 解析初始值,并支持类型转换、动态渲染、自定义格式化及派生状态计算。最终,作者认为 <x-signal> 代表了一种更细粒度的 **Islets 架构**,在静态 HTML 中提供轻量级的响应式交互能力。

3. 鸿蒙 ArkTS VSCode 插件 #vscode #ArkTS #插件 #鸿蒙
ArkTS 是华为鸿蒙系统的开发语言,属于 TypeScript 的超集,这是它的 VSCode 插件。
4. RAG Web UI #AI #RAG
一个开源的 AI 桌面应用,可以上传文档,生成本地的知识库问答系统,基于 RAG(检索增强生成)技术。
5. TEN Agent #AI #agent #语音
一个 AI 的工具框架,快速打造语音相关的 AI 应用。
6. 富文本编辑器比较2025版(英文) #富文本 #编辑器
这个页面详细比较了 JS 的富文本"所见即所得"编辑器,一共十几个库,详细介绍每个库的特点
本文分析了主流的富文本编辑器框架,帮助开发者在 2025 年做出最佳选择。文章涵盖 Lexical、ProseMirror、Slate、Tiptap、Quill 等编辑器,并从 可扩展性、性能、易用性、社区支持 等方面进行了对比。
Lexical (Meta 开源):高性能、模块化、适合复杂应用,但生态仍在发展中。
ProseMirror :功能强大、灵活,但 API 复杂,入门门槛较高。
Slate :React 友好,完全可定制,但文档有限,维护情况不稳定。
Tiptap (基于 ProseMirror):提供更简洁的 API 和更好的 TypeScript 支持,适合现代 Web 应用。
Quill :易用,适合基本需求,但扩展性受限。
结论: 如果你需要高扩展性和现代化 API,Lexical Tiptap 是更好的选择;如果追求稳定和成熟方案, ProseMirror 仍然值得考虑。


via
#阮一峰的科技周刊 337
 
 
Back to Top