递归字符文本分割器节点#
递归字符文本分割器节点通过递归方式分割文档数据,尽可能保持段落、句子和单词的完整性。
本页将介绍递归字符文本分割器节点的参数配置,并提供更多资源链接。
/// 注意 | 子节点中的参数解析 子节点在使用表达式处理多个项目时的行为与其他节点不同。
大多数节点(包括根节点)会接收任意数量的输入项,处理这些项目,然后输出结果。您可以使用表达式来引用输入项,节点会依次为每个项目解析表达式。例如,给定五个 name
值作为输入,表达式 {{ $json.name }}
会依次解析为每个名称。
而在子节点中,表达式总是解析为第一个项目。例如,给定五个 name
值作为输入,表达式 {{ $json.name }}
总是解析为第一个名称。
///
节点参数#
- 分块大小:输入每个分块包含的字符数。
- 分块重叠量:输入分块之间的重叠字符数。
模板与示例#
相关资源#
更多关于该服务的信息,请参考 LangChain 文本分割器文档 和 LangChain 递归字符分割文档。
查看 n8n 的高级 AI 文档。
AI glossary#
- completion: Completions are the responses generated by a model like GPT.
- hallucinations: Hallucination in AI is when an LLM (large language model) mistakenly perceives patterns or objects that don't exist.
- vector database: A vector database stores mathematical representations of information. Use with embeddings and retrievers to create a database that your AI can access when answering questions.
- vector store: A vector store, or vector database, stores mathematical representations of information. Use with embeddings and retrievers to create a database that your AI can access when answering questions.