Skip to content

从文件中提取数据#

在 n8n 工作流中,一个常见模式是接收文件,这些文件可能来自 [HTTP 请求节点][](用于从网站获取文件)、[Webhook 节点][](用于接收外部发送到工作流的文件)或本地源。以这种方式获取的数据通常是二进制格式,例如电子表格或 PDF。

"从文件中提取"节点可以从二进制格式文件中提取数据并将其转换为 JSON,这样工作流的后续部分就能轻松处理这些数据。如需将 JSON 转换回二进制文件类型,请参阅转换为文件节点。

操作#

使用操作下拉菜单选择要从中提取数据的源文件格式:

  • 从 CSV 提取:"逗号分隔值"文件类型通常用于表格数据
  • 从 HTML 提取:从标准网页 HTML 格式文件中提取字段
  • 从 JSON 提取:从二进制文件中提取 JSON 数据
  • 从 ICS 提取:从 iCalendar 格式文件中提取字段
  • 从 ODS 提取:从 ODS 电子表格文件中提取字段
  • 从 PDF 提取:从便携式文档格式(PDF)文件中提取字段
  • 从 RTF 提取:从富文本格式文件中提取字段
  • 从文本文件提取:从标准文本文件格式中提取字段
  • 从 XLS 提取:从 Microsoft Excel 文件(旧格式)中提取字段
  • 从 XLSX 提取:从 Microsoft Excel 文件中提取字段
  • 将文件转为 Base64 字符串:将二进制数据转换为文本友好的 base64 格式

示例工作流#

在这个示例中,使用 Webhook 节点来触发工作流。当 CSV 文件被发送到 webhook 地址时,文件数据会被输出并由 Extract From File 节点接收。

设置为 'Extract from CSV' 操作后,节点会将数据输出为一系列 JSON 'row' 对象:

1
2
3
4
5
6
7
8
{
  "row": {
  "0": "apple",
  "1": "1",
  "2": "2",
  "3": "3"
  }
  ...

通过 webhook 接收文件

选择 Webhook 节点的 Add Options 按钮并选择 Raw body,然后启用该设置以使节点输出后续节点期望的二进制文件。

节点参数#

输入二进制字段#

输入节点输入数据中包含二进制文件的字段名称。默认为 'data'。

目标输出字段#

输入节点输出中包含提取数据的字段名称。

此参数仅适用于以下操作:

  • Extract From JSON
  • Extract From ICS
  • Extract From Text File
  • Move File to Base64 String

模板和示例#

Browse 从文件提取 integration templates, or search all templates