从文件中提取数据#
在 n8n 工作流中,一个常见模式是接收文件,这些文件可能来自 [HTTP 请求节点][](用于从网站获取文件)、[Webhook 节点][](用于接收外部发送到工作流的文件)或本地源。以这种方式获取的数据通常是二进制格式,例如电子表格或 PDF。
"从文件中提取"节点可以从二进制格式文件中提取数据并将其转换为 JSON,这样工作流的后续部分就能轻松处理这些数据。如需将 JSON 转换回二进制文件类型,请参阅转换为文件节点。
操作#
使用操作下拉菜单选择要从中提取数据的源文件格式:
- 从 CSV 提取:"逗号分隔值"文件类型通常用于表格数据
- 从 HTML 提取:从标准网页 HTML 格式文件中提取字段
- 从 JSON 提取:从二进制文件中提取 JSON 数据
- 从 ICS 提取:从 iCalendar 格式文件中提取字段
- 从 ODS 提取:从 ODS 电子表格文件中提取字段
- 从 PDF 提取:从便携式文档格式(PDF)文件中提取字段
- 从 RTF 提取:从富文本格式文件中提取字段
- 从文本文件提取:从标准文本文件格式中提取字段
- 从 XLS 提取:从 Microsoft Excel 文件(旧格式)中提取字段
- 从 XLSX 提取:从 Microsoft Excel 文件中提取字段
- 将文件转为 Base64 字符串:将二进制数据转换为文本友好的 base64 格式
示例工作流#
在这个示例中,使用 Webhook 节点来触发工作流。当 CSV 文件被发送到 webhook 地址时,文件数据会被输出并由 Extract From File 节点接收。
设置为 'Extract from CSV' 操作后,节点会将数据输出为一系列 JSON 'row' 对象:
1 2 3 4 5 6 7 8 |
|
通过 webhook 接收文件
选择 Webhook 节点的 Add Options 按钮并选择 Raw body,然后启用该设置以使节点输出后续节点期望的二进制文件。
节点参数#
输入二进制字段#
输入节点输入数据中包含二进制文件的字段名称。默认为 'data'。
目标输出字段#
输入节点输出中包含提取数据的字段名称。
此参数仅适用于以下操作:
- Extract From JSON
- Extract From ICS
- Extract From Text File
- Move File to Base64 String
模板和示例#