Node.js 动态表格大文件下载实践
Posted 程序员成长指北
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Node.js 动态表格大文件下载实践相关的知识,希望对你有一定的参考价值。
Koa Router * fs app = Koa();
router = Router();
router.get((ctx) =>
file = fs.readFile( ctx.set(
);
ctx.body = file;
);
app.use(router.routes());
app.listen((ctx) =>
file = fs.createReadStream( ctx.set(
);
ctx.body = file;
);
此例子不设置 Content-Disposition
头部也是会下载的,因为 Content-Type
被设置为了 application/octet-stream
,浏览器认为其是一个二进制流文件所以默认下载处理了。
进度显示当下载的文件特别大时,上个例子 Content-Length
正确设置时浏览器下载条里就能正常显示进度了,为了方便我们使用程序模拟一下:
router.get((ctx) =>
enable = ctx.query;
buffer = fsp.readFile( stream = PassThrough();
l = buffer.length;
count = size = writeQuarter =
start = i * size;
end = i === count - ? l : (i + stream.write(buffer.slice(start, end));
(end === l)
stream.end();
writeQuarter(i +
;
(!!enable)
ctx.set(
);
ctx.set(
);
ctx.body = stream;
writeQuarter();
);
这里利用了 PassThrough
流来替代 fs.createReadStream
,故 Koa 不再知道文件大小和类型,并将文件分为 4 份,每份间隔 3 秒发送来模拟大文件下载。
当参数 enable 为真时,设置了 Content-Length
则会显示进度 (剩余时间),否则不显示:
断点续传下载文件特别大时,常常也会因为网络不稳定导致下载中途断开而失败,这时候可以考虑支持断点续传:
startPos = (range === matches = (matches)
startPos =
startPos;
router.get((ctx) =>
range = ctx.get( start = getStartPos(range);
stat = fsp.stat( stream = fs.createReadStream( start,
);
stream.on(
bytes of data.`);
stream.pause();
stream.resume();
, );
(start === ctx.status = ctx.set(
);
ctx.status = ctx.set(
);
ctx.set(
);
ctx.body = stream;
);
让我们来试验一下(Chrome 默认下载工具不支持断点续传):
curl -v http://127.0.0.1/download/partial -o 1.txt
此时我们趁传输间隙,将服务进程停止,这时可以看到 1.txt
文件仅仅只传了 18 bytes:
我们将服务恢复,恢复下载:
curl -v http://127.0.0.1/download/partial -o 1.txt -C -
可以看到剩下的部分也分 4 次传完了。
动态表格
在了解完上述关于文件下载实现的基础后,我们来看一个实际问题:根据请求参数条件读取数据库的某张表的全部记录并导出为表格。
参考:
exceljs
瓶颈sequelize = Sequelize(name, user, password,
host,
port,
);
model = sequelize.import( rows = model.findAndCountAll(
list = rows.map(
f_user_id = item;
userRows = model.findAll(
);
userData;
)
);
headers = [sheetData = [headers, ...list];
ctx.attachment(exportXlsx(sheetName, sheetData);
ExcelJS = fs = (name = tempFilePath = workbook = ExcelJS.stream.xlsx.WorkbookWriter(
); sheet = workbook.addWorksheet( length = data;
(i = sheet.addRow(data[i]);
sheet.commit(); workbook.commit(); fs.createReadStream(tempFilePath);
,
;
多数人业务初期做需求时,考虑到数据量还不是很多,排期紧任务重,都像上面这样实现:
不考虑数据量,当数据库表记录数超过 2w 时,内存就已经承受不住导致 Node 进程退出了
没有考虑内存限制,找个成熟的 exceljs
库,但却没有用其提供的流 API
数据查询逻辑实现完全不考虑性能,拿到 ORM 库就是调用查询,完全不考虑 SQL 查询并发数
优化分段处理最简单的策略就是将几 w 条数据库数据按每组 1w 条分组,分批次处理,有很多优秀的开源库以供使用比如 async。
简单代码示意:
total = model.count(page = tasks = [];
size = (total > tasks.push(queryModel(
))
page++;
total -= size;
...conditions,
=>
)
流处理在上面的 xlsx.js
文件中,是先输出一个文件再使用 fs.createReadStream
流输出
exceljs
库提供了 API 来实现流写:
workbook = Excel.stream.xlsx.WorkbookWriter(options);
sheet = workbook.addWorksheet(\'My Sheet\');
// .,,
ctx.body = workbook.stream;
更多当然除了上述提到的优化手段,还有离线生成、缓存等等诸多优化手段可用,这里不再展开。
总结
文件导出是最常见的需求之一,把功能实现好是专业素质最好的体现。
此文篇幅有限,原理性的细节如 Exceljs 的依赖里对 xlsx 规范的 zip 流处理等等大家可以自行去了解一番。
Node 社群
我组建了一个氛围特别好的 Node.js 社群,里面有很多 Node.js小伙伴,如果你对Node.js学习感兴趣的话(后续有计划也可以),我们可以一起进行Node.js相关的交流、学习、共建。下方加 考拉 好友回复「Node」即可。
如果你觉得这篇内容对你有帮助,我想请你帮我2个小忙:
1. 点个「在看」,让更多人也能看到这篇文章 2. 订阅官方博客 www.inode.club 让我们一起成长
点赞和在看就是最大的支持❤️
前端实现生成带有样式的excel表格 Node和浏览器读写Excel文件探究实践
最近碰到个需要自动生成表格的任务,作为前端的我,就想在 node 和浏览器中生成强大的表格,所以特此研究了很多关于表格的 npm 库
支持读写 Excel 的 node.js 模块
- node-xlsx: 基于 Node.js 解析 excel 文件数据及生成 excel 文件,仅支持 xlsx 格式文件
- js-xlsx: 目前 Github 上 star 数量最多的处理 Excel 的库,支持解析多种格式表格 XLSX / XLSM / XLSB / XLS / CSV,解析采用纯 js 实现,写入需要依赖 nodejs 或者 FileSaver.js 实现生成写入 Excel,可以生成子表 Excel,功能强大,但上手难度稍大。不提供基础设置 Excel 表格 api 例单元格宽度,文档有些乱,不适合快速上手;普通版本不支持定义字体、颜色、背景色等,有这个功能需要的可以使用 pro 版,是要联系客服收费的,害我照着 API 设置调试了好多次都失败。好在样式设置问题有一些教程,通过研究本人已解决,可设置宽度颜色等等,见根目录本人修改的 xlsx.js
- xlsx-style 基于 xlsx 封装的样式库,可以在 xlsx 的基础上设置样式。样式不全,宽度都设置不了,好多年前作者就不维护了.宽度设置问题本人已解决了,见修改的 xlsx-style.js 文件
- exceljs 在使用此库之前,本人已花费了很大的精力,用以上库做好了表格,但是发现不能设置页眉页脚,添加图片,打印选项设置等等,直到发现了这个库,文档齐全,功能强大,并且还免费.但是star较少,差一点就错过了。本教程主要针对这个库
代码库地址
安装
npm install
npm install -g nodemon
调试使用,替代 node 命令,实现保存文件,node 自动重新启动执行,必须全局安装才能运行
使用
nodemon app.js
- js-xlsx 具体 api 使用方法请参考 main.js demo 使用,app.js 中修改为 require(‘./src/main.js‘);
- exceljs 具体 api 使用方法请参考 main-exceljs.js demo 使用,app.js 中修改为 require(‘./src/main-exceljs.js‘);
因为每次生成完表格,每次都需要打开表格查看样式,在 windows 电脑中,打开表格之后就锁定不能生成新文件了,本来想着能导出一个 html 文件对应表格的样式
node 调试
vscode 中打开调试右侧设置编辑,将下方代码复制进去,点 nodemon 启动就可以进行 debug 调试了
{
"type": "node",
"request": "launch",
"name": "nodemon",
"runtimeExecutable": "nodemon",
"program": "${workspaceFolder}/app.js",
"restart": true,
"console": "integratedTerminal",
"internalConsoleOptions": "neverOpen",
"skipFiles": ["<node_internals>/**"]
},
webpack 目录的作用
每次生成完新表格,都需要重新打开表格查看样式,在 windows 电脑中,打开表格之后就锁定了,再次生成新表格就会报错,文件已锁定,不能写入,对于想偷懒的我,能不能实现像 webpack 热更新功能那种,修改样式 js 页面自动更新呢?
wps 自带另存 html 文件功能,但是没有提供生成的 api ,网上也搜索不到对应的转换功能,
本来以为自己要实现一套表格转 html 的功能。通过不断尝试,偶然间发现手机浏览器可以直接打开预览 xlsx 文件,内心狂喜啊
使用方法
进入 webpack 目录安装依赖包,安装好之后执行
npm run dev
启动成功之后,会自动打开带有 ip 地址的预览地址,此时在电脑浏览器会自动下载 xlsx 文件,忽略不管,用手机直接打开此地址,就能看到 xlsx 表格的内容了,并且每次新修改内容和样式,都会自动刷新页面显示新表格.
小技巧
谷歌浏览器插件:
browser 目录
浏览器中实现生成 xlsx 表格方法
进入 browser 目录安装依赖包,安装好之后执行
npm run dev
启动成功之后,拖动根目录 src 下的李四表格到页面上的输入框里,成功生成表格之后会生成一个下载链接地址,右键在新标签页打开链接,即会生成一个新的表格文件出来,完整 api 使用和 demo 文件请参考 index.js
vue 和 react 用法可以参考此例子,如果有必要也可以此版本库的例子
一些概念
在使用这个库之前,先介绍库中的一些概念。
- workbook 对象,指的是整份 Excel 文档。我们在使用 js-xlsx 读取 Excel 文档之后就会获得 workbook 对象。
- worksheet 对象,指的是 Excel 文档中的表。我们知道一份 Excel 文档中可以包含很多张表,而每张表对应的就是 worksheet 对象。
- cell 对象,指的就是 worksheet 中的单元格,一个单元格就是一个 cell 对象。
xlsx 使用注意事项
constXLSX = require(‘xlsx‘);
let html = XLSX.utils.sheet_to_html(workbook.Sheets.Sheet1)
生成 html 的用法,并且不会有任何样式
exceljs 使用注意
读取文件问题
因为 exceljs 读取文件不支持 sync 同步读取,给的实例也是 await 例子.导致我读取完遇到一个问题,就是老是生成不成功,最后发现必须要把所有逻辑全部放入函数中,像下方这样
(async function (params) {
let res = await workbook.xlsx.readFile(`${__dirname}/赵六.xlsx`);
//执行所有数据处理逻辑
//执行写的逻辑
workbook.xlsx.writeFile(path.resolve(__dirname, ‘../webpack/test222.xlsx‘));
});
所有逻辑全部要写入这个函数中,这样本来是可以的,但是出错调试几率较大,并且读取到的数据庞大还需要额外处理,所以我读取数据逻辑就用的 node-xlsx,十分简单方便,如果你用的 exceljs 读取文件数据出现问题,大概率是异步同步逻辑搞错了,多加注意即可
宽度设置
列宽不知道是以什么为单位,反正不是像素(已测量),例子中是以厘米为单位再乘以 4.7 的结果设置的,4.7 是不断测试的结果.
快捷查看列宽的方法,打开 wps 表格,长按列与列字母间的竖线,就能看到列宽,取厘米的单位即可.见下图
前景色
前景色设置必须右键单元格选择设置单元格格式,然后选择图案样式选择颜色,就可以前景色填充
worksheet.getCell(‘A2‘).fill = { type: ‘pattern‘, pattern:‘darkTrellis‘, fgColor:{argb:‘FFFFFF00‘}, bgColor:{argb:‘FF0000FF‘} };
背景色
worksheet.getCell(‘A2‘).fill = { type: "pattern", pattern: "solid", fgColor: { argb: next.bgColor }, }
排版不一致的问题
解决 Mac 下编辑 Microsoft Office Word 文档与 Windows 排版不一致的问题,,不同的系统用 wps 打开相同的表格,打印预览的时候,表格宽度显示不一样
我的解决办法就是 mac 下显示正常,按 mac 下的宽度来设置就可以了
参考资料
~
创作不易,如果对你有帮助,请给个星星 star?? 谢谢,地址https://github.com/lingxiaoyi/excel
~
以上是关于Node.js 动态表格大文件下载实践的主要内容,如果未能解决你的问题,请参考以下文章
Content-Disposition
头部也是会下载的,因为 Content-Type
被设置为了 application/octet-stream
,浏览器认为其是一个二进制流文件所以默认下载处理了。Content-Length
正确设置时浏览器下载条里就能正常显示进度了,为了方便我们使用程序模拟一下:router.get((ctx) =>
enable = ctx.query;
buffer = fsp.readFile( stream = PassThrough();
l = buffer.length;
count = size = writeQuarter =
start = i * size;
end = i === count - ? l : (i + stream.write(buffer.slice(start, end));
(end === l)
stream.end();
writeQuarter(i +
;
(!!enable)
ctx.set(
);
ctx.set(
);
ctx.body = stream;
writeQuarter();
);
PassThrough
流来替代 fs.createReadStream
,故 Koa 不再知道文件大小和类型,并将文件分为 4 份,每份间隔 3 秒发送来模拟大文件下载。Content-Length
则会显示进度 (剩余时间),否则不显示: startPos = (range === matches = (matches)
startPos =
startPos;
router.get((ctx) =>
range = ctx.get( start = getStartPos(range);
stat = fsp.stat( stream = fs.createReadStream( start,
);
stream.on(
bytes of data.`);
stream.pause();
stream.resume();
, );
(start === ctx.status = ctx.set(
);
ctx.status = ctx.set(
);
ctx.set(
);
ctx.body = stream;
);
curl -v http://127.0.0.1/download/partial -o 1.txt
1.txt
文件仅仅只传了 18 bytes:curl -v http://127.0.0.1/download/partial -o 1.txt -C -
sequelize = Sequelize(name, user, password,
host,
port,
);
model = sequelize.import( rows = model.findAndCountAll(
list = rows.map(
f_user_id = item;
userRows = model.findAll(
);
userData;
)
);
headers = [sheetData = [headers, ...list];
ctx.attachment(exportXlsx(sheetName, sheetData);
ExcelJS = fs = (name = tempFilePath = workbook = ExcelJS.stream.xlsx.WorkbookWriter(
); sheet = workbook.addWorksheet( length = data;
(i = sheet.addRow(data[i]);
sheet.commit(); workbook.commit(); fs.createReadStream(tempFilePath);
,
;
不考虑数据量,当数据库表记录数超过 2w 时,内存就已经承受不住导致 Node 进程退出了
没有考虑内存限制,找个成熟的 exceljs
库,但却没有用其提供的流 API
数据查询逻辑实现完全不考虑性能,拿到 ORM 库就是调用查询,完全不考虑 SQL 查询并发数
total = model.count(page = tasks = [];
size = (total > tasks.push(queryModel(
))
page++;
total -= size;
...conditions,
=>
)
xlsx.js
文件中,是先输出一个文件再使用 fs.createReadStream
流输出exceljs
库提供了 API 来实现流写:workbook = Excel.stream.xlsx.WorkbookWriter(options);
sheet = workbook.addWorksheet(\'My Sheet\');
// .,,
ctx.body = workbook.stream;
我组建了一个氛围特别好的 Node.js 社群,里面有很多 Node.js小伙伴,如果你对Node.js学习感兴趣的话(后续有计划也可以),我们可以一起进行Node.js相关的交流、学习、共建。下方加 考拉 好友回复「Node」即可。
如果你觉得这篇内容对你有帮助,我想请你帮我2个小忙:
点赞和在看就是最大的支持❤️
最近碰到个需要自动生成表格的任务,作为前端的我,就想在 node 和浏览器中生成强大的表格,所以特此研究了很多关于表格的 npm 库
npm install
npm install -g nodemon
nodemon app.js
{
"type": "node",
"request": "launch",
"name": "nodemon",
"runtimeExecutable": "nodemon",
"program": "${workspaceFolder}/app.js",
"restart": true,
"console": "integratedTerminal",
"internalConsoleOptions": "neverOpen",
"skipFiles": ["<node_internals>/**"]
},
本来以为自己要实现一套表格转 html 的功能。通过不断尝试,偶然间发现手机浏览器可以直接打开预览 xlsx 文件,内心狂喜啊
npm run dev
npm run dev
constXLSX = require(‘xlsx‘);
let html = XLSX.utils.sheet_to_html(workbook.Sheets.Sheet1)
(async function (params) {
let res = await workbook.xlsx.readFile(`${__dirname}/赵六.xlsx`);
//执行所有数据处理逻辑
//执行写的逻辑
workbook.xlsx.writeFile(path.resolve(__dirname, ‘../webpack/test222.xlsx‘));
});
所有逻辑全部要写入这个函数中,这样本来是可以的,但是出错调试几率较大,并且读取到的数据庞大还需要额外处理,所以我读取数据逻辑就用的 node-xlsx,十分简单方便,如果你用的 exceljs 读取文件数据出现问题,大概率是异步同步逻辑搞错了,多加注意即可
快捷查看列宽的方法,打开 wps 表格,长按列与列字母间的竖线,就能看到列宽,取厘米的单位即可.见下图
前景色设置必须右键单元格选择设置单元格格式,然后选择图案样式选择颜色,就可以前景色填充
worksheet.getCell(‘A2‘).fill = { type: ‘pattern‘, pattern:‘darkTrellis‘, fgColor:{argb:‘FFFFFF00‘}, bgColor:{argb:‘FF0000FF‘} };
worksheet.getCell(‘A2‘).fill = { type: "pattern", pattern: "solid", fgColor: { argb: next.bgColor }, }
解决 Mac 下编辑 Microsoft Office Word 文档与 Windows 排版不一致的问题,,不同的系统用 wps 打开相同的表格,打印预览的时候,表格宽度显示不一样
创作不易,如果对你有帮助,请给个星星 star?? 谢谢,地址https://github.com/lingxiaoyi/excel
~