如何使用管道分隔符导出到 .csv

Posted

技术标签:

【中文标题】如何使用管道分隔符导出到 .csv【英文标题】:How can I export to .csv with pipe delimiter 【发布时间】:2018-08-21 06:09:08 【问题描述】:

我使用 Google 表格(电子表格)为我的 Gambio 商店合并不同来源的文章数据。 要导入数据,我需要将管道符号作为分隔符/分隔符,并将 " 作为 .csv 文件中的文本分隔符。 在用于导出到 .csv 的 Google 表格菜单中,没有选项。

有没有办法在 Google 表格中使用管道分隔符导出到 .csv?

【问题讨论】:

@Ruben 您重新访问这个问题有什么特别的原因吗?只是根据您的声誉来询问原因,我写了一个答案。 @Tedinoz:不确定,但我认为我在应用google-sheets 作为过滤器的审核队列中发现了这个问题。我做的一些常规问题管理是从标题中删除标签并编辑标签。 【参考方案1】:

有多种方法可以从 Google 表格中导出电子表格和/或工作表。将工作表导出为 csv 文件是 Google 表格的内置功能(文件、下载、CSV)。

在这种情况下,OP 引入了“标准”方法无法解决的两个复杂问题。 1) 由“管道”字符 (|) 分隔的字段,以及 2) 所有字符串字段都用双引号括起来。

GitHub 上有几个脚本可以实现将工作表另存为 csv 的过程的自动化。 Michael Derazon (https://gist.github.com/mderazon/9655893) 的 export-named-sheet-as-csv.gs 就是一个示例,我以此作为此代码的基础。但是,这些脚本遵循使用逗号作为字段分隔符的“正常”规则,并且没有对字符串进行特殊处理。

以下代码会将活动工作表保存为 csv 文件,并提供管道字段分隔符和字符串周围的双引号。这些参数可以由用户通过编辑参数表上的字段来指定,如此屏幕截图所示。


该脚本使用typeof 来识别字符串,并使用Dmytro Shevchenko 在Detecting an “invalid date” Date instance in javascript 中提到的函数isValidDate

/*
 * script to export data in all sheets in the current spreadsheet as individual csv files
 * files will be named according to the name of the sheet
 * author: Michael Derazon
 * source: https://gist.github.com/mderazon/9655893
 * adapted by Ted Bell for https://***.com/questions/49248498/how-can-i-export-to-csv-with-pipe-delimiter
 */
function onOpen() 
    var ss = SpreadsheetApp.getActiveSpreadsheet();
    var csvMenuEntries = [
        name: "export as csv file",
        functionName: "saveAsCSV"
    ];
    ss.addMenu("CSV Export", csvMenuEntries);
;

function saveAsCSV() 
    var ss = SpreadsheetApp.getActiveSpreadsheet();
    var ssname = ss.getName();
    var sheet = ss.getActiveSheet();
    var sheetname = sheet.getSheetName();
    //Logger.log("DEBUG: the name of the spreadsheet is "+ssname);//DEBUG
    //Logger.log("DEBUG: the sheet name is "+sheetname);// DEBUG

    //// create a folder from the name of the spreadsheet
    var folder = DriveApp.createFolder(ssname.toLowerCase() + '_' + sheetname.toLowerCase().replace(/ /g, '_') + '_csv_' + new Date().getTime());
    //Logger.log("DEBUG: the folder name is "+folder);//DEBUG

    // append ".csv" extension to the sheet name
    var fileName = ssname + '_' + sheetname + ".csv";

    // convert all available sheet data to csv format
    var csvFile = so_4225484202(fileName);

    // create a file in the Docs List with the given name and the csv data
    folder.createFile(fileName, csvFile);

    Browser.msgBox('Files are waiting in a folder named ' + folder.getName());



function isValidDate(date) 
    return date && Object.prototype.toString.call(date) === "[object Date]" && !isNaN(date);



function so_4225484202(filename) 

    var ss = SpreadsheetApp.getActiveSpreadsheet();
    var sheet = ss.getActiveSheet();
    var paramsheet = ss.getSheetByName("Parameters");

    var linearray = [];
    var rowdata = [];
    var csv = "";
    var fieldvalue = "";

    var param = paramsheet.getRange(2, 2, 2);
    var paramValues = param.getValues();
    //Logger.log("DEBUG: parameters = "+param.getA1Notation());//DEBUG
    var fieldDelimiter = paramValues[0][0];
    var textDelimiter = paramValues[1][0];
    //Logger.log("DEBUG: field delimiter: "+fieldDelimiter+", text delim: "+textDelimiter);//DEBUG


    var rangeData = sheet.getDataRange();
    var lastColumn = rangeData.getLastColumn();
    var lastRow = rangeData.getLastRow();
    //Logger.log("DEBUG: lastColumn: "+lastColumn+", lastRow: "+lastRow);//DEBUG

    // Get array of values in the Data Range
    var rangeValues = rangeData.getValues();

    // Loop through array and build values for csv
    for (i = 0; i < lastRow; i++) 
        for (j = 0; j < lastColumn; j++) 

            var value = rangeValues[i][j];
            var theType = typeof value;

            if (theType === "object") 
                var testdate = isValidDate(value);
                //Logger.log("if typeof is object: testdate: "+testdate);//DEBUG
                var testtype = typeof testdate;
                if (testtype === "boolean") 
                    // variable is a boolean
                    //Logger.log("Its a date");//DEBUG
                    theType = "date";
                 else 
                    //Logger.log("Its not a date");//DEBUG
                
            
            if (theType === "string") 
                value = textDelimiter + value + textDelimiter;
            

            rowdata.push([value]);
        ;

        //Logger.log("DEBUG: rowdata: "+rowdata);//DEBUG
        csv += rowdata.join(fieldDelimiter) + "\n";
        var rowdata = [];

    ;

    //Logger.log("DEBUG: csv: "+csv);//DEBUG
    return csv;


此spreadsheet 包含示例数据。 一张包含近 1,000 条记录的工作表在大约 5 秒内得到处理和保存。

【讨论】:

以上是关于如何使用管道分隔符导出到 .csv的主要内容,如果未能解决你的问题,请参考以下文章

如何将 Hive 表导出为 CSV 文件?

如何:在 MySQL 工作台中将记录集导出为分号分隔的 csv 文件?

如何使用 Python 解析 WordPress CSV 导出

HIVE数据导出CSV

如何将 CSV 导出复制到添加了新列的 Redshift 表中?

如何使用BeautifulSoup中的Python将单行中多列分隔的数据导出为.csv或.xls?