talend工具整理文件并出力文件到Excel当中

Posted killclock048

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了talend工具整理文件并出力文件到Excel当中相关的知识,希望对你有一定的参考价值。

问题描述:

每天都会生成一定的txt文件,txt文件当中含有复数个个人的信息,把每个个人信息都抽出来之后放到Excel文件的一览里面。

解决思路:

1.txt文件里面的信息有多件,每一件生成一个临时的文件。

2.读取临时的文件之后放到Excel的一览里面。

3.考虑到二次执行的时候,要把临时的文件和前一次的数据给删除。

 

talend的具体的流程如下图:

技术分享图片

解释说明:

①为了第二次可以执行,所以在此处先删除临时文件夹里面的临时文件

代码如下:

// 当「コンポーネント」で、下記コードを書きます
// パラメータ「context.dataSourcePath」がContxtで、設定する、
outputDataConver.fileDel(context.dataSourcePath + "temp"); 
// 在「コード」?「ルーチン」で、新しいクラスを作成し、下記の方法を作成
// 一時ファイル削除
public static void fileDel(String path){
File file = new File(path);
if (file.exists()) {
File[] files = file.listFiles();
for (File fileItem : files) {
fileItem.delete();
}
}
}

②此处的目的是想把「tJava3」的代码都执行结束之后再向下执行。

    生成方式是·「tJava5」?「右キーを押し」?「トリガー」?「サブジョブがOKの場合」

 

③④⑤为了实现在第二次执行的时候,把第一次执行的数据要删除的功能,再次要检索一下,当前的数据文件里面有没有当天的数据

        ③的生成方式是·「メタデータ」?「Excelファイル」?「右キーを押し」?「Excelファイル作成する」

        ④只是匹配两端的数据

        ⑤要判断有没有执行过一次数据,即当天的数据是否含有

         

// 当日のデータがあれば、パラメータが”FLASE”を設定する
// パラメータ「context.dataDelFg 」がContxtで、設定する、初期値が”true”に設定する
if(( new SimpleDateFormat("yyyyMMdd").format(new Date())).equals(input_row.O) ){
    context.dataDelFg = "false";
    
}

⑥临时的一个控件,为了方便加判断条件。添加方式是鼠标选择在控件「tJava5」?「右キーを押し」?「トリガー」?「条件付く実行」

    if(order:1)的判断条件("false".equals(context.dataDelFg ))

    if(order:2)的判断条件("true".equals(context.dataDelFg ))


⑦⑧⑨此处是想实现,删除当天的数据生成临时的文件

  ⑧处的设定如下

技术分享图片


⑩处的实现利用临时生成的文件把目标文件给覆盖,即拷贝
?利用事前准备好的模板把临时生成的临时文件给恢复到最初的状态

?把单个txt文件里面的复数个个人信息给生成到,一个文件一个个人信息里面

			
			// キーワード:名前
			String keyFileName =context.dataSourcePath + "氏名.txt";
			List<String> keyFileNameList = outputDataConver.getKeyWord(keyFileName);

			// キーワード:性別
			String keyFileSex = context.dataSourcePath + "性別.txt";
			List<String> keyFileSexList = outputDataConver.getKeyWord(keyFileSex);
			// キーワード:年齢
			String keyFileAge = context.dataSourcePath + "年齢.txt";
			List<String> keyFileAgeList = outputDataConver.getKeyWord(keyFileAge);
			// キーワード:経験年数
			String keyFileExperience=context.dataSourcePath + "経験.txt";
			List<String> keyFileExperienceList = outputDataConver.getKeyWord(keyFileExperience);
			// キーワード:最寄駅
			String keyFileStation = context.dataSourcePath + "最寄駅.txt";
			List<String> keyFileStationList = outputDataConver.getKeyWord(keyFileStation);
			// キーワード:日本語レベル
			String keyFileLevel = context.dataSourcePath + "日本語レベル.txt";
			List<String> keyFileLevelList = outputDataConver.getKeyWord(keyFileLevel);
			// キーワード:スキル
			String keyFileSkill = context.dataSourcePath + "スキル.txt";
			List<String> keyFileSkillList = outputDataConver.getKeyWord(keyFileSkill);
			// キーワード:業種
			String keyFileIndustry = context.dataSourcePath + "業種.txt";
			List<String> keyFileIndustryList = outputDataConver.getKeyWord(keyFileIndustry);
			// キーワード:希望単価
			String keyFilePrice = context.dataSourcePath + "希望単価.txt";
			List<String> keyFilePriceList = outputDataConver.getKeyWord(keyFilePrice);
			
			// 指定のパス下のファイル取得		
			String path = context.dataSourcePath +( new SimpleDateFormat("yyyyMMdd").format(new Date()))+ "\\";			
			List<String> fileNameList = outputDataConver.traverseFolder(path);
			
			for(String fi:fileNameList){
				String name = fi.replace(path,"");
			    File file = new File(fi);
			    FileWriter writer=null;
			  	try (InputStreamReader  fr = new InputStreamReader(new FileInputStream(file), "SJIS");
			    BufferedReader reader = new BufferedReader(fr)) {

			        String temp = "";
			    
					String kkcy1 = context.dataSourcePath + "temp/" + name.substring(0,name.length()-4);
					String kkcy2= name.substring(name.length()-4, name.length());
					
					int index = 0;
					boolean flag = true;
					boolean sexFlag = true;
					boolean ageFlag = true;
					
					// TXTファイル内容読み取り
					while ((temp = reader.readLine()) != null) {
					   		
						String nameStr = outputDataConver.keyWord(temp, keyFileNameList);
						if (!"".equals(nameStr)){
							if(!flag){
								writer.close();
								flag = true; 
							}
							File fileText = new File(kkcy1 +"_" + index + kkcy2);
				   
							writer=new FileWriter(fileText);     			    	
							index = index + 1;
							 
							writer.write("名前:" + nameStr.trim());
							writer.write("
");
							writer.write("会社:" + name);
							writer.write("
");
							sexFlag = false;
							ageFlag = false;
							flag = false; 
						}
						
						if (!sexFlag){
							String sexStrHs = outputDataConver.keyWordSex(temp);
							if(!sexStrHs.equals("")){
								sexFlag = true;
								writer.write("性別:" + sexStrHs.trim() );
								writer.write("
");
							}						
						}
						String sexStr = outputDataConver.keyWord(temp, keyFileSexList);
						if (!"".equals(sexStr)){
							writer.write("性別:" + sexStr.trim() );
							writer.write("
");
						}
						if (!ageFlag){
							String ageStrHs = outputDataConver.keyWordAge(temp);
							if(!ageStrHs.equals("")){
								ageFlag = true;
								writer.write("年齢:" + ageStrHs.trim() );
								writer.write("
");
							}
							
							
						}
						String ageStr = outputDataConver.keyWord(temp, keyFileAgeList);
						if (!"".equals(ageStr)){
							writer.write("年齢:" + ageStr.trim());
							writer.write("
");
						}
						
						String experienceStr = outputDataConver.keyWord(temp, keyFileExperienceList);
						if (!"".equals(experienceStr)){
							
							writer.write("経験年数:" + experienceStr.trim());
							writer.write("
");
						}
						
						String stationStr =outputDataConver. keyWord(temp, keyFileStationList);
						if (!"".equals(stationStr)){
							writer.write("最寄駅:" + stationStr.trim());
							writer.write("
");
						}
						
						String levelStr = outputDataConver.keyWord(temp, keyFileLevelList);
						if (!"".equals(levelStr)){
							writer.write("日本語レベル:" + levelStr.trim());
							writer.write("
");
						}
						
						String skillStr = outputDataConver.keyWord(temp, keyFileSkillList);
						if (!"".equals(skillStr)){
							writer.write("スキル:" + skillStr.trim().replace(",","、"));
							writer.write("
");
						}
						
						String industryStr = outputDataConver.keyWord(temp, keyFileIndustryList);
						if (!"".equals(industryStr)){
							writer.write("業種:" + industryStr.trim());
							writer.write("
");
						}
						
						String priceStr = outputDataConver.keyWord(temp, keyFilePriceList);
						if (!"".equals(priceStr)){
							writer.write("希望単価:" + priceStr.trim());
							writer.write("
");
						}
					}
					
				  } catch(FileNotFoundException e) {
					throw new Exception(e);
				  }finally{

					 if(writer != null) {
						 writer.close();
					 }
              }
			}  
			  
			  
			  
			 

????实现把每一个文件的个人信息写到Excel里面

   ?的设定

技术分享图片

?的代码

			  String fileName = context.dataSourcePath + "temp/"+ ((String)globalMap.get("tFileList_1_CURRENT_FILE"));

			  File file = new File(fileName);
			  try (InputStreamReader  fr = new InputStreamReader(new FileInputStream(file), "SJIS");
			    BufferedReader reader = new BufferedReader(fr)) {
			    
			    String temp = "";
		    
			    String[] strTemp= {" ,"," ,"," ,"," ,"," ,"," ,"," ,"," ,"," ,"," ,",};
			    
			    
			    while ((temp = reader.readLine()) != null) {
			      System.out.print("Excel:"+temp);
			    	if (temp.indexOf("名前:") >= 0){
			    		strTemp[0] = temp.replace("名前:", "") + ",";
			    	}
			    	
			    	if (temp.indexOf("性別:") >= 0){
			    		strTemp[1] = temp.replace("性別:", "") + ",";
			    	}
			    	
			    	if (temp.indexOf("年齢:") >= 0){
			    		strTemp[2] = temp.replace("年齢:", "") + ",";
			    	}
			    	
			    	if (temp.indexOf("経験年数:") >= 0){
			    		strTemp[3] = temp.replace("経験年数:", "") + ",";
			    	}
			    	
			    	if (temp.indexOf("最寄駅:") >= 0){
			    		strTemp[4] = temp.replace("最寄駅:", "") + ",";
			    	}
			    	if (temp.indexOf("日本語レベル:") >= 0){
			    		strTemp[5] = temp.replace("日本語レベル:", "") + ",";
			    	}
			    	if (temp.indexOf("スキル:") >= 0){
			    		strTemp[6] =temp.replace("スキル:", "") + ",";
			    	}
			    	if (temp.indexOf("業種:") >= 0){
			    		strTemp[7] = temp.replace("業種:", "") + ",";
			    	}
			    	if (temp.indexOf("希望単価:") >= 0){
			    		strTemp[8] = temp.replace("希望単価:", "") + ",";
			    	}
			    
			    	if (temp.indexOf("会社:") >= 0){
			    		strTemp[9] = temp.replace("会社:", "") + ",";
			    	}
			    }
                
                StringBuilder strBuData = new StringBuilder();
			    for(int i = 0; i < strTemp.length; i++){
			    		strBuData.append(strTemp[i]);	    	
			    }

			    
			    context.txtStr = strBuData.toString();
			    row1.txtStr = context.txtStr;
			   
			  } catch(FileNotFoundException e) {
			    throw new Exception(e);
			  }

  ?的设定技术分享图片

 

常量的设定

 

技术分享图片

 















以上是关于talend工具整理文件并出力文件到Excel当中的主要内容,如果未能解决你的问题,请参考以下文章

如何把多个EXCEL文件汇总到一个EXCEL中?

如何连接到 2 个 linux 服务器以使用 talend 复制文件

Python 自动化办公2批量读取excel表格内容,筛选符合条件行,并整理到新excel文件

Python 自动化办公2批量读取excel表格内容,筛选符合条件行,并整理到新excel文件

使用 Talend 填充事实表

开启数据分析的大门-数据收集:Python对文件的操作