[資料探勘]Java ETL技巧整理
ETL ETL = Extract-Transform-Loading 過程 Raw Data -> ETL Script -> Tidy Data (結構化資料) Java FileReader 把檔案裡的字元讀進來以後呢,轉換成看得懂的文字。 FileReader fReader = new FileReader ("filename") BufferedReader 為所接受到的內容建立一個緩衝的功能。 bReader = new BufferedReader(fReader); e.g. BufferedReader bReader = null; String line; FileReader fReader; fReader = new FileReader("filename.txt"); bReader = new BufferedReader(fReader); while((line= bReader.readLine()) != null){ System.out.println(line); } ***為什麼要有BufferedReader?(用BufferReader接載FileReader) 因為如果資料量很大的話,主記憶體又有限,一次讀進來的話 會用掉很多記憶體,所有BufferedReader可以針對Buffer進行 資料段的讀取、修改與刪除。 Scanner Scanner 可以使用正規表達式(Regular Expression) 剖析(Parsing)基本資料型態與字串 Scanner sc = new Scanner (new File("FileName")); while(sc.hasNextLine()){ String next = sc.nextLine(); }