Python : Membaca file per baris

File-file berukuran besar (dalam satuan ratusan mega ataupu giga bytes) tidak dapat dibaca menggunakan teks editor seperti notepad. Perlu dibuat program tersendiri untuk mengetahui isi file tersebut. Berikut adalah program Python serderhana, yang dapat digunakan untuk membaca file dari baris ke baris sejumlah yang kita inginkan. Program telah diujicobakan untuk membaca beberapa ratus baris pada file dump data wikipedia berukuran 60-an giga bytes ! 

Berikut adalah kode programnya :

filepath = 'idwiki-latest-pages-meta-history.xml'  
with open(filepath,encoding='utf-8') as fp:  
   line = fp.readline()
   total_line = 100
   cnt = 1
   while line:
       print(line.strip())
       line = fp.readline()
       cnt += 1
       if(cnt==total_line): break

Program akan membaca file dengan nama yang ada di filepath. Kemudian akan membaca baris per baris dengan encoding UTF-8. Encoding digunakan untuk antisipasi kesalahan pembacaan file. Kemudian program akan melakukan loop sejumlah 100 baris (total_line), dan setiap barisnya akan langsung dicetak pada console.

Selamat mencoba !

 

Leave a Reply

Your email address will not be published.