Cum să analizați o linie de fișier după linie cu Python

Unul dintre principalele motive pentru care oamenii folosesc Python este analizarea și manipularea textului. Dacă programul trebuie să funcționeze printr-un fișier, cel mai bine este să citiți în fișier o linie la un moment dat din motive de spațiu de memorie și viteză de procesare. Acest lucru se realizează cel mai bine cu o buclă de timp.

Acest cod ia primul argument al liniei de comandă ca nume al fișierului care va fi procesat. Prima linie o deschide și inițiază un obiect de fișier, "fileIN". A doua linie citește apoi prima linie a acelui fișier obiect și o atribuie unei variabile de șir, „linie”. Bucla de timp se execută pe baza constanței „liniei”. Când „linia” se schimbă, bucla reporniri. Aceasta continuă până când nu mai există linii ale fișierului care trebuie citite. Programul apoi iese.

Citind fișierul în acest fel, programul nu mușcă mai multe date decât este setat să proceseze. Procesează datele pe care le introduce mai rapid, oferindu-și ieșirea treptat. În acest fel, amprenta de memorie a programului este menținută scăzută, iar viteza de procesare a computerului nu are un hit. Acest lucru poate fi important dacă scrieți un script CGI care poate vedea câteva sute de cazuri care se execută simultan.

instagram viewer

Declarația poate fi o declarație unică sau un bloc de declarații. Toate declarațiile indentificate de aceeași sumă sunt considerate a face parte din același bloc de cod. Indentarea este modul în care Python indică grupuri de enunțuri.