본문 바로가기

Python_Beginer/Study

HRD 수업>파이썬을 이용한 자동화 스크립트 - 연습문제 12

반응형
'''
1. 자막 파일을 읽는다.
2. 자막 관련 다른 정보는 모두 제거하고 자막 문자열만 남긴다.
3. 리스트의 내용을 다시 파일로 생성 저장
'''
# 글자만 추출
def extract_text_from_subtitle(file_name):
    sub_title_contents = []

    file = open(file_name, 'r')
    for line in file:
        line = line.replace('\n', '')
        if len(line) < 3 and line.isnumeric():
            # pass
            continue
        elif line.count(':') > 2 and line.count('-->') > 0:
            pass
        elif line == '':
            pass
        else:
            sub_title_contents.append(line)

    file.close()
    return sub_title_contents

# 파라미터 : 리스트, 파일이름 , 확장자(기본값)
def make_file_and_save(content, file_name, ext='txt'):
    # 리스트로 파일을 생성
    with open(file_name + '.' + ext, 'w') as file:
        for line in content:
            # 개행 하여 작성
            file.write('%s\n' % line)


def main():
    file_name = 'subtitle.srt'
    subtitle_contents = extract_text_from_subtitle(file_name)
    make_file_and_save(subtitle_contents, file_name, 'txt')
    print('job completed..')

# 관용적 사용
if __name__ == '__main__':
    main()
반응형