업무자동화

    번역 데이터 구축 프로그램: 개발과 수정

    번역 데이터 구축 프로그램: 개발과 수정

    1. 개발과정에서 발생한 문제점 이전 포스팅에서 설계했던 방식대로 구현해보니 수행시간이 엄청나게 오래 걸렸습니다... 스스로 문제점을 파악을 해보니, 다음과 같은 문제점이 있었고 성능을 높이기 위해 고민했습니다. 한 문장씩 번역을 할 때 웹드라이버가 새롭게 웹페이지를 띄우는 과정에서 오랜 시간이 소요된다. -> 새롭게 웹페이지를 띄우지 않고, 처음에 띄운 페이지를 그대로 사용해보자 -> 입력창에 써있는 기존 데이터를 삭제하고 새로운 데이터를 넣는다. 공교롭게도 구글 번역, 파파고 번역 웹페이지 모두 입력창의 'X'버튼을 클릭하면 입력창이 초기화되었습니다. 그래서 셀레니움에서 해당 버튼을 클릭하도록 추가한 코드는 다음과 같습니다. # 파파고 번역초기화 close = driver.find_element_by..

    번역 데이터 구축 프로그램: 지루한 업무를 자동화시킬 수 있다면?

    번역 데이터 구축 프로그램: 지루한 업무를 자동화시킬 수 있다면?

    1. 프로그램 제작 배경 언어 데이터 구축 업무 중에 큰 비중을 차지하는 것은 원문 텍스트를 파파고, 구글 번역기를 돌려 엑셀에 정리하는 것이었습니다. 그런데 원문이 1200개가 넘기 때문에 상당히 오래 걸리는 업무입니다. 원래 이 업무를 수작업으로 하게 된다면 프로세스는 다음과 같습니다. for i in range(1200): 1. 엑셀에 있는 원문을 하나 복사한다. 2. 원문을 파파고 혹은 구글에 붙여넣기를 하여 번역된 텍스트를 복사한다. 3. 번역텍스트를 원문 옆의 셀에 붙여넣기를 한다. 이걸 1200번을 하다가는 제 손목과 손가락이 제대로 남아 있지 않을 것 같았고 상당한 현타가 올 것 같았습니다...ㅎㅎ 그래서 문득 openpyxl과 selenium을 사용해서 업무를 자동화시킬 수 있지 않을까?..