KR101975111B1 - 대용량 웹페이지 문서 변환 시스템 및 그 방법 - Google Patents

대용량 웹페이지 문서 변환 시스템 및 그 방법 Download PDF

Info

Publication number
KR101975111B1
KR101975111B1 KR1020170122090A KR20170122090A KR101975111B1 KR 101975111 B1 KR101975111 B1 KR 101975111B1 KR 1020170122090 A KR1020170122090 A KR 1020170122090A KR 20170122090 A KR20170122090 A KR 20170122090A KR 101975111 B1 KR101975111 B1 KR 101975111B1
Authority
KR
South Korea
Prior art keywords
document
conversion
web page
documents
converted
Prior art date
Application number
KR1020170122090A
Other languages
English (en)
Other versions
KR20190033381A (ko
Inventor
최한뇽
Original Assignee
최한뇽
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 최한뇽 filed Critical 최한뇽
Priority to KR1020170122090A priority Critical patent/KR101975111B1/ko
Publication of KR20190033381A publication Critical patent/KR20190033381A/ko
Application granted granted Critical
Publication of KR101975111B1 publication Critical patent/KR101975111B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 인터넷 웹페이지 상에 다양하게 게시되어 있는 대용량의 문서들에 접근하여, 사용자의 간단한 조작으로 대용량의 문서들을 PDF, html, xml, SVG, 이미지 등의 파일로 변환할 수 있도록 하는, 대용량 웹페이지 문서 변환 시스템 및 그 방법에 관한 것이다.
본 발명에 따른 웹페이지 문서 변환 시스템은, 다수의 웹페이지 문서를 보유한 웹서버로부터 웹페이지 문서를 가져와 다른 형태의 문서로 변환하여 보관하는 웹페이지 문서 변환 시스템으로서, 상기 웹페이지 문서의 웹 주소, 아이디(ID), 문서 제목, 문서 종류를 포함하는 문서 정보에 근거해 변환 메타데이터를 생성하고, 생성된 변환 메타데이터에 근거해 상기 웹서버에 접속해 다수 개의 웹페이지 문서를 다른 형태의 문서들로 변환하는 변환 장치를 포함할 수 있다.
본 발명에 의하면, 대용량의 웹 문서를 주기적으로 저장하여 보관할 수 있고, 시스템 교체에 따라 신규 시스템으로 이관하여 보관할 수 있으며, 기관이나 단체에 파일 리포트로 제출할 수 있다.

Description

대용량 웹페이지 문서 변환 시스템 및 그 방법{Mass webpage document transforming method, and system thereof}
본 발명은 대용량 웹페이지 문서 변환 시스템 및 그 방법에 관한 것으로서, 더욱 자세하게는 인터넷 웹페이지 상에 다양하게 게시되어 있는 대용량의 웹페이지 문서들에 접근하여, 사용자의 간단한 조작으로 대용량의 문서들을 PDF, html, xml, SVG, 이미지 등의 파일로 변환함으로써, 대용량의 웹 문서를 주기적으로 저장하여 보관할 수 있고, 시스템 교체에 따라 신규 시스템으로 이관하여 보관할 수 있으며, 기관이나 단체에 파일 리포트로 제출할 수 있도록 하는, 대용량 웹페이지 문서 변환 시스템 및 그 방법에 관한 것이다.
일반적으로 웹페이지 상에 게시된 대차대조표나 회계 보고서 등의 웹페이지 문서들을 기관에 제출하거나 또는 보관을 하려고 하는 경우에 대부분 PDF 파일로 변환하게 된다.
또한, 웹페이지 상에 게시된 문서들을 다른 시스템으로 이관하려고 하는 경우에도 이미지 파일이나 PDF 파일로 변환하게 된다.
이때, 웹페이지 상에 게시된 문서들이 10 페이지 이내의 작은 분량인 경우에는 사용자(작업자)가 각 페이지의 문서를 일일이 하나씩 PDF 파일로 변환하는 작업을 수행한다.
그러나, 웹페이지 문서가 수 천 페이지나 수 만 페이지 정도로 대량인 경우에는 사용자(작업자)가 각 페이지의 문서를 일일이 하나씩 PDF 파일로 변환하려면 엄청난 시간과 비용이 소요되는 문제점이 있었다.
한국 공개특허공보 제2002-0023545호(공개일 : 2002년03월29일)
전술한 문제점을 해결하기 위한 본 발명의 목적은, 인터넷 웹페이지 상에 다양하게 게시되어 있는 대용량의 문서들에 접근하여, 사용자의 간단한 조작으로 대용량의 문서들을 PDF, html, xml, SVG, 이미지 등의 파일로 변환함으로써, 대용량의 웹 문서를 주기적으로 저장하여 보관할 수 있고, 시스템 교체에 따라 신규 시스템으로 이관하여 보관할 수 있으며, 기관이나 단체에 파일 리포트로 제출할 수 있도록 하는, 대용량 웹페이지 문서 변환 시스템 및 그 방법을 제공함에 있다.
전술한 목적을 달성하기 위한 본 발명의 실시 예에 따른 웹페이지 문서 변환 시스템은, 다수의 웹페이지 문서를 보유한 웹서버로부터 웹페이지 문서를 가져와 다른 형태의 문서로 변환하여 보관하는 웹페이지 문서 변환 시스템으로서, 상기 웹페이지 문서의 웹 주소, 아이디(ID), 문서 제목, 문서 종류를 포함하는 문서 정보에 근거해 변환 메타데이터를 생성하고, 생성된 변환 메타데이터에 근거해 상기 웹서버에 접속해 다수 개의 웹페이지 문서를 다른 형태의 문서들로 변환하는 변환 장치를 포함할 수 있다.
여기서, 상기 변환 장치는, 상기 웹페이지 문서에 접속하기 위한 접속부; 상기 웹페이지 문서로부터 변환 대상을 추출하는 변환대상 추출부; 상기 웹페이지 문서에 대한 정보에 근거해 변환 메타데이터를 생성하는 제어부; 상기 생성된 변환 메타데이터에 근거해 상기 다수 개의 웹페이지 문서를 다른 형태로 문서들로 변환하여 변환문서를 생성하는 변환문서 생성부; 상기 웹페이지 문서에 대한 정보와, 상기 생성된 변환 메타데이터 및 상기 생성된 변환문서가 저장되는 데이터베이스; 및 상기 생성된 변환문서를 문서보관장치에 전송하거나 상기 데이터베이스에 저장하는 변환문서 처리부를 포함할 수 있다.
또한, 상기 변환 메타데이터의 생성을 위해 사용자로부터 데이터를 입력받고, 입력받은 결과를 화면 상에 표시하기 위한 사용자 인터페이스부를 더 포함할 수 있다.
또한, 상기 제어부는, 상기 데이터베이스로부터 상기 웹페이지 문서에 대한 정보를 가져오고, 상기 사용자 인터페이스부를 통해 사용자로부터 입력받은 데이터에 따라 상기 변환 메타데이터를 생성할 수 있다.
또한, 상기 변환 메타데이터는, 상기 다수 개의 웹페이지 문서에 대한 접속 주소, 문서 아이디(ID), 문서 접근 타입(Type), 접근하는 화면 크기, 상기 변환문서들에 대한 저장 위치, 변환문서 여백, 변환문서 파일명, 변환문서 이관 여부 및 첨부파일 이관 여부를 포함할 수 있다.
또한, 상기 변환 메타데이터를 생성할 때, 상기 제어부는 상기 변환문서 파일명에 대해 상기 다수 개의 웹페이지 문서에서 각 웹페이지 문서의 문서 종류와 문서 제목에 따라 구분되는 각각의 변환문서 파일명을 생성할 수 있다.
또한, 상기 변환문서 파일명은, 상기 웹페이지 문서의 문서 종류와 문서 아이디(ID)를 포함할 수 있다.
또한, 상기 변환 장치는, 상기 다수 개의 웹페이지 문서를 다른 형태의 문서로 변환할 때, 상기 다수 개의 웹페이지 문서에 대한 접근 주소에서 전체 HTML 내용을 수집하는 쓰레드(Thread)와, 해당 영역 HTML 내용을 추출하는 쓰레드와, 첨부파일 유무에 따라 첨부파일 관련 주소를 추출하는 쓰레드와, 변환 문서를 생성하는 쓰레드와, 첨부 파일을 다운로드하는 쓰레드와, 변환 문서와 첨부파일 및 메타데이터를 타시스템으로 이관하는 쓰레드를 이용해 병렬 처리하여, 상기 다수 개의 웹페이지 문서를 다른 형태의 문서로 변환하여 저장하거나 문서보관장치에 전송할 수 있다.
그리고, 상기 변환 장치는, 상기 일정 개수 이상의 웹페이지 문서에 온라인 접근 API(application programming interface)를 이용해 접근하고, 상기 웹페이지 문서에 첨부된 첨부파일을 다운로드 API를 이용해 다운로드하며, 상기 다수 개의 웹페이지 문서에 대한 문서 변환 시간과 결과를 로그(Log)로 기록하며, 상기 변환 메타데이터를 자바 스크립트(Java Script)와 스타일 시트의 표준(CSS:Cascading Style Sheet)으로 변환하며, 상기 변환된 다른 형태의 문서에 워터마크(watermark)와 전자서명을 추가하는 기능을 제공할 수 있다.
한편, 전술한 목적을 달성하기 위한 본 발명의 실시 예에 따른 웹페이지 문서 변환 시스템은, 일정 개수 이상의 웹페이지 문서를 보유한 웹서버; 및 상기 일정 개수 이상의 웹페이지 문서에 대한 정보에 근거해 변환 메타데이터를 생성하고, 생성된 변환 메타데이터에 근거해 상기 일정 개수 이상의 웹페이지 문서를 다른 형태의 문서로 변환하는 변환 프로그램을 포함할 수 있다.
또한, 상기 변환 프로그램을 통해 변환된 다른 형태의 문서들을 저장하여 보관하는 문서보관 장치를 더 포함할 수 있다.
또한, 상기 변환 프로그램은, 상기 웹서버에 설치되거나, 상기 문서보관 장치에 설치될 수 있다.
또한, 상기 변환 프로그램은, 상기 일정 개수 이상의 웹페이지 문서를 다른 형태의 문서로 변환할 때, 상기 일정 개수 이상의 웹페이지 문서에 대한 접근 주소에서 전체 HTML 내용을 수집하는 쓰레드(Thread)와, 해당 변환 대상 영역의 HTML 내용을 추출하는 쓰레드와, 첨부파일 유무에 따라 첨부파일 관련 주소를 추출하는 쓰레드와, 변환 문서를 생성하는 쓰레드와, 첨부 파일을 다운로드하는 쓰레드와, 변환 문서와 첨부파일 및 메타데이터를 타시스템으로 이관하는 쓰레드를 이용해 병렬 처리하여, 상기 일정 개수 이상의 웹페이지를 다른 형태의 문서로 변환하여 저장 또는 상기 문서보관장치에 전송할 수 있다.
그리고, 상기 변환 프로그램은, 상기 일정 개수 이상의 웹페이지 문서에 온라인 접근 API(application programming interface)를 이용해 접근하고, 상기 웹페이지 문서에 첨부된 첨부파일을 다운로드 API를 이용해 다운로드하며, 상기 일정 개수 이상의 웹페이지 문서에 대한 문서 변환 시간과 결과를 로그(Log)로 기록하며, 상기 변환 메타데이터를 자바 스크립트(Java Script)와 스타일 시트의 표준(CSS:Cascading Style Sheet)으로 변환하며, 상기 변환된 다른 형태의 문서에 워터마크(watermark)와 전자서명을 추가하는 기능을 제공할 수 있다.
한편, 전술한 목적을 달성하기 위한 본 발명의 실시 예에 따른 웹페이지 문서 변환 방법은, 다수의 웹페이지 문서를 다른 형태의 문서로 변환하는 변환 장치의 웹페이지 문서 변환 방법으로서, (a) 제어부가 상기 웹페이지 문서의 웹 주소, 아이디(ID), 문서 제목, 문서 종류를 포함하는 문서 정보에 근거해 변환 메타데이터를 생성하는 단계; (b) 접속부가 상기 생성된 변환 메타데이터에 근거해 상기 다수의 웹페이지 문서에 접속하는 단계; (c) 변환대상 추출부가 상기 다수의 웹페이지 문서에 대해, 각 웹페이지 문서 별로 변환 대상을 추출하는 단계; (d) 변환문서 생성부가 상기 변환 메타데이터에 근거해 상기 추출된 변환 대상을 다른 형태의 문서로 변환하여 변환 문서를 생성하는 단계; 및 (e) 변환문서 처리부가 상기 생성된 변환 문서들을 데이터베이스에 저장하거나 또는 문서보관장치에 전송하는 단계를 포함할 수 있다.
또한, 상기 (a) 단계에서 상기 제어부는, 상기 문서 정보가 저장되어 있는 데이터베이스로부터 상기 문서 정보를 가져오고, 사용자 인터페이스부를 통해 사용자로부터 입력받은 데이터와 상기 문서 정보에 따라 상기 변환 메타데이터를 생성할 수 있다.
또한, 상기 변환 메타데이터는, 상기 다수의 웹페이지 문서에 대한 접속 주소, 문서 아이디(ID), 문서 접근 타입(Type), 접근하는 화면 크기, 상기 변환된 다른 형태의 문서들에 대한 저장 위치, 변환문서 파일명, 변환문서 여백, 변환문서 이관 여부 및 첨부파일 이관 여부를 포함할 수 있다.
또한, 상기 (a) 단계에서 상기 제어부는, 상기 변환 메타데이터를 생성할 때, 상기 변환문서 파일명에 대해 상기 다수의 웹페이지 문서에서 각 웹페이지 문서의 문서 종류와 문서 제목에 따라 구분되는 각각의 변환문서 파일명을 생성할 수 있다.
또한, 상기 변환문서 파일명은, 상기 웹페이지 문서의 문서 종류와 문서 아이디(ID)를 포함할 수 있다.
그리고, 상기 (c) 단계는, 상기 다수의 웹페이지 문서에 대한 접근 주소에서 전체 HTML 내용을 수집하는 쓰레드(Thread)와, 해당 변환대상 영역의 HTML 내용을 추출하는 쓰레드와, 첨부파일 유무에 따라 첨부파일 관련 주소를 추출하는 쓰레드와, 변환 문서를 생성하는 쓰레드와, 첨부 파일을 다운로드하는 쓰레드와, 변환 문서와 첨부파일 및 메타데이터를 타시스템으로 이관하는 쓰레드를 이용해 병렬 처리하여, 상기 다수의 웹페이지 문서를 다른 형태의 문서로 변환하여 저장 또는 상기 문서보관장치에 전송할 수 있다.
본 발명의 다른 양상들, 장점들 및 특징들은 다음의 섹션들: 도면의 간단한 설명, 상세한 설명 및 청구범위를 포함하는 전체 출원 명세서에 기재된 내용에 기초하여 보다 명백해질 것이다.
본 발명에 의하면, 인터넷 웹페이지 상에 종류 별로 표시되고 있는 대용량의 문서들에 접근하여, 사용자의 간단한 조작으로 PDF, html, xml, SVG, 이미지 등으로 쉽게 변환할 수 있다.
따라서, 대용량의 웹 문서를 주기적으로 파일로 저장하여 보관할 수 있고, 웹페이지 문서를 시스템 교체 시에도 쉽게 신규 시스템으로 이관하여 보관할 수 있으며, 웹페이지 문서를 다른 기관이나 단체에 파일 리포트로 제출할 수 있다.
또한, 다양한 형태로 문서가 게시된 웹페이지에 접근하여, 문서 변환을 위한 메타데이터를 추출하고, 추출한 메타데이터에 근거해 변환할 본문영역, 첨부파일 등을 고려하여, 해당 영역의 부분적 문서변환이 가능하며, 개인 PC 보관 및 타 시스템으로의 이관을 빠르게 진행할 수 있다.
또한, 레거시(Legacy) 시스템의 웹페이지 및 신규 웹페이지 문서에 대해, 다양한 디바이스에서 변환된 문서로 빠르게 조회할 수 있다.
또한, 웹페이지 문서를 대량으로 보관하고 있는 기존의 레거시(Legacy) 시스템에서도 본 발명에 따른 문서 변환 기능을 적용하여 사용할 수 있다.
또한, 대용량의 문서를 변환을 통해 쉽게 배치할 수 있고, 이 외에 실시간 문서 변환, 주기적 문서 변환을 옵션으로 제공할 수 있다.
또한, 시스템 교체로 인하여 발생하는 웹페이지 문서를 신규 시스템으로 문서 이관 및 보관시에 꼭 필요한 시스템에 적용할 수 있다.
또한, 레거시(Legacy) 시스템에 도입시에 기존 문서의 보관 및 조회의 다양화를 제공할 수 있다.
또한, 시스템 교체 후 실시간의 변환 서비스를 제공하므로 추후 발생될 수 있는 문서 보관 및 기록물 이관 등의 편의를 제공할 수 있다.
또한, 웹페이지를 주기적으로 저장한 후 보관 용도와 리포트 제출 및 인쇄용으로 활용할 수 있다. 예를 들면, 회계전표 및 영수증 같은 html문서는 조회시 다양한 디바이스의 접근시 여러 형태로 제공을 하는 불편함이 있었으나, 본 발명에 따른 변환 시스템의 사용시에는 실시간으로 해당 웹페이지를 이미지 형태 및 PDF 형태 등으로 제공할 수 있다.
그리고, 중요 이메일(E-mail) 본문의 보관과 첨부파일의 보관 및 중요사이트 정보의 보관시에 문서형태로 암호를 설정하여 보관이 가능한 장점이 있다.
도 1a는 본 발명의 실시 예에 따른 웹페이지 문서 변환 시스템의 구성을 개략적으로 나타낸 구성도이다.
도 1b는 본 발명의 실시 예에 따른 웹페이지 문서 변환 시스템에서 변환 장치의 내부 구성을 개략적으로 나타낸 구성도이다.
도 1c는 본 발명의 실시 예에 따른 웹페이지 문서의 한 예를 나타낸 도면이다.
도 2는 본 발명의 실시 예에 따른 변환 장치가 클라이언트용 장치에 적용된 예를 나타낸 도면이고,
도 3은 본 발명의 실시 예에 따른 변환 장치가 클라우드용 장치에 적용된 예를 나타낸 도면이다.
도 4는 본 발명의 다른 실시 예에 따른 웹페이지 문서 변환 시스템을 나타낸 구성도이다.
도 5는 본 발명의 또 다른 실시 예에 따른 웹페이지 문서 변환 시스템을 나타낸 구성도이다.
도 6a 및 도 6b는 본 발명의 실시 예에 따른 변환 장치의 웹페이지 문서 변환 방법을 설명하기 위한 전체 흐름도를 나타낸 도면이다.
도 7은 본 발명의 실시 예에 따른 웹페이지 문서 변환을 위한 환경을 설정하는 예를 나타낸 도면이다.
도 8은 본 발명의 실시 예에 따른 웹페이지 문서 변환을 위한 변환 메타데이터를 나타낸 도면이다.
도 9는 본 발명의 실시 예에 따른 변환 메타데이터를 생성하기 위한 변환 문서 정보를 나타낸 도면이다.
도 10은 본 발명의 실시 예에 따른 웹페이지 문서를 병렬처리 프로세스를 이용하여 변환하는 예를 나타낸 도면이다.
도 11은 본 발명의 실시 예에 따라 변환된 다른 형태의 문서들을 로컬에 저장하거나 다른 시스템으로 전송하여 보관하는 예를 나타낸 도면이다.
도 12는 본 발명의 실시 예에 따라 웹페이지 문서를 다른 형태의 문서로 변환하여 저장하여 보관한 것을 다양한 디바이스에서 동일한 화면으로 제공하는 예를 나타낸 도면이다.
이하, 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다.
본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 동일 또는 유사한 구성요소에 대해서는 동일한 참조 부호를 붙이도록 한다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우 뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
어느 부분이 다른 부분의 "위에" 있다고 언급하는 경우, 이는 바로 다른 부분의 위에 있을 수 있거나 그 사이에 다른 부분이 수반될 수 있다. 대조적으로 어느 부분이 다른 부분의 "바로 위에" 있다고 언급하는 경우, 그 사이에 다른 부분이 수반되지 않는다.
제1, 제2 및 제3 등의 용어들은 다양한 부분, 성분, 영역, 층 및/또는 섹션들을 설명하기 위해 사용되나 이들에 한정되지 않는다. 이들 용어들은 어느 부분, 성분, 영역, 층 또는 섹션을 다른 부분, 성분, 영역, 층 또는 섹션과 구별하기 위해서만 사용된다. 따라서, 이하에서 서술하는 제1 부분, 성분, 영역, 층 또는 섹션은 본 발명의 범위를 벗어나지 않는 범위 내에서 제2 부분, 성분, 영역, 층 또는 섹션으로 언급될 수 있다.
여기서 사용되는 전문 용어는 단지 특정 실시예를 언급하기 위한 것이며, 본 발명을 한정하는 것을 의도하지 않는다. 여기서 사용되는 단수 형태들은 문구들이 이와 명백히 반대의 의미를 나타내지 않는 한 복수 형태들도 포함한다. 명세서에서 사용되는 "포함하는"의 의미는 특정 특성, 영역, 정수, 단계, 동작, 요소 및/또는 성분을 구체화하며, 다른 특성, 영역, 정수, 단계, 동작, 요소 및/또는 성분의 존재나 부가를 제외시키는 것은 아니다.
"아래", "위" 등의 상대적인 공간을 나타내는 용어는 도면에서 도시된 한 부분의 다른 부분에 대한 관계를 보다 쉽게 설명하기 위해 사용될 수 있다. 이러한 용어들은 도면에서 의도한 의미와 함께 사용 중인 장치의 다른 의미나 동작을 포함하도록 의도된다. 예를 들면, 도면 중의 장치를 뒤집으면, 다른 부분들의 "아래"에 있는 것으로 설명된 어느 부분들은 다른 부분들의 "위"에 있는 것으로 설명된다. 따라서 "아래"라는 예시적인 용어는 위와 아래 방향을 전부 포함한다. 장치는 90˚ 회전 또는 다른 각도로 회전할 수 있고, 상대적인 공간을 나타내는 용어도 이에 따라서 해석된다.
다르게 정의하지는 않았지만, 여기에 사용되는 기술용어 및 과학용어를 포함하는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 일반적으로 이해하는 의미와 동일한 의미를 가진다. 보통 사용되는 사전에 정의된 용어들은 관련 기술문헌과 현재 개시된 내용에 부합하는 의미를 가지는 것으로 추가 해석되고, 정의되지 않는 한 이상적이거나 매우 공식적인 의미로 해석되지 않는다.
이하, 첨부한 도면을 참조하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다.
도 1a는 본 발명의 실시 예에 따른 웹페이지 문서 변환 시스템의 구성을 개략적으로 나타낸 구성도이다.
도 1a를 참조하면, 본 발명의 실시 예에 따른 웹페이지 문서 변환 시스템(100)은, 웹 서버(110), 변환 장치(120) 및 문서보관 장치(130)를 포함할 수 있다.
웹 서버(110)는 문서 형태의 웹페이지를 예를 들면, 1,000개 이상 또는 10,000개 이상 등 일정 개수 이상으로 보유한 장치이다. 여기서, 웹페이지는 HTML이나 XML 형태로 구현할 수 있으며, 이 외에 다른 문서 형태로도 가능하다.
웹 서버(110)는 도 1a에 도시된 바와 같이 예를 들면, 레거시 시스템(Legacy System)으로 구현할 수 있다. 여기서, 레거시 시스템은 컴퓨터 분야에서 개방형 표준을 준수하는 소프트웨어 및 이를 사용하는 오픈 시스템(Open System)에 대한 반대 개념으로서의 메인 프레임이나 일괄 처리 응용 프로그램을 의미할 수 있다. 또한, 2000년대로 들어서면서 인터넷 기술이 발전함에 따라 이전의 1990년대에 사용했던 대중적인 클라이언트 서버 소프트웨어 및 시스템을 의미할 수 있다. 즉, 레거시 시스템은 기존에 사용했던 컴퓨터 시스템을 의미할 수 있다.
변환 장치(120)는 웹페이지에 대한 정보에 근거해 변환 메타데이터를 생성하고, 생성된 변환 메타데이터에 근거해 웹 서버(110)에 접속해 일정 개수 이상의 웹페이지 문서를 실시간으로 다른 형태의 문서로 변환할 수 있다.
여기서, 웹페이지 문서에 대한 정보는, 웹페이지 문서의 웹 주소, 아이디(ID), 문서 제목, 문서 종류, 작성자, 작성일자 등을 포함할 수 있다.
또한, 변환 메타데이터는, 다수 개의 웹페이지 문서에 대한 접속 주소, 문서 아이디(ID), 문서 접근 타입(Type), 접근 브라우져(Browser) 크기(W & H)를 포함할 수 있다. 문서 아이디는 접속 주소에 있는 문서가 가지는 식별자이고, 문서 접근 타입은 접속 주소에 있는 문서가 가지는 일정한 형태의 프레임(iframe 등)에 접근하는지, 엑스엠엘 뷰(XML View) 형태에 접근하는지를 나타낸다. 접근 브라우져 크기는 접속 주소에 있는 웹페이지 문서에 접근하여 웹페이지 문서를 표시하는 화면 크기(W:Width/H:Height)를 나타낸다.
또한, 변환 메타데이터는 상기 변환된 다른 형태의 문서들에 대한 저장 위치와, 다른 형태의 문서에 대한 파일명, 변환문서 여백, 문서변환 성공 여부와, 문서변환 오류 시 메시지를 포함할 수 있다. 여기서, 변환문서 여백(margine)은 각 웹페이지 문서마다 그 크기가 다르므로, 최종적으로 변환된 다른 형태의 문서에 대해, 예를 들면, 가로와 세로에 대해 일정 간격, 즉, 가로 방향으로 좌단(L: Left)과 우단(R: Right)에 각각 1 Cm 씩 여백을 가지고, 세로 방향으로 상단(T:Top)과 하단(B:Bottom)에 각각 1.5 Cm 씩 여백을 가지는 프레임을 설정하고, 그 프레임 안에 상기 변환된 다른 형태의 문서가 위치하도록 하는 것이다.
또한, 변환된 다른 형태의 문서가 PDF인 경우에, PDF 파일의 저장 위치(PDF DIR)는 변환된 PDF 파일을 보관되어지는 위치(Directory)를 나타내고, PDF FILE은 변환된 PDF 문서의 파일 이름을 나타낸다.
그리고, 변환 메타데이터는 HTML 문서 위치 변경과, 옵션(Option)과, 변환문서 이관 여부와, 첨부파일 이관 여부를 포함할 수 있다. 여기서, HTML 문서 위치 변경은 웹페이지 문서를 PDF 파일로 변환할 때 원래의 문서 그대로 변환하지 않고, 예를 들면, HTML 문서를 좌측 이동하거나 우측으로 이동한 후 PDF 파일로 변경하는 것을 의미한다. 옵션은 예컨대, 출력 용지(A4 등)에 대한 HTML 스케일링(Scaling)과 적합(Fitting)을 선택하는 것을 의미한다. FW는 Fit Width를 나타내고, FFW는 Force Fit Width를 나타내며, FH는 Fit Height를 나타내며, PM은 Postcard Mode를 나타내며, RPP는 Resize PDF Page를 나타낸다.
변환 장치(120)는 일정 개수 이상으로 다양한 형태의 웹페이지 문서와 그에 대한 정보를 저장하고 있는 데이터베이스(SQL DB)를 포함할 수 있다.
문서보관 장치(130)는 변환된 문서들을 이관할 대상으로서의 신규 시스템을 지칭하며, 변환된 다른 형태의 문서들을 변환 장치(120)로부터 수신하여 시스템 내부의 데이터베이스(DB) 등 저장 장치에 보관할 수 있다.
도 1b는 본 발명의 실시 예에 따른 웹페이지 문서 변환 시스템에서 변환 장치의 내부 구성을 개략적으로 나타낸 구성도이다.
도 1b를 참조하면, 본 발명의 실시 예에 따른 변환 장치(120)는, 접속부(202), 변환대상 추출부(204), 제어부(206), 변환문서 생성부(208), 변환문서 처리부(210), 사용자 인터페이스(User Interface, UI)부(212) 및 데이터베이스(DB)(214)를 포함한다.
접속부(202)는 웹페이지 문서에 접속하기 위한 통신부 등을 의미할 수 있다. 즉, 접속부(202)는 웹페이지 문서가 게시되어 있는 웹페이지 또는 웹 서버(110)의 URL 주소에 접속하기 위한 접속 장치나 통신 수단 등을 의미할 수 있다.
변환대상 추출부(204)는 웹페이지 문서로부터 변환 대상을 추출할 수 있다. 즉, 변환대상 추출부(204)는 예를 들면, 도 1c에 도시된 바와 같이 웹 주소와 주메뉴, 서브 메뉴 및 문서 등으로 구성된 웹페이지 문서에서, 로고나 주메뉴, 서브메뉴 등을 제외한 순수한 문서에 해당하는 회계전표 부분만을 변환 대상으로 추출할 수 있다. 도 1c는 본 발명의 실시 예에 따른 웹페이지 문서의 한 예를 나타낸 도면이다. 이때, 변환대상 추출부(204)는 도 1c에 도시된 웹페이지 문서에서 변환 대상을 추출할 때, 웹페이지 문서에 대해 XML 또는 HTML로 코딩된 문서에서 회계전표 부분에 해당하는 <iframe name=docubody>과 </iframe>, <tr>, <td> 등의 구분자가 있는 부분을 변환 대상으로 추출할 수 있다.
제어부(206)는 웹페이지 문서에 대한 정보에 근거해 변환 메타데이터를 생성할 수 있다. 즉, 제어부(206)는 데이터베이스로부터 웹페이지 문서에 대한 정보를 가져오고, UI부(212)를 통해 사용자로부터 입력받은 데이터에 따라 도 8에 도시된 바와 같은 변환 메타데이터를 생성하는 것이다.
여기서, 웹페이지 문서에 대한 정보는, 웹페이지 문서의 웹 주소, 아이디(ID), 문서 제목, 문서 종류, 작성자, 작성일자 등을 포함할 수 있다. 이때 문서 아이디(ID)는 도 1c에 도시된 바와 같이 웹 주소에 포함된 아이디(id)를 의미할 수 있다.
또한, 변환 메타데이터는, 도 8에 도시된 바와 같이 다수 개의 웹페이지 문서에 대한 접속 주소, 문서 아이디(ID), 문서 접근 타입(Type), 접근하는 화면 크기, 변환문서들에 대한 저장 위치, 변환문서 여백, 변환문서 파일명, 변환문서 이관 여부 및 첨부파일 이관 여부 등을 포함할 수 있다. 이때, 제어부(206)는 변환 메타데이터에서 변환문서 파일명에 대해 다수 개의 웹페이지 문서에서 각 웹페이지 문서의 문서 종류와 문서 제목, 문서 아이디(ID)에 따라 구분되는 각각의 변환문서 파일명으로 생성할 수 있다. 따라서 변환문서 파일명은, 웹페이지 문서의 문서 종류와 문서 아이디(ID)를 포함할 수 있다.
변환문서 생성부(208)는 생성된 변환 메타데이터에 근거해 다수 개의 웹페이지 문서를 각각 다른 형태의 문서들로, 예를 들면, PDF 문서로 변환하여 변환문서를 생성할 수 있다. 여기서, 다른 형태의 문서는 PDF(Portable Document Format) 파일 뿐만 아니라 MS-Word(doc) 파일, 이미지(jpg, tif, gif 등) 파일 등이 될 수 있다.
변환문서 처리부(210)는 생성된 변환문서를 문서보관장치(130)에 전송하거나 데이터베이스(214)에 저장하여 보관한다.
UI부(212)는 변환 메타데이터의 생성을 위해 사용자로부터 데이터를 입력받고, 입력받은 결과를 화면 상에 표시할 수 있다.
DB(214)는 웹페이지 문서에 대한 정보와, 상기 생성된 변환 메타데이터 및 상기 생성된 변환문서가 저장되는 장치이다.
한편, 변환 장치(120)는, 도 1에 도시된 바와 같이 서버용 장치(Server System)가 될 수 있고, 도 2에 도시된 바와 같이 클라이언트(Client)용 장치가 될 수 있으며, 도 3에 도시된 바와 같이 클라우드(Cloud)용 장치가 될 수 있다. 도 2는 본 발명의 실시 예에 따른 변환 장치가 클라이언트용 장치에 적용된 예를 나타낸 도면이고, 도 3은 본 발명의 실시 예에 따른 변환 장치가 클라우드용 장치에 적용된 예를 나타낸 도면이다.
도 2에 도시된 바와 같이, 변환 장치가 클라이언트용 장치에 적용된 경우에, 클라이언트용 장치는 PC(Personal Computer)용 변환 장치(210)와 개인 보관용 변환 장치(220)를 포함할 수 있다.
이때, PC용 변환 장치(210)와 개인 보관용 변환 장치(220)에는 본 발명의 실시 예에 따른 변환 프로그램이 설치될 수 있다. 여기서, 변환 프로그램은 각각 일정 개수 이상의 웹페이지 문서에 대한 정보에 근거해 변환 메타데이터를 생성하고, 생성된 변환 메타데이터에 근거해 일정 개수 이상의 웹페이지 문서를 다른 형태의 문서로 변환하는 기능을 실현하는 것이다.
또한, 변환 프로그램은 CD나 DVD 등의 기록 매체에 기록된 상태에서 사용자의 설치 동작에 따라 PC용 변환 장치(210)와 개인 보관용 변환 장치(220)에 각각 설치될 수 있다.
따라서, PC용 변환 장치(210)는 변환 프로그램의 실행에 따라 웹서버(110)에 접속해 일정 개수 이상의 웹페이지 문서를 가져와 변환 메타데이터에 근거해 변환하고, 변환된 최종 문서와 첨부 파일을 신규 시스템에 해당하는 문서보관 장치(130)로 전송하여 이관한다.
이에 반하여, 개인 보관용 변환 장치(220)는 변환 프로그램의 실행에 따라 웹서버(110)에 접속하여 일정 개수 이상의 웹페이지 문서를 가져와 변환 메타데이터에 근거해 PDF 등의 파일 형태로 변환한 후, 변환된 최종 문서와 첨부 파일을 내부 저장소에 저장하여 보관하는 것이다.
그리고, 본 발명에 따른 변환 장치는 도 3에 도시된 바와 같이, 클라우드(Cloud)용 시스템(310)으로 구현할 수 있다.
클라우드 서비스는 인터넷 상에 자료를 저장해 두고, 사용자가 필요한 자료나 프로그램을 자신의 컴퓨터에 설치하지 않고도 인터넷 접속을 통해 언제 어디서나 이용할 수 있는 서비스를 말한다. 클라우드 서비스를 통해 인터넷 상에 저장된 자료들은 간단한 조작 및 클릭으로 쉽게 공유하고 전달할 수 있다. 인터넷 상의 서버에 단순히 자료를 저장하는 것뿐만 아니라, 따로 프로그램을 설치하지 않아도 웹에서 제공하는 응용 프로그램의 기능을 이용하여 원하는 작업을 수행할 수 있으며, 여러 사람이 동시에 문서를 공유하면서 작업을 진행할 수도 있다.
클라우드용 시스템(310)은 전술한 바와 같은 변환 프로그램을 클라우드 서버에 설치해 두고, 사용자가 개인용 컴퓨터를 이용해 클라우드 서버에 접속해 변환 프로그램을 실행할 수 있도록 하는 것이다.
따라서, 사용자의 개인용 컴퓨터는 클라우드용 시스템(310)에 접속해 변환 프로그램을 실행하여 웹서버(110)에 게시되어 있는 웹페이지 문서들을 변환하여 클라우드용 시스템(310)의 사용자에 대해 할당된 저장 공간에 저장하거나, 신규 웹서버에 해당하는 문서보관 장치(130)에 전송하여 보관할 수 있게 되는 것이다.
즉, 클라우드용 시스템(310)은 웹서버(110)에 접속해 일정 개수 이상의 웹페이지 문서를 가져와 변환 메타데이터에 근거해 변환하고, 변환된 최종 문서와 첨부 파일을 신규 시스템에 해당하는 문서보관 장치(130)로 전송하여 이관하는 것이다.
여기서, 문서보관 장치(130)는, 변환된 다른 형태의 문서들을 저장해 보관하는 장치로서, 서버(Server)용 장치, 클라이언트(PC)용 장치, 클라우드(Cloud)용 장치 중 하나로 구현할 수 있다.
그리고, 변환 프로그램을 통해 변환된 다른 형태의 문서들은, PDF(Portable Document Format), XML(eXtensible Markup Language), DOC(microsoft word), 이미지(Image), SVG 중 하나일 수 있다.
도 4는 본 발명의 다른 실시 예에 따른 웹페이지 문서 변환 시스템을 나타낸 구성도이다.
도 4를 참조하면, 본 발명의 다른 실시 예에 따른 웹페이지 문서 변환 시스템(400)은, 일정 개수 이상의 웹페이지 문서를 보유하고, 이러한 일정 개수 이상의 웹페이지 문서를 다른 형태의 문서로 변환할 변환 프로그램이 설치된 웹서버(410)와, 웹서버(410)로부터 변환 프로그램을 통해 변환된 다른 형태의 문서들을 수신하여 보관하는 문서보관 장치(130)를 포함할 수 있다.
여기서, 변환 프로그램은 웹서버(410)에 설치되고, 일정 개수 이상의 웹페이지 문서에 대한 정보에 근거해 변환 메타데이터를 생성하고, 생성된 변환 메타데이터에 근거해 일정 개수 이상의 웹페이지 문서를 다른 형태의 문서로 변환하는 기능을 실행한다.
즉, 본 발명의 다른 실시 예에 따른 웹페이지 문서 변환 시스템(400)은, 웹페이지 문서들을 보유하고 있는 웹서버(410)의 내부에 변환 프로그램이 설치되고, 웹서버(410)가 변환 프로그램을 통해 일정 개수 이상의 웹페이지 문서들을 다른 형태의 문서로 변환하는 변환 장치의 기능을 실행하는 것이다.
이때, 웹서버(410)는 일정 개수 이상으로 다양한 형태의 웹페이지 문서와 그에 대한 정보를 저장하고 있는 데이터베이스(SQL DB)(420)를 포함할 수 있다.
문서보관 장치(130)는 변환된 다른 형태의 문서들을 저장해 보관하는 장치로서, 서버(Server)용 장치, 클라이언트(PC)용 장치, 클라우드(Cloud)용 장치 중 하나일 수 있다.
따라서, 웹서버(410)는 사용자 또는 관리자에 의해 변환 프로그램이 실행되면, DB(420)에 저장된 각 웹페이지에 대한 정보에 근거해 변환 메타데이터를 생성하고, 생성된 변환 메타데이터에 근거해 DB(420)로부터 웹페이지 문서들을 가져와 PDF 파일 등 다른 형태의 문서로 변환해 문서보관 장치(130)로 전송해 주는 것이다.
예를 들면, 웹서버(410)는 웹페이지 문서들이 디스플레이되도록 제어하는 마이크로프로세서와, 이 마이크로프로세서가 처리하는 데이터들을 임시적으로 저장하는 메모리 및 변환 프로그램이 저장된 프로그램 저장부를 포함할 수 있다.
여기에 사용자로부터 변환 프로그램의 실행 명령을 입력받는 입력부와, 변환 프로그램의 실행 결과를 화면이나 음성 등으로 출력하는 출력부를 더 포함할 수 있다.
마이크로 프로세서는 변환 프로그램의 실행 명령이 입력되면, 프로그램 저장부에 저장되어 있는 변환 프로그램을 실행한다.
변환 프로그램은 DB(420)에 저장된 각 웹페이지에 대한 정보에 근거해 도 8에 도시된 변환 메타데이터를 생성하여 메모리에 임시로 저장한다. 변환 프로그램은 생성된 변환 메타데이터에 근거해 DB(420)로부터 변환 대상에 해당하는 일정 개수 이상의 웹페이지 문서들을 순차적으로 또는 일정 단위씩 가져와 메모리에 저장한다. 변환 프로그램은 메모리에 임시로 저장된 웹페이지 문서들을 도 10에 도시된 바와 같은 다수의 쓰레드(Thread)를 이용해 병렬적으로 분업하여 PDF 파일 등 다른 형태의 문서로 변환한다. 그리고, 변환 프로그램은 PDF 등으로 변환된 다른 형태의 문서들을 문서보관 장치(130)로 전송해 주는 것이다.
도 5는 본 발명의 또 다른 실시 예에 따른 웹페이지 문서 변환 시스템을 나타낸 구성도이다.
도 5를 참조하면, 본 발명의 또 다른 실시 예에 따른 웹페이지 문서 변환 시스템(500)은, 일정 개수 이상의 웹페이지 문서를 보유하는 웹서버(110)와, 변환 프로그램에 따라 변환 메타데이터를 생성하고 이에 근거해 웹서버(110)로부터 웹페이지 문서들을 가져와 변환 및 보관하는 신규 웹서버(510)를 포함할 수 있다.
여기서, 변환 프로그램은 일정 개수 이상의 웹페이지 문서에 대한 정보에 근거해 변환 메타데이터를 생성하고, 생성된 변환 메타데이터에 근거해 일정 개수 이상의 웹페이지 문서를 다른 형태의 문서로 변환하는 기능을 실행한다.
신규 웹서버(510)는 웹서버(110)로부터 웹페이지 문서들을 이관하여 저장 및 보관하는 장치로서, 이러한 변환 프로그램이 설치된 것이다.
따라서, 신규 웹서버(510)는 변환 프로그램을 실행하여, 각 웹페이지 문서에 대한 정보에 근거해 변환 메타데이터를 생성하고, 생성된 변환 메타데이터에 근거해 웹서버(110)로부터 일정 개수 이상의 웹페이지 문서들을 가져와 PDF 파일로 변환하는 변환 장치의 기능을 실행하는 것이다.
이때, 신규 웹서버(510)는 내부에 데이터베이스(DB)를 구비할 수 있고, 변환된 다른 형태의 문서들을 데이터베이스(DB)에 저장하여 보관할 수 있다.
한편, 도 1 내지 도 5를 참조하면, 변환 장치(110, 210, 220, 310, 410, 510)는 변환 프로그램이 설치된 서버용 장치, 클라이언트용 장치, 클라우드용 장치, 웹서버, 신규 웹서버 등이 될 수 있다.
변환 장치(110, 210, 220, 310, 410, 510)는 변환 프로그램을 실행하면, 유저 인터페이스(User Interface)를 통해 일정 개수 이상의 웹페이지 문서를 변환하기 위한 환경을 설정하고, 로그인 정보를 이용해 웹 서버에 접속할 수 있다.
또한, 변환 장치(110, 210, 220, 310, 410, 510)는 데이터베이스(DB) 접근 방식 또는 웹페이지 접근 로봇 방식에 따라 변환문서 타입과 형태를 지정해 변환 메타데이터를 생성할 수 있다.
여기서, 데이터베이스(DB) 접근 방식은, 웹서버에서 일정 개수 이상의 웹페이지 문서에 대한 정보를 저장하고 있는 데이터베이스(DB)의 테이블(Tabel) 및 웹페이지 뷰(View)에 접근해 변환문서 타입과 형태를 지정하는 방식이다.
또한, 웹페이지 접근 로봇 방식은, 일정 개수 이상의 웹페이지 문서에 대한 HTML, XML, DOM에 접근하여 해당 웹페이지 문서를 파서(Parser)하거나, 웹페이지 뷰(View), DOM에 접근해 유저 인터페이스(User Interface)를 통해 문서선택 영역을 지정해 객체를 자동 분류하는 방식이다. 여기서, DOM은 문서 객체 모델(document object model)로서, 그래픽, 텍스트, 헤드라인, 스타일 등 웹의 모든 요소가 자바 스크립트(Java Script)나 스크립트 언어에 의해 조정될 수 있도록 해주며, CSS, HTML, 스크립트 언어와 함께 DHTML을 구성하는 핵심 기술이라 할 수 있다.
또한, 변환 장치(110, 210, 220, 310, 410, 510)는, 일정 개수 이상의 웹페이지 문서를 실시간으로 다른 형태의 문서로 변환할 때, 일정 개수 이상의 웹페이지 문서에 대한 접근 주소에서 전체 HTML 내용을 수집하는 쓰레드(Thread)와, 해당 영역 HTML 내용을 추출하는 쓰레드(Thread)와, 첨부파일 유무에 따라 첨부 관련 주소를 추출하는 쓰레드(Thread)와, 변환 문서를 생성하는 쓰레드(Thread)와, 첨부 파일을 다운로드하는 쓰레드(Thread)와, 변환 문서와 첨부파일 및 메타데이터를 타시스템으로 이관하는 쓰레드(Thread)를 이용해 병렬 처리하여, 일정 개수 이상의 웹페이지 문서를 실시간으로 다른 형태의 문서로 변환할 수 있다.
또한, 변환 장치(110, 210, 220, 310, 410, 510)는, 온라인 접근 API(application programming interface)를 이용해 웹 서버에 접속하거나, 일정 개수 이상의 웹페이지에 접속할 수 있으며, 다운로드 API를 이용해 웹페이지에 첨부된 첨부파일을 다운로드할 수 있다.
또한, 변환 장치(110, 210, 220, 310, 410, 510)는 일정 개수 이상의 웹페이지 문서에 대한 문서 변환 시간과 결과를 로그(Log)로 기록하며, 변환 메타데이터를 자바 스크립트(Java Script)와 스타일 시트의 표준(CSS:Cascading Style Sheet)으로 변환할 수 있으며, 변환된 다른 형태의 문서에 워터마크(watermark)와 전자서명을 추가할 수 있는 기능을 제공할 수 있다.
그리고, 변환 장치(110, 210, 220, 310, 410, 510)는, 변환된 다른 형태의 문서들을 첨부파일과 함께 분류하여 로컬(Local) 내에 분류별로 저장하거나 다른 장치로 전송해 줄 수 있다.
도 6a 및 도 6b는 본 발명의 실시 예에 따른 변환 장치의 웹페이지 문서 변환 방법을 설명하기 위한 전체 흐름도를 나타낸 도면이다.
도 6a와 도 6b 내지 도 12를 참조하면, 본 발명의 실시 예에 따른 변환 장치(120)는, 일정 개수 이상의 웹페이지에 대한 정보에 근거해 변환 메타데이터를 생성한다(S610).
즉, 제어부(206)는 웹페이지 문서의 웹 주소, 아이디(ID), 문서 제목, 문서 종류를 포함하는 문서 정보가 저장되어 있는 데이터베이스(214)로부터 문서 정보를 가져오고, UI부(212)를 통해 사용자로부터 입력받은 데이터와 문서 정보에 따라 도 8에 도시된 바와 같은 변환 메타데이터를 생성할 수 있다(S610).
이때, 변환 장치(120)는 변환 프로그램이 실행되면, 사용자 또는 관리자로부터 UI부(212)를 통해 데이터를 입력받아 웹페이지 변환을 위한 환경을 설정하고, 로그인 정보를 이용해 웹서버(110)에 접속한다. 웹페이지 접근은 공개된 페이지 및 비공개 페이지 모두 해당이 된다. 비공개 페이지는 로그인 정보를 통해 해당 페이지 접근이 가능하다.
여기서, 변환 장치(120)는 도 7에 도시된 바와 같이, 로그인 여부와, 해당 서버 접속, 메타데이터 추출 및 정의, 변환문서 타입 및 형태 지정 등을 통해 웹페이지 변환을 위한 환경을 설정하는 것이다. 도 7은 본 발명의 실시 예에 따른 웹페이지 문서 변환을 위한 환경을 설정하는 예를 나타낸 도면이다. 도 7에 도시된 바와 같이, 변환문서 타입 및 형태 지정은, SQL DB 접근 방식으로 테이블(Table) 접근 및 뷰(View) 접근을 포함할 수 있다.
또한, 변환문서 타입 및 형태 지정은, 웹페이지 접근 로봇 방식으로서, Html과 XML, DOM 접근 및 파서(Parser)를 실행하는 방식과, 웹페이지 뷰(View) 접근/DOM 접근 유저 인터페이스(UI)를 제공하는 방식 및 문서 선택 영역을 지정하는 자동 객체 분류 방식을 포함할 수 있다.
즉, 변환 장치(120)는 데이터베이스(DB) 접근 방식 또는 웹페이지 접근 로봇 방식에 따라 변환문서 타입과 형태를 지정해 변환 메타데이터를 생성할 수 있다.
이때, 데이터베이스(DB) 접근 방식은, 웹 서버(110)에서 일정 개수 이상의 웹페이지에 대한 정보를 저장하고 있는 데이터베이스(DB)의 테이블(Tabel) 및 뷰(View)에 접근해 변환문서 타입과 형태를 지정하는 것이다.
또한, 웹페이지 접근 로봇 방식은, 일정 개수 이상의 웹페이지에 대한 HTML, XML,DOM에 접근하여 파서(Parser)하거나, 웹페이지 뷰(View), DOM에 접근해 유저 인터페이스(User Interface)를 통해 문서선택 영역을 지정해 객체를 자동 분류하는 것이다. 즉, 자동 로봇과 같이 일정 개수 이상의 웹페이지에 접속하여 파싱(Parsing)하거나, UI를 통해 지정된 선택에 따라 자동으로 분류하는 의미에서 웹페이지 접근 로봇 방식이라 칭한 것이다.
한편, 변환 장치(120)는 사용자 또는 관리자로부터 UI부(212)를 통해 웹페이지 문서 변환을 위한 데이터를 입력받고, 입력받은 데이터와 문서 정보에 근거해 도 8에 도시된 바와 같은 변환 메타데이터를 생성한다. 도 8은 본 발명의 실시 예에 따른 웹페이지 문서 변환을 위한 변환 메타데이터를 나타낸 도면이다.
이때, 변환 메타데이터는, 도 8에 도시된 바와 같이, 일정 개수 이상의 웹페이지 문서에 대한 접속 주소(url), 문서 아이디(ID), 문서 접근 타입(Type), 접근 브라우져 크기 지정과, 변환된 다른 형태의 문서들에 대한 저장 위치, 파일명, 변환문서 여백 지정과, 문서변환 성공 여부와, 문서변환 오류 시 메시지와, HTML 문서 위치 변경과, 옵션(Option)과, 첨부파일 이관 여부와, 이관 여부를 포함할 수 있다.
여기서, 제어부(206)는 변환 메타데이터에서 문서 종류(TYPE)와 년도구분, 양식명, URL 주소, 문서 아이디(ID)는 데이터베이스(214)로부터 가져 온 웹페이지 문서에 대한 URL 주소와, 문서 아이디(ID), 문서 제목, 문서 종류, 작성자, 작성일자 등 문서 정보에 따라 생성한 것이다.
또한, 제어부(206)는 변환 메타데이터에서 문서 접근 타입(Type)을 사용자로부터 UI부(212)를 통해 입력받은 <iframe>, <xml view> 등의 구분자에 따라 생성할 수 있다. 즉, 도 1c에 도시된 웹페이지 문서에 대한 HTML 문서에서 변환 대상에 해당하는 <iframe>, </iframe> 등이 있는 부분이나, <xml view> 등의 구분자가 있는 부분 등 변환 영역에 대한 키 값을 문서 접근 타입으로 생성하는 것이다.
또한, 도 8의 변환 메타데이터에서, PDF DIR은 사용자로부터 UI부(212)를 통해 입력받은 데이터에 근거해 생성된 것으로서, 문서가 변환되어 보관되어지는 위치를 정의하며, 타서버로 보관 시 FTP 접근 혹은 POST 방식으로 접근하는 해당 접근 URL 주소가 될 수 있다.
또한, 도 8의 변환 메타데이터에서, PDF FILE은 변환된 문서의 파일 이름을 정의하는 것으로서, PFD 및 html 등 확장자에 따라 달라질 수 있다. 즉, 제어부(206)는 변환문서 파일명에 대해 다수의 웹페이지 문서에서 각 웹페이지 문서의 문서 종류와 문서 제목에 따라 구분되는 변환문서 파일명을 자동으로 생성할 수 있다.
또한, 도 8의 변환 메타데이터에서, 성공 여부는 웹페이지 문서를 PDF 문서로 변환했을 때 문서 변환의 성공 여부를 나타내고, 비고는 문서 변환의 오류 시에 오류 메시지를 나타낸다.
또한, 도 8의 변환 메타데이터에서, Browser(W&H)는 웹페이지 문서에 접근하는 화면 크기로서의 접근 브라우져 크기를 지정하며, margin(L&R&T&B)은 변환 문서의 여백을 지정한다. 즉, 다수 개의 웹페이지 문서가 문서 종류에 따라 각각 그 크기가 다르므로, 최종적으로 출력되는 문서의 양식에 좌측(Left)과 우측(Right), 상측(Top), 하측(Bottom)에 각각 여백을 둔 프레임 내에 변환 문서가 출력되도록 하는 것이다.
또한, 도 8의 변환 메타데이터에서, Html(L&T&W&H)은 변환 문서에 대해 좌측(L), 상측(T), 폭(Width), 높이(Height) 등으로 변경하도록 HTML 문서의 위치 변경을 설정하는 것이고, Option(FW&FFW&FH&PM&RPP)은 변환 문서의 크기 옵션을 설정하는 것이다. 예컨대, 옵션은 출력 용지(A4 등)에 대한 HTML 스케일링(Scaling)과 적합(Fitting)의 선택을 설정하는 것이다. FW는 Fit Width를 나타내고, FFW는 Force Fit Width를 나타내며, FH는 Fit Height를 나타내며, PM은 Postcard Mode를 나타내며, RPP는 Resize PDF Page를 나타낸다.
또한, 도 8의 변환 메타데이터에서, 첨부 이관은 웹페이지 문서에 첨부된 파일의 이관 여부를 나타내며, 이관 여부는 변환 문서의 이관 상태를 나타낸다.
또한, 변환 장치(120)는 도 9에 도시된 바와 같은 변환 문서 정보에 근거해 변환 메타데이터를 추출하거나 변환 메타데이터를 정의할 수 있다. 도 9는 본 발명의 실시 예에 따른 변환 메타데이터를 생성하기 위한 변환 문서 정보를 나타낸 도면이다. 도 9에 도시된 바와 같이, 변환 문서 정보는 문서 아이디, 문서번호, 기안일자, 기안시간, 기안자명, 문서분류, 문서분류코드, 제목, 결재 라인수, 결재 정보, 결재 파일수, 파일 정보 등을 포함한다.
이어, 변환 장치(120)는 생성된 변환 메타데이터에 근거해 웹 서버(110)에 접속한다(S620).
즉, 접속부(202)가 변환 메타데이터에 근거해 웹 서버(110)에 존재하는 다수의 웹페이지 문서에 접속하는 것이다. 이때, 접속부(202)는 도 1c에 도시된 바와 같이, 웹페이지 문서를 보유하고 있는 URL 주소에 접속하거나, 웹페이지 문서에 해당하는 URL 주소(문서 ID가 포함된 주소)에 접속할 수 있다.
또한, 접속부(202)는 온라인 접근 API(application programming interface)를 이용해 웹 서버(110)에 접속하거나, 웹 서버(110)에 게시되어 있는 일정 개수 이상의 웹페이지 문서에 접속할 수 있다. 또한 웹페이지 접근은 url, html, xml, xslt 등으로 접근이 가능하다.
이어, 변환 장치(120)에서 변환대상 추출부(204)는 다수의 웹페이지 문서에 대해 각 웹페이지 문서 별로 변환 대상을 추출한다(S630). 즉, 변환대상 추출부(204)는 도 1c에서 도시된 웹페이지 문서에 대한 HTML 문서에서 <iframe>, </iframe>, <tr>, <td> 등의 구분자가 있는 부분을 변환 대상으로 추출할 수 있다.
이어, 변환 장치(120)에서 변환문서 생성부(208)는 추출한 변환 대상을 변환 메타데이터에 근거해 다른 형태의 문서로 변환해 변환 문서를 생성한다(S640).
즉, 변환문서 생성부(208)는 변환 메타데이터에 근거해 각 웹페이지 문서 별로 예컨대, PDF 형태로 변환하여 변환 문서를 생성하는 것이다.
이때, 변환 장치(120)는 문서 변환에 대해 도 10에 도시된 바와 같이 병렬처리 프로세스를 이용하여 다수 개의 기능으로 나누어 처리할 수 있다. 도 10은 본 발명의 실시 예에 따른 웹페이지 문서를 병렬처리 프로세스를 이용하여 변환하는 예를 나타낸 도면이다. 도 10에 도시된 바와 같이, 예를 들면, 일정 개수 이상의 웹페이지 문서에 대한 접근 주소에서 전체 HTML 내용을 수집하는 쓰레드(Thread) 1과, 전체 HTML 내용에서 해당 변환 대상 영역의 HTML 내용을 추출하는 쓰레드(Thread) 2와, 첨부파일 유무에 따라 첨부 관련 주소를 추출하는 쓰레드(Thread) 3과, 변환 문서를 생성하는 쓰레드(Thread) 4와, 첨부 파일을 다운로드하는 쓰레드(Thread) 5와, 변환 문서와 첨부파일 및 메타데이터를 타시스템으로 이관하는 쓰레드(Thread) 6을 이용해 병렬 처리하여, 일정 개수 이상의 웹페이지 문서를 실시간으로 다른 형태의 문서로 변환할 수 있다.
또한, 변환 장치(120)는 일정 개수 이상의 웹페이지에 파일이 첨부되어 있는 경우에, 다운로드 API를 이용해 해당 웹페이지에 첨부된 파일을 다운로드할 수 있다. 또한, 변환 장치(120)는 웹페이지 문서에 대해 이미지 및 글꼴 등을 포함하여 변환할 수 있다.
또한, 변환 장치(120)는 일정 개수 이상의 웹페이지에 대한 문서 변환 시간과 결과를 로그(Log)로 기록할 수 있으며, 변환 메타데이터를 사용자의 선택에 따라 자바 스크립트(Java Script) 또는 스타일 시트의 표준(CSS:Cascading Style Sheet) 등으로 변환할 수 있다.
그리고, 변환 장치(120)는 변환된 다른 형태의 문서에 워터마크(watermark)와 전자서명을 추가할 수 있는 기능을 제공할 수 있다.
이어, 변환 장치(120)에서 변환문서 처리부(210)는 생성된 변환 문서들을 데이터베이스(214)에 저장하거나 문서보관장치(130)에 전송하여 보관할 수 있다(S650).
즉, 변환 장치(120)는 PDF 등과 같이 변환된 다른 형태의 문서들을 도 11에 도시된 바와 같이 첨부파일과 함께 분류하여 로컬(Local) 내에 분류별로 저장하거나, 다른 형태의 문서들을 첨부파일과 함께 다른 장치(타시스템)로 전송해 줄 수 있다. 도 11은 본 발명의 실시 예에 따라 변환된 다른 형태의 문서들을 로컬에 저장하거나 다른 시스템으로 전송하여 보관하는 예를 나타낸 도면이다. 도 11에서, 변환 장치는 PC급 변환 시스템을 통해 변환된 문서들과 첨부파일을 분류하여 로컬에 저장하거나, FTP를 이용하여 신규 시스템의 웹서버로 전송할 수 있다.
이때, 변환 장치(120)는 변환된 다른 형태의 문서들을 도 10에 도시된 바와 같이 이관 프로세스를 이용하여 첨부파일이나 메타데이터 등과 함께 타시스템에 이관하여 보관할 수 있다.
따라서, 기존 웹서버 시스템에서 웹페이지 문서들을 변환하여 변환 시스템에 저장하여 보관하는 경우에, 도 12에 도시된 바와 같이 사용자들이 컴퓨터 단말기를 이용하여 변환 시스템에 접속함으로써 변환 시스템이 다양한 디바이스에 실시간으로 동일한 화면을 제공할 수 있다(시스템별 활용1). 도 12는 본 발명의 실시 예에 따라 웹페이지 문서를 다른 형태의 문서로 변환하여 저장하여 보관한 것을 다양한 디바이스에서 동일한 화면으로 제공하는 예를 나타낸 도면이다.
또한, 변환 시스템에서 웹페이지 문서를 변환하여 신규 웹서버 시스템에 전송하여 보관하는 경우에도 도 12에 도시된 바와 같이 사용자들이 컴퓨터 단말기를 이용해 신규 웹서버 시스템에 접속함으로써, 신규 웹서버 시스템에서 다양한 디바이스에 실시간으로 동일한 화면을 제공할 수 있다(시스템별 활용2).
그리고, 본 발명의 실시 예에 따른 변환 메타데이터를 데이터베이스(214)에 저장해 둠으로써, 이후에 해당 변환 메타데이터를 통해 각 웹페이지 문서들에 대한 변환 완료 상태를 확인하고, 변환에 에러가 발생된 문서를 확인할 수 있다. 따라서, 변환에 에러가 발생된 문서를 별도로 문서 변환하여 보관할 수 있다.
전술한 바와 같이 본 발명에 의하면, 인터넷 웹페이지 상에 다양하게 게시되어 있는 대용량의 문서들에 접근하여, 사용자의 간단한 조작으로 대용량의 문서들을 PDF, html, xml, SVG, 이미지 등의 파일로 변환함으로써, 대용량의 웹 문서를 주기적으로 저장하여 보관할 수 있고, 시스템 교체에 따라 신규 시스템으로 이관하여 보관할 수 있으며, 기관이나 단체에 파일 리포트로 제출할 수 있도록 하는, 대용량 웹페이지 문서 변환 시스템 및 그 방법을 실현할 수 있다.
본 발명이 속하는 기술 분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있으므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
100, 300, 400, 500 : 웹페이지 문서 변환 시스템
110 : 웹서버
120 : 변환 장치
130 : 문서보관 장치
202 : 접속부
204 : 변환대상 추출부
206 : 제어부
208 : 변환문서 생성부
210 : 변환문서 처리부
212 : UI부
214 : DB
220 : PC용 변환 장치
230 : 개인 보관용 변환 장치
310 : 클라우드용 시스템
410 : 웹서버
510 : 신규 웹서버

Claims (20)

  1. 다수의 웹페이지 문서를 보유한 웹서버로부터 웹페이지 문서를 가져와 다른 형태의 문서로 변환하여 보관하는 웹페이지 문서 변환 시스템으로서,
    상기 웹페이지 문서의 웹 주소, 아이디(ID), 문서 제목, 문서 종류를 포함하는 문서 정보에 근거해 변환 메타데이터를 생성하고, 생성된 변환 메타데이터에 근거해 상기 웹서버에 접속해 다수 개의 웹페이지 문서를 다른 형태의 문서들로 변환하는 변환 장치;
    를 포함하고,
    상기 변환 장치는,
    상기 다수 개의 웹페이지 문서를 다른 형태의 문서로 변환할 때, 상기 다수 개의 웹페이지 문서에 대한 접근 주소에서 전체 HTML 내용을 수집하는 쓰레드(Thread)와, 해당 영역 HTML 내용을 추출하는 쓰레드와, 첨부파일 유무에 따라 첨부파일 관련 주소를 추출하는 쓰레드와, 변환 문서를 생성하는 쓰레드와, 첨부 파일을 다운로드하는 쓰레드와, 변환 문서와 첨부파일 및 메타데이터를 타시스템으로 이관하는 쓰레드를 이용해 병렬 처리하여, 상기 다수 개의 웹페이지 문서를 다른 형태의 문서로 변환하여 저장 또는 문서보관장치에 전송하는, 웹페이지 문서 변환 시스템.
  2. 제 1 항에 있어서,
    상기 변환 장치는,
    상기 웹페이지 문서에 접속하기 위한 접속부;
    상기 웹페이지 문서로부터 변환 대상을 추출하는 변환대상 추출부;
    상기 웹페이지 문서에 대한 정보에 근거해 변환 메타데이터를 생성하는 제어부;
    상기 생성된 변환 메타데이터에 근거해 상기 다수 개의 웹페이지 문서를 다른 형태로 문서들로 변환하여 변환문서를 생성하는 변환문서 생성부; 및
    상기 웹페이지 문서에 대한 정보와, 상기 생성된 변환 메타데이터 및 상기 생성된 변환문서가 저장되는 데이터베이스; 및
    상기 생성된 변환문서를 문서보관장치에 전송하거나 상기 데이터베이스에 저장하는 변환문서 처리부;
    를 포함하는, 웹페이지 문서 변환 시스템.
  3. 제 2 항에 있어서,
    상기 변환 메타데이터의 생성을 위해 사용자로부터 데이터를 입력받고, 입력받은 결과를 화면 상에 표시하기 위한 사용자 인터페이스부;
    를 더 포함하는, 웹페이지 문서 변환 시스템.
  4. 제 3 항에 있어서,
    상기 제어부는, 상기 데이터베이스로부터 상기 웹페이지 문서에 대한 정보를 가져오고, 상기 사용자 인터페이스부를 통해 사용자로부터 입력받은 데이터와 상기 문서 정보에 따라 상기 변환 메타데이터를 생성하는, 웹페이지 문서 변환 시스템.
  5. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
    상기 변환 메타데이터는, 상기 다수 개의 웹페이지 문서에 대한 접속 주소, 문서 아이디(ID), 문서 접근 타입(Type), 접근하는 화면 크기, 상기 변환문서들에 대한 저장 위치, 변환문서 여백, 변환문서 파일명, 변환문서 이관 여부 및 첨부파일 이관 여부를 포함하는, 웹페이지 문서 변환 시스템.
  6. 제 5 항에 있어서,
    상기 변환 메타데이터를 생성할 때, 상기 제어부는 상기 변환문서 파일명에 대해 상기 다수 개의 웹페이지 문서에서 각 웹페이지 문서의 문서 종류와 문서 제목에 따라 구분되는 각각의 변환문서 파일명을 생성하는, 웹페이지 문서 변환 시스템.
  7. 제 5 항에 있어서,
    상기 변환문서 파일명은, 상기 웹페이지 문서의 문서 종류와 문서 아이디(ID)를 포함하는, 웹페이지 문서 변환 시스템.
  8. 삭제
  9. 제 1 항에 있어서,
    상기 변환 장치는,
    상기 일정 개수 이상의 웹페이지 문서에 온라인 접근 API(application programming interface)를 이용해 접근하고, 상기 웹페이지 문서에 첨부된 첨부파일을 다운로드 API를 이용해 다운로드하며,
    상기 다수 개의 웹페이지 문서에 대한 문서 변환 시간과 결과를 로그(Log)로 기록하며,
    상기 변환 메타데이터를 자바 스크립트(Java Script)와 스타일 시트의 표준(CSS:Cascading Style Sheet)으로 변환하며,
    상기 변환된 다른 형태의 문서에 워터마크(watermark)와 전자서명을 추가하는 기능을 제공하는, 웹페이지 문서 변환 시스템.
  10. 일정 개수 이상의 웹페이지 문서를 보유한 웹서버;
    상기 일정 개수 이상의 웹페이지 문서에 대한 정보에 근거해 변환 메타데이터를 생성하고, 생성된 변환 메타데이터에 근거해 상기 일정 개수 이상의 웹페이지 문서를 다른 형태의 문서로 변환하는 변환 프로그램; 및
    상기 변환 프로그램을 통해 변환된 다른 형태의 문서들을 저장하여 보관하는 문서보관장치;
    를 포함하고,
    상기 변환 프로그램은,
    상기 일정 개수 이상의 웹페이지 문서를 다른 형태의 문서로 변환할 때, 상기 일정 개수 이상의 웹페이지 문서에 대한 접근 주소에서 전체 HTML 내용을 수집하는 쓰레드(Thread)와, 해당 변환 대상 영역의 HTML 내용을 추출하는 쓰레드와, 첨부파일 유무에 따라 첨부파일 관련 주소를 추출하는 쓰레드와, 변환 문서를 생성하는 쓰레드와, 첨부 파일을 다운로드하는 쓰레드와, 변환 문서와 첨부파일 및 메타데이터를 타시스템으로 이관하는 쓰레드를 이용해 병렬 처리하여, 상기 일정 개수 이상의 웹페이지를 다른 형태의 문서로 변환하여 저장 또는 상기 문서보관장치에 전송하는, 웹페이지 문서 변환 시스템.
  11. 삭제
  12. 제 10 항에 있어서,
    상기 변환 프로그램은, 상기 웹서버에 설치되거나, 상기 문서보관 장치에 설치된 웹페이지 문서 변환 시스템.
  13. 삭제
  14. 제 10 항에 있어서,
    상기 변환 프로그램은,
    상기 일정 개수 이상의 웹페이지 문서에 온라인 접근 API(application programming interface)를 이용해 접근하고, 상기 웹페이지 문서에 첨부된 첨부파일을 다운로드 API를 이용해 다운로드하며,
    상기 일정 개수 이상의 웹페이지 문서에 대한 문서 변환 시간과 결과를 로그(Log)로 기록하며,
    상기 변환 메타데이터를 자바 스크립트(Java Script)와 스타일 시트의 표준(CSS:Cascading Style Sheet)으로 변환하며,
    상기 변환된 다른 형태의 문서에 워터마크(watermark)와 전자서명을 추가하는 기능을 제공하는, 웹페이지 문서 변환 시스템.
  15. 다수의 웹페이지 문서를 다른 형태의 문서로 변환하는 변환 장치의 웹페이지 문서 변환 방법으로서,
    (a) 제어부가 상기 웹페이지 문서의 웹 주소, 아이디(ID), 문서 제목, 문서 종류를 포함하는 문서 정보에 근거해 변환 메타데이터를 생성하는 단계;
    (b) 접속부가 상기 생성된 변환 메타데이터에 근거해 상기 다수의 웹페이지 문서에 접속하는 단계;
    (c) 변환대상 추출부가 상기 다수의 웹페이지 문서에 대해, 각 웹페이지 문서 별로 변환 대상을 추출하는 단계;
    (d) 변환문서 생성부가 상기 변환 메타데이터에 근거해 상기 추출된 변환 대상을 다른 형태의 문서로 변환하여 변환 문서를 생성하는 단계; 및
    (e) 변환문서 처리부가 상기 생성된 변환 문서들을 데이터베이스에 저장하거나 또는 문서보관장치에 전송하는 단계;
    를 포함하고,
    상기 (c) 단계는, 상기 다수의 웹페이지 문서에 대한 접근 주소에서 전체 HTML 내용을 수집하는 쓰레드(Thread)와, 해당 변환대상 영역의 HTML 내용을 추출하는 쓰레드와, 첨부파일 유무에 따라 첨부파일 관련 주소를 추출하는 쓰레드와, 변환 문서를 생성하는 쓰레드와, 첨부 파일을 다운로드하는 쓰레드와, 변환 문서와 첨부파일 및 메타데이터를 타시스템으로 이관하는 쓰레드를 이용해 병렬 처리하여, 상기 다수의 웹페이지 문서를 다른 형태의 문서로 변환하여 저장 또는 상기 문서보관장치에 전송하는, 웹페이지 문서 변환 방법.
  16. 제 15 항에 있어서,
    상기 (a) 단계에서 상기 제어부는, 상기 문서 정보가 저장되어 있는 데이터베이스로부터 상기 문서 정보를 가져오고, 사용자 인터페이스부를 통해 사용자로부터 입력받은 데이터와 상기 문서 정보에 따라 상기 변환 메타데이터를 생성하는, 웹페이지 문서 변환 방법.
  17. 제 15 항에 있어서,
    상기 변환 메타데이터는, 상기 다수의 웹페이지 문서에 대한 접속 주소, 문서 아이디(ID), 문서 접근 타입(Type), 접근하는 화면 크기, 상기 변환된 다른 형태의 문서들에 대한 저장 위치, 변환문서 파일명, 변환문서 여백, 변환문서 이관 여부 및 첨부파일 이관 여부를 포함하는, 웹페이지 문서 변환 방법.
  18. 제 17 항에 있어서,
    상기 (a) 단계에서 상기 제어부는, 상기 변환 메타데이터를 생성할 때, 상기 변환문서 파일명에 대해 상기 다수의 웹페이지 문서에서 각 웹페이지 문서의 문서 종류와 문서 제목에 따라 구분되는 각각의 변환문서 파일명을 생성하는, 웹페이지 문서 변환 방법.
  19. 제 17 항에 있어서,
    상기 변환문서 파일명은, 상기 웹페이지 문서의 문서 종류와 문서 아이디(ID)를 포함하는, 웹페이지 문서 변환 방법.
  20. 삭제
KR1020170122090A 2017-09-21 2017-09-21 대용량 웹페이지 문서 변환 시스템 및 그 방법 KR101975111B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170122090A KR101975111B1 (ko) 2017-09-21 2017-09-21 대용량 웹페이지 문서 변환 시스템 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170122090A KR101975111B1 (ko) 2017-09-21 2017-09-21 대용량 웹페이지 문서 변환 시스템 및 그 방법

Publications (2)

Publication Number Publication Date
KR20190033381A KR20190033381A (ko) 2019-03-29
KR101975111B1 true KR101975111B1 (ko) 2019-05-03

Family

ID=65898979

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170122090A KR101975111B1 (ko) 2017-09-21 2017-09-21 대용량 웹페이지 문서 변환 시스템 및 그 방법

Country Status (1)

Country Link
KR (1) KR101975111B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102049455B1 (ko) * 2019-05-31 2019-11-27 대한민국 디지털 포렌식 기반의 대용량 전자기록물 이관 시스템 및 방법
KR102634016B1 (ko) * 2022-12-26 2024-02-06 주식회사 아브로소프트코리아 웹기반 디지털 트윈 서비스 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020023545A (ko) 2000-09-22 2002-03-29 정창우 사용자 웹 문서 접근 경향을 고려한 웹 페이지 변환 장치및 방법
KR101115002B1 (ko) * 2010-04-26 2012-03-06 (주)휴먼토크 통합 뷰어 제공 시스템

Also Published As

Publication number Publication date
KR20190033381A (ko) 2019-03-29

Similar Documents

Publication Publication Date Title
US10437907B2 (en) Link expansion service
US10353999B2 (en) Information processing system, server apparatus, control method, and storage medium
US8042036B1 (en) Generation of a URL containing a beginning and an ending point of a selected mark-up language document portion
US7908344B2 (en) Methods, apparatus, and systems for providing local and online data services
EP1672524A2 (en) Systems and methods for converting a formatted document to a web page
EP1624383A2 (en) Adaptive system and process for client/server based document layout
KR101740071B1 (ko) 컴퓨터 네트워크에서 전자 문서의 렌디션을 배치하기 위한 서버 전처리의 이용
US20120050793A1 (en) Network printing system, client terminal, and printing method
AU2001249914A1 (en) Method and apparatus for rendering electronic documents
WO2009026491A1 (en) Method, process, and apparatus for automated document scanning and management system
JP2000222394A (ja) 文書管理装置及びその文書管理方法並びにその制御プログラムを記録した記録媒体
US8706778B2 (en) Methods and systems for an action-based interface for files and other assets
KR20060101803A (ko) 동적 열람이 가능한 전자 문서의 제작 및 열람 방법
WO2011142737A1 (en) Executing transcription requests on files
US20090100023A1 (en) Information processing apparatus and computer readable information recording medium
JP2018037746A (ja) 情報処理システム、情報処理装置、及び情報処理方法
KR101975111B1 (ko) 대용량 웹페이지 문서 변환 시스템 및 그 방법
US7904570B1 (en) Configurable file placement
JP2970521B2 (ja) 文書蓄積装置
JP4553599B2 (ja) データ表示システム、データ出力装置、画像形成装置、データ表示装置およびデータ表示プログラム
JP5267342B2 (ja) マッシュアッププログラム、マッシュアップ装置及びマッシュアップ方法
US10346515B2 (en) Systems and methods for printing electronic documents that contain hyperlinks
US8170270B2 (en) Universal reader
JP2010113730A (ja) 検索サーバ及びコンピュータプログラム
JP2009026013A (ja) コンテンツ登録・提供装置、コンテンツ登録・提供制御方法、および、コンテンツ登録・提供制御プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right