KR101125911B1

KR101125911B1 - 업무 프로세스 분석을 위한 정보 처리 방법 및 장치

Info

Publication number: KR101125911B1
Application number: KR1020097003552A
Authority: KR
Inventors: 아키라 가와무라; 요시히데 노무라; 겐이치 고바야시; 츠요시 가나이; 히로타카 하라
Original assignee: 후지쯔 가부시끼가이샤
Priority date: 2006-09-15
Filing date: 2006-09-15
Publication date: 2012-03-26
Also published as: US8224762B2; EP2063384A1; US20090177610A1; JP4832523B2; EP2063384A4; WO2008032393A1; KR20090033274A; JPWO2008032393A1

Abstract

본 발명은, 현재 사용중인 업무 시스템에 악영향을 미치지 않고, 업무 프로세스 분석을 위한 데이터를 생성하는 것이다. 본 발명에 의하면, 해석 대상 시스템에 의해 생성되고 데이터 저장부에 저장되어 있는 레코드에서의 처리 대상 필드를 특정하는 단계와, 데이터 저장부에 저장되어 있는, 레코드에서의 각 필드의 정의 데이터를 이용하여, 상기 처리 대상 필드가 이벤트의 타임스탬프인 개연성을 나타내는 데이터를 특정하는 개연성 데이터 특정 단계를 포함한다. 업무 시스템에 악영향을 부여하지 않고 이미 존재하는 데이터로부터, 이벤트의 타임스탬프, 즉 이벤트의 발생 일시에 대해서 가능성을 나타내는 데이터(예컨대 정확도나 A, B, C 라고 하는 순위를 둠)를 특정할 수 있게 된다. 즉, 업무 프로세스 분석에 필요한 이벤트에 관한 데이터를 특정할 수 있게 된다.

Description

업무 프로세스 분석을 위한 정보 처리 방법 및 장치{INFORMATION PROCESSING METHOD AND DEVICE FOR WORK PROCESS ANALYSIS}

본 발명은, 업무 프로세스 분석을 위한 데이터 생성 기술에 관한 것이다.

업무 프로세스?리엔지니어링(BPR: Business Process Re-engineering)을 위해 현재 기업에서 운용중인 업무 시스템을 분석해야 한다. 이 때문에, 예컨대 일본 특허 공개 제2005-115494호 공보의 기재와 같은 기술이 이용된다. 이 공보에는, 이하와 같은 사항이 개시되어 있다.

즉, (1) 상이한 업무 시스템에 배치되는 각 애플리케이션의 실행 상태를 나타내는 정보인 이벤트 데이터를, 각 애플리케이션에 따른 방법으로 수집하고, 이벤트 큐에 큐잉한다. 또한, 이 공보에서 이벤트란, 업무 시스템 내에서, 어떤 업무가 실행된 것을 나타내는 것이고, 업무의 시작, 종료 시간, 및 관련 속성을 포함한 데이터이다. 이벤트 데이터는, 각 업무 시스템에 배치된 이벤트 추출 정의에 따라서, 업무 시스템마다의 이벤트 데이터 추출용의 애플리케이션에 의해 추출된다. 각 업무 시스템 내에서, 추출된 이벤트 정보를 공통의 XML(eXtensible Markup Language) 형식으로 변환하여, 이벤트 데이터를 관리하는 이벤트 관리 장치의 이벤트 큐에 큐잉한다. 이 큐잉에는, 예컨대 JMS[Java(등록상표) Message Service] 등이 이용된 다.

(2) 이벤트 관리 장치 내에서, 이벤트 큐 내에 큐잉된 이벤트 정보에 대해서, 업무 데이터별로 정리하고, 업무 데이터간을 관련지어 이벤트 관리 데이터베이스(DB) 내에 축적한다. 이 공보에서, 업무 데이터란, 어느 정리된 단위의 업무 사이에서 공유되는 데이터를 의미한다. (3) 입력된 검색 조건(예컨대 이벤트 발생 기간, 관련 속성 등)에 기초하여, 업무 데이터의 범위를 좁힌다. (4) 범위를 좁힌 업무 데이터에 관련되는 데이터를 트리로 전개하여 표시하고, 임의의 데이터로부터의 처리를 추적한다. (5) 트리로 전개된 업무 데이터에 관련되는 이벤트를 검색하고, 이 이벤트에 관련되는 업무를 트래킹뷰로 도시하여, 현재의 업무 흐름의 실행 상황을 표시한다. 이 공보에서, 트래킹이란, 미리 정의된 업무 시스템 사이를 걸치는 업무 전체의 흐름인 업무 프로세스 중, 어떤 업무가 실행되고, 어떤 업무가 실행되어 있지 않은지를 확인하는 방법을 말한다.

이러한 공보 기재의 기술에서는, 업무 시스템마다 이벤트 데이터 추출용의 애플리케이션을 도입해야 하여, 업무 시스템에 개변을 가하거나 또는 업무 실행에 불필요한 부하를 부여하게 된다.

특허문헌 1: 일본 특허 공개 제2005-115494호 공보

(발명의 개시)

(발명이 해결하고자 하는 과제)

그러나, 업무 시스템에 개변을 가하거나, 업무 실행에 불필요한 부하를 부여하는 것은, 현재 사용중인 업무 시스템에 악영향을 미치기 때문에, 비록 BPR을 위해서라고 해도 피해야 한다.

따라서, 본 발명의 목적은, 현재 사용중인 업무 시스템에 악영향을 미치지 않고, 업무 프로세스 분석을 위한 데이터를 생성하기 위한 기술을 제공하는 것이다.

(과제를 해결하기 위한 수단)

본 발명의 제1 형태에 따른, 업무 프로세스 분석을 위한 정보 처리 방법은, 해석 대상 시스템에 의해 생성되고 데이터 저장부에 저장되어 있는 레코드에서의 처리 대상 필드를 특정하는 단계와, 데이터 저장부에 저장되어 있는, 레코드에서의 각 필드의 정의 데이터를 이용하여, 이 처리 대상 필드가 이벤트의 타임스탬프인 개연성을 나타내는 데이터를 특정하는 개연성 데이터 특정 단계를 포함한다.

업무 시스템에 악영향을 부여하지 않고 이미 존재하는 데이터로부터, 이벤트의 타임스탬프, 즉 이벤트의 발생 일시에 대해서 가능성을 나타내는 데이터(예컨대 정확도나 A, B, C라고 하는 순위를 둠)를 특정할 수 있게 된다. 즉, 업무 프로세스 분석에 필요한 이벤트에 관한 데이터를 특정할 수 있게 된다.

또한, 위에서 진술한 정의 데이터가, 데이터베이스의 스키마 정보인 경우도 있다.

이 경우, 위에서 진술한 개연성 데이터 특정 단계가, 스키마 정보로부터, 처리 대상 필드의 데이터형을 특정하는 단계와, 처리 대상 필드의 데이터형이, 타임스탬프를 나타내는 데이터형인지 판단하는 단계를 포함하도록 하여도 좋다.

또한, 위에서 진술한 정의 데이터가, 필드명을 포함하는 경우도 있다. 그 경우, 위에서 진술한 개연성 데이터 특정 단계가, 처리 대상 필드의 필드명에 포함되는 문자열에 기초하여, 이벤트의 타임스탬프인 개연성을 나타내는 데이터를 특정하는 단계를 포함하도록 하여도 좋다. 정의 데이터는, 스키마 정보인 경우도 있으면, CSV(Comma Separated Values) 데이터의 라벨 데이터여도 좋다. 예컨대 타임스탬프이면 필드명의 말미 등에 특징을 갖기 때문이다.

또한, 위에서 진술한 개연성 데이터 특정 단계가, 처리 대상 필드의 필드값에 기초하여, 이벤트의 타임스탬프인 개연성을 나타내는 데이터를 특정하는 단계를 포함하여도 좋다. 타임스탬프인 필드값의 형식은, 예컨대 YYYY/MM/DD hh:mm:ss라고 하는 특징이 있는 문자열의 형식을 갖기 때문이다.

또한, 처리 대상 필드의 필드명에 포함되는 문자열에 대하여, 시각을 나타내는 문자열, 일을 나타내는 문자열, 장래의 시기를 나타내는 문자열의 순서로써 보다 낮은 상기 개연성을 나타내는 데이터가 특정되도록 하여도 좋다. 장래의 시각을 나타내는 문자열은, 예컨대 납기, 예정이라고 하는 문자열로서, 이벤트의 발생 일시를 특정하는 목적에서는 타임스탬프인 개연성은 낮게 판단되는 것이다.

또한, 위에서 진술한 개연성 데이터 특정 단계가, 데이터 저장부에 저장되어 있는, 레코드에서의 각 필드의 정의 데이터 및 필드값으로부터, 처리 대상 필드의 해당 데이터를 특정하는 단계와, 미리 정해진, 필드명 또는 필드값의 특성과 대응하는 개연성을 나타내는 데이터를 저장하는 스코어표를 참조하여, 처리 대상 필드의 해당 데이터에 대응하는 상기 개연성을 나타내는 데이터를 특정하는 단계를 포함한다. 스코어표에 있어서 상기 개연성을 나타내는 데이터는 구체적인 수치인 경우도 있지만, 소정의 레벨 분류에 따라 레벨을 특정하도록 하여도 좋다.

또한, 본 발명의 제1 형태에서는, 이벤트의 타임스탬프인 개연성을 나타내는 데이터를, 각 필드에 대응시켜 사용자에게 제시하는 단계를 더 포함하도록 하여도 좋다. 이 제시에 의해, 사용자는 어느 필드를 이벤트의 타임스탬프의 필드인지를 최종적으로 특정하도록 하여도 좋다. 이 경우, 이벤트의 타임스탬프인 필드의 필드값을 수집하여, 뒤의 처리에 이용하도록 하여도 좋다. 또한, 가장 개연성이 높은 필드를 자동적으로 추출하여, 해당 필드명 또는 필드값 또는 양쪽 모두를 제시하도록 하여도 좋다. 또한, 이벤트의 타임스탬프는, 다른 방법으로 특정되는 이벤트명, 이벤트 ID, 존재하는 경우에는 관련 ID 등과 함께 이벤트 후보 데이터로서 이벤트 후보 데이터 저장부에 저장되는 경우도 있다. 또한, 이벤트 후보 데이터로부터 ID 사이가 관련지어져 이벤트 데이터가 생성되고, 이벤트 데이터 저장부에 저장되는 경우도 있다.

본 발명의 제2 형태에 따른, 업무 프로세스 분석을 위한 정보 처리 방법은, 해석 대상 시스템에 의해 생성되고 데이터 저장부에 저장되어 있는 레코드에서의 처리 대상 필드를 특정하는 단계와, 데이터 저장부에 저장되어 있는, 처리 대상 필드의 필드값의 특성을 특정하는 단계와, 처리 대상 필드의 필드값의 특성이 미리 정해진 특성을 갖는지의 여부에 기초하여, 이 처리 대상 필드가 이벤트의 이벤트 ID인 개연성을 나타내는 데이터를 특정하는 단계를 포함한다.

업무 시스템에 악영향을 부여하지 않고 이미 존재하는 데이터로부터, 이벤트의 이벤트 ID, 즉 이벤트의 식별데이터에 대해서 가능성을 나타내는 데이터(예컨대, 정확도나 A, B, C라고 하는 순위를 둠)를 특정할 수 있게 된다. 즉, 업무 프로세스 분석에 필요한 이벤트에 관한 데이터를 특정할 수 있게 된다.

또한, 본 발명의 제2 형태에 있어서, 이벤트의 이벤트 ID인 개연성을 나타내는 데이터가 부정(否定)을 나타내는 데이터가 아닌 경우, 데이터 저장부에 저장되어 있는, 레코드에서의 각 필드의 정의 데이터를 이용하여, 이 처리 대상 필드가 이벤트의 이벤트 ID인 개연성을 나타내는 데이터를 특정하는 제2 개연성 데이터 특정 단계를 더 포함하도록 하여도 좋다. 예컨대 처리 대상 필드의 필드값의 특성이 미리 정해진 특성을 갖지 않는 경우에는, 필드의 정의 데이터에 기초하여 더 판단하는 것이다.

또한, 위에서 진술한 정의 데이터가, 각 필드의 데이터형의 데이터를 포함하는 경우도 있다. 또한, 위에서 진술한 정의 데이터가, 키 설정 데이터를 포함하는 경우도 있다. 스키마 정보를 입수할 수 있는 경우에는, 예컨대 주(主) 키인지의 여부에 대한 데이터도 포함되기 때문에, 이 데이터를 이용하면 좋다.

또한, 위에서 진술한 제2 개연성 데이터 특정 단계가, 데이터 저장부에 저장되어 있는, 레코드에서의 각 필드의 정의 데이터로부터, 처리 대상 필드의 해당 데이터를 특정하는 단계와, 미리 정해진, 필드의 데이터형 또는 필드의 특성과 대응하는 개연성을 나타내는 데이터를 저장하는 스코어표를 참조하여, 처리 대상 필드의 해당 데이터에 대응하는 개연성을 나타내는 데이터를 특정하는 단계를 포함하도록 하여도 좋다. 스코어표에서 상기 개연성을 나타내는 데이터는 구체적인 수치인 경우도 있지만, 소정의 레벨 분류에 따라 레벨을 특정하도록 하여도 좋다. 또한, 스코어표에 해당하는 항목이 없는 경우에는, 미리 정해진 값을 설정하도록 하여도 좋다.

또한, 본 발명의 제2 형태에서는, 이벤트의 이벤트 ID인 개연성을 나타내는 데이터를, 각 필드에 대응시켜 사용자에게 제시하는 단계를 더 포함하도록 하여도 좋다. 이 제시에 의해서, 사용자는 어느 필드를 이벤트의 이벤트 ID의 필드인지를 최종적으로 특정하도록 하여도 좋다. 이 경우, 이벤트의 이벤트 ID인 필드의 필드값을 수집하여, 뒤의 처리에 이용하도록 하여도 좋다. 또한, 가장 개연성이 높은 필드를 자동적으로 추출하고, 이 필드명 또는 필드값 또는 양쪽 모두를 제시하도록 하여도 좋다. 또한, 이벤트 ID는, 다른 방법으로 특정되는 이벤트명, 타임스탬프가 존재하는 경우에는 관련 ID 등과 함께 이벤트 후보 데이터로서 이벤트 후보 데이터 저장부에 저장되는 경우도 있다. 또한, 이벤트 후보 데이터로부터 ID 사이가 관련지어져 이벤트 데이터가 생성되고, 이벤트 데이터 저장부에 저장되는 경우도 있다.

또한, 위에서 진술한 제1 개연성 데이터 특정 단계가, 처리 대상 필드의 필드값이 모든 레코드에서 일의(一意)인지의 여부를 판단하는 단계와, 처리 대상 필드의 필드값에 NULL이 포함되어 있는지 판단하는 단계를 포함하도록 하여도 좋다. 이벤트 ID의 필드값의 특성으로서, 필드값이 모든 레코드에서 일의이고, NULL이 포함되지 않는다고 하는 특성이 있기 때문이다.

본 발명의 제3 형태에 따른, 업무 프로세스 분석을 위한 정보 처리 방법은, 해석 대상 시스템에 의해 생성되고 데이터 저장부에 저장되어 있는 레코드에서의 처리 대상 필드를 특정하는 단계와, 데이터 저장부에 저장되어 있는, 처리 대상 필드의 필드값의 특성을 특정하는 단계와, 처리 대상 필드의 필드값의 특성이 미리 정해진 특성을 갖는지의 여부에 기초하여, 이 처리 대상 필드가 이벤트의 관련 ID인 개연성을 나타내는 데이터를 특정하는 단계를 포함한다.

업무 시스템에 악영향을 부여하지 않고 이미 존재하는 데이터로부터, 이벤트의 관련 ID, 즉 이벤트 ID에 관련되는 ID일 가능성을 나타내는 데이터(예컨대 정확도나 A, B, C라고 하는 순위를 둠)를 특정할 수 있게 된다. 즉, 업무 프로세스 분석에 필요한 이벤트에 관한 데이터를 특정할 수 있게 된다.

또한, 이벤트의 관련 ID인 개연성을 나타내는 데이터가 부정을 나타내는 데이터가 아닌 경우, 데이터 저장부에 저장되어 있는, 레코드에서의 각 필드의 정의 데이터를 이용하여, 이 처리 대상 필드가 이벤트의 관련 ID인 개연성을 나타내는 데이터를 특정하는 제2 개연성 데이터 특정 단계를 더 포함하도록 하여도 좋다. 예컨대 처리 대상 필드의 필드값의 특성이 미리 정해진 특성을 갖지 않는 경우에는, 필드의 정의 데이터에 기초하여 더 판단하는 것이다.

또한, 위에서 진술한 정의 데이터가, 각 필드의 데이터형의 데이터를 포함하는 경우도 있다. 또한, 위에서 진술한 정의 데이터가, 키 설정 데이터를 포함하는 경우도 있다. 스키마 정보를 입수할 수 있고, 예컨대 부(副) 키라는 지정이 있으면 그것을 이용할 수 있다.

또한, 위에서 진술한 제2 개연성 데이터 특정 단계가, 데이터 저장부에 저장되어 있는, 레코드에서의 각 필드의 정의 데이터로부터, 처리 대상 필드의 해당 데이터를 특정하는 단계와, 미리 정해진, 필드의 데이터형 또는 필드의 특성과 대응하는 개연성을 나타내는 데이터를 저장하는 스코어표를 참조하여, 처리 대상 필드의 해당 데이터에 대응하는 상기 개연성을 나타내는 데이터를 특정하는 단계를 포함하도록 하여도 좋다. 스코어표에서 상기 개연성을 나타내는 데이터는 구체적인 수치인 경우도 있지만, 그 수치를 소정의 레벨 분류에 따라서 레벨을 특정하도록 하여도 좋다. 또한, 스코어표에 해당하는 항목이 없는 경우에는, 미리 정해진 값 또는 레벨을 설정하도록 하여도 좋다. 또한, 복수의 항목에 해당하는 경우에는, 예컨대 높은 값을 갖는 항목 또는 중앙값으로부터 어긋난 값을 채용하도록 하여도 좋다.

또한, 본 발명의 제3 형태에서는, 이벤트의 관련 ID인 개연성을 나타내는 데이터를, 각 필드에 대응시켜 사용자에게 제시하는 단계를 더 포함하도록 하여도 좋다. 이 제시에 의해, 사용자는 어느 필드를 이벤트의 관련 ID의 필드인지를 최종적으로 특정하도록 하여도 좋다. 이 경우, 이벤트의 관련 ID인 필드의 필드값을 수집하여, 뒤의 처리에 이용하도록 하여도 좋다. 또한, 가장 개연성이 높은 필드를 자동적으로 추출하고, 해당 필드명 또는 필드값 또는 양쪽 모두를 제시하도록 하여도 좋다. 또한, 다른 방법으로 특정되는 이벤트명, 타임스탬프, 이벤트 ID 등과 함께 이벤트 후보 데이터로서 이벤트 후보 데이터 저장부에 저장되는 경우도 있다. 또한, 이벤트 후보 데이터로부터 ID 사이가 관련지어져 이벤트 데이터가 생성되고, 이벤트 데이터 저장부에 저장되는 경우도 있다.

또한, 위에서 진술한 제1 개연성 데이터 특정 단계가, 처리 대상 필드의 필드값이 NULL을 제외하고 2 이상의 값을 갖는지 판단하는 단계를 포함하도록 하여도 좋다. 관련 ID의 경우, 필드값은 NULL을 제외하고 2 이상의 값을 갖기 때문이다.

본 발명의 제4 형태에 따른 업무 프로세스 분석을 위한 정보 처리 방법은, 해석 대상 시스템에 의해 생성되고 데이터 저장부에 저장되어 있는 레코드에서의 각 필드에 대해서, 데이터 저장부에 저장되어 있는, 레코드에서의 각 필드의 정의 데이터를 이용하여, 이 필드가 이벤트의 타임스탬프인 개연성을 나타내는 데이터를 특정하는 단계와, 이벤트의 타임스탬프인 개연성을 나타내는 데이터가 소정의 데이터인 필드 또는 이벤트의 타임스탬프인 개연성을 나타내는 데이터에 기초하여 사용자에 의해 타임스탬프라고 지정된 필드를 특정하는 단계와, 특정된 필드의 수에 기초하여, 이벤트명을 특정하는 이벤트명 특정 단계를 포함한다.

이와 같이 타임스탬프로 간주되는 필드의 수에 의해 원래의 테이블의 성질이 정해지기 때문에, 이벤트명도 특정할 수 있게 된다.

예컨대, 위에서 진술한 이벤트명 특정 단계가, 필드의 수가 단수인 경우에는 테이블명을 이벤트명으로서 특정하는 단계를 포함하도록 하여도 좋다. 예컨대 수주 DB이면, 이벤트명은 「수주」가 된다.

또한, 위에서 진술한 이벤트명 특정 단계가, 필드의 수가 복수인 경우에는, 특정된 상기 필드의 필드명에 기초하여 이벤트명을 특정하는 단계를 포함하도록 하여도 좋다. 예컨대, 1 레코드에 복수의 이벤트를 포함하도록 한 테이블의 경우, 수주 일시, 기표(起票) 일시, 납품 일시, 검품 일시 등의 타임스탬프가 존재한다. 이러한 경우에는 「수주」「기표」「납품」「검품」이라고 하는 이벤트명을 특정한다.

또한, 본 발명의 제4 형태에 있어서는, 데이터 저장부에 저장되어 있는, 각 필드의 필드값의 특성을 특정하는 단계와, 각 필드의 필드값의 특성이 미리 정해진 특성을 갖는지의 여부에 기초하여, 이 필드가 이벤트의 이벤트 ID인 개연성을 나타내는 데이터를 특정하는 단계와, 이벤트의 이벤트 ID인 개연성을 나타내는 데이터가 부정을 나타내는 데이터가 아닌 경우, 데이터 저장부에 저장되어 있는, 레코드에서의 각 필드의 정의 데이터를 이용하여, 이 필드가 이벤트의 이벤트 ID인 개연성을 나타내는 데이터를 특정하는 단계를 더 포함하도록 하여도 좋다. 이것에 의해서, 이벤트 ID도 특정할 수 있게 된다.

또한, 본 발명의 제4 형태에서, 필드의 필드값의 특성이 미리 정해진 제2 특성을 갖는지의 여부에 기초하여, 이 필드가 이벤트의 관련 ID인 개연성을 나타내는 데이터를 특정하는 단계와, 이벤트의 관련 ID인 개연성을 나타내는 데이터가 부정을 나타내는 데이터가 아닌 경우, 데이터 저장부에 저장되어 있는, 레코드에서의 각 필드의 정의 데이터를 이용하여, 이 필드가 이벤트의 관련 ID인 개연성을 나타내는 데이터를 특정하는 단계를 더 포함하도록 하여도 좋다. 이것에 의해서, 관련 ID도 더 특정할 수 있게 된다.

또한, 본 발명에 따른 방법을 컴퓨터에 실행시키기 위한 프로그램을 작성할 수 있고, 이 프로그램은, 예컨대 플렉서블?디스크, CD-ROM, 광자기디스크, 반도체메모리, 하드디스크 등의 기억매체 또는 기억장치에 저장된다. 또한, 네트워크를 통해 디지털 신호로써 반포되는 경우도 있다. 또한, 처리 도중의 데이터에 대해서는, 컴퓨터의 메모리 등의 기억장치에 일시 보관된다.

도 1은 본 발명의 실시형태에서의 업무 시스템 분석 장치의 기능 블록도이다.

도 2의 (a) 내지 (d)는 본 발명의 실시형태의 개요를 설명하기 위한 도면이다.

도 3은 본 발명의 실시형태에서의 메인의 처리 흐름을 도시하는 도면이다.

도 4의 (a)는 수주 DB의 스키마 정보, 도 4의 (b)는 수주 DB의 레코드군을 도시하는 도면이다.

도 5의 (a)는, 생산 DB의 스키마 정보, 도 5의 (b)는 생산 DB의 레코드군을 도시하는 도면이다.

도 6의 (a)는 수배(手配) DB의 스키마 정보, 도 6의 (b)는 수배 DB의 레코드군을 도시하는 도면이다.

도 7의 (a)는 배송 DB의 스키마 정보, 도 7의 (b)는 배송 DB의 레코드군을 도시하는 도면이다.

도 8의 (a)는 품번 DB의 스키마 정보, 도 8의 (b)는 품번 DB의 레코드군을 도시하는 도면이다.

도 9의 (a)는 CSV 형식의 수주 DB의 데이터예를 도시하고, 도 9의 (b)는 수주 DB의 데이터를 테이블화한 예를 도시하는 도면이다.

도 10의 (a)는 CSV 형식의 생산 DB의 데이터예를 도시하고, 도 10의 (b)는 생산 DB의 데이터를 테이블화한 예를 도시하는 도면이다.

도 11의 (a)는 CSV 형식의 수배 DB의 데이터예를 도시하고, 도 11의 (b)는 수배 DB의 데이터를 테이블화한 예를 도시하는 도면이다.

도 12의 (a)는 CSV 형식의 배송 DB의 데이터예를 도시하고, 도 12의 (b)는 배송 DB의 데이터를 테이블화한 예를 도시하는 도면이다.

도 13의 (a)는 CSV 형식의 품번 DB의 데이터예를 도시하고, 도 13의 (b)는 품번 DB의 데이터를 테이블화한 예를 도시하는 도면이다.

도 14는 타임스탬프 판정 처리의 처리 흐름을 도시하는 도면이다.

도 15는 타임스탬프 정확도 스코어표의 일례를 도시하는 도면이다.

도 16은 이벤트 ID 및 관련 ID 후보 판정 처리의 처리 흐름을 도시하는 도면이다.

도 17은 이벤트 ID?관련 ID 후보 정확도 스코어표의 일례를 도시하는 도면이다.

도 18은 이벤트명 판정 처리의 처리 흐름을 도시하는 도면이다.

도 19는 타임스탬프가 복수 포함되는 테이블의 일례를 도시하는 도면이다.

도 20의 (a) 내지 (e)는 도 19를 구성하는 원래의 테이블의 일례를 도시하는 도면이다.

도 21은 스키마 정보가 존재하는 경우에서의, 수주 DB의 이벤트 후보 데이터의 각 요소에 대한 판정 표시의 일례를 도시하는 도면이다.

도 22는 CSV 형식의 데이터인 경우에서의, 수주 DB의 이벤트 후보 데이터의 각 요소에 대한 판정 표시의 일례를 도시하는 도면이다.

도 23은 스키마 정보가 존재하는 경우에서의, 생산 DB의 이벤트 후보 데이터의 각 요소에 대한 판정 표시의 일례를 도시하는 도면이다.

도 24는 CSV 형식의 데이터인 경우에서의, 생산 DB의 이벤트 후보 데이터의 각 요소에 대한 판정 표시의 일례를 도시하는 도면이다.

도 25는 스키마 정보가 존재하는 경우에서의, 수배 DB의 이벤트 후보 데이터의 각 요소에 대한 판정 표시의 일례를 도시하는 도면이다.

도 26은 CSV 형식의 데이터인 경우에서의, 수배 DB의 이벤트 후보 데이터의 각 요소에 대한 판정 표시의 일례를 도시하는 도면이다.

도 27은 스키마 정보가 존재하는 경우에서의, 배송 DB의 이벤트 후보 데이터의 각 요소에 대한 판정 표시의 일례를 도시하는 도면이다.

도 28은 CSV 형식의 데이터인 경우에서의, 배송 DB의 이벤트 후보 데이터의 각 요소에 대한 판정 표시의 일례를 도시하는 도면이다.

도 29는 스키마 정보가 존재하는 경우에서의, 품번 DB의 이벤트 후보 데이터의 각 요소에 대한 판정 표시의 일례를 도시하는 도면이다.

도 30은 CSV 형식의 데이터인 경우에서의, 품번 DB의 이벤트 후보 데이터의 각 요소에 대한 판정 표시의 일례를 도시하는 도면이다.

도 31은 이벤트 후보 데이터의 각 요소에 대한 선택 결과의 일례를 도시하는 도면이다.

도 32는 스키마 정보가 존재하는 경우에서 수주 DB의 데이터로부터 생성한 이벤트 후보 데이터의 일례를 도시하는 도면이다.

도 33은 CSV 형식의 데이터인 경우에서 수주 DB의 데이터로부터 생성한 이벤트 후보 데이터의 일례를 도시하는 도면이다.

도 34는 스키마 정보가 존재하는 경우에서 생산 DB의 데이터로부터 생성한 이벤트 후보 데이터의 일례를 도시하는 도면이다.

도 35는 CSV 형식의 데이터인 경우에서 생산 DB의 데이터로부터 생성한 이벤트 후보 데이터의 일례를 도시하는 도면이다.

도 36은 스키마 정보가 존재하는 경우에서 수배 DB의 데이터로부터 생성한 이벤트 후보 데이터의 일례를 도시하는 도면이다.

도 37은 CSV 형식의 데이터인 경우에서 수배 DB의 데이터로부터 생성한 이벤트 후보 데이터의 일례를 도시하는 도면이다.

도 38은 스키마 정보가 존재하는 경우에서 배송 DB의 데이터로부터 생성한 이벤트 후보 데이터의 일례를 도시하는 도면이다.

도 39는 CSV 형식의 데이터인 경우에서 배송 DB의 데이터로부터 생성한 이벤트 후보 데이터의 일례를 도시하는 도면이다.

도 40은 도 19의 기표에 관한 이벤트 후보 데이터의 일례를 도시하는 도면이다.

도 41은 도 19의 승인에 관한 이벤트 후보 데이터의 일례를 도시하는 도면이다.

도 42는 도 19의 발주에 관한 이벤트 후보 데이터의 일례를 도시하는 도면이다.

도 43은 도 19의 납품에 관한 이벤트 후보 데이터의 일례를 도시하는 도면이다.

도 44는 도 19의 검수에 관한 이벤트 후보 데이터의 일례를 도시하는 도면이다.

도 45는 이벤트 데이터 및 이벤트간 관계 트리의 일례를 도시하는 도면이다.

도 46은 이벤트 데이터로부터의 프로세스 인스턴스 생성을 설명하기 위한 도면이다.

도 47은 프로세스 인스턴스의 일례를 도시하는 도면이다.

도 48은 프로세스 흐름 분석 결과의 표시예를 도시하는 도면이다.

도 49는 프로세스 흐름 분석 결과의 다른 표시예를 도시하는 도면이다.

도 50은 본 발명의 실시형태에서의 메인의 처리 흐름의 다른 예를 도시하는 도면이다.

도 51은 컴퓨터 장치의 기능 블록도이다.

(발명을 실시하기 위한 최선의 형태)

도 1에, 본 발명의 일 실시형태에 따른 업무 시스템 분석 장치의 기능 블록도를 도시한다. 본 실시형태에 따른 업무 시스템 분석 장치는, 단수 또는 복수의 해석 대상 시스템으로부터 수집된 데이터[소정 기간에서 생성된 데이터베이스의 레코드군, 로그데이터, 네트워크 DB(NDB)의 레코드군, 저널 등]를 저장하는 분석 대상 데이터 저장부(1)와, 분석 대상 데이터 저장부(1)로부터 이벤트 후보 데이터를 생성하는 이벤트 후보 데이터 생성부(3)와, 이벤트 후보 데이터 생성부(3)에 의해 생성된 이벤트 후보 데이터를 저장하는 이벤트 후보 데이터 저장부(5)와, 사용자와 의 인터페이스가 되는 입출력부(11)와, 입출력부(11)를 통해 사용자의 지시를 접수하여 이벤트 데이터를 생성하는 이벤트 데이터 생성부(7)와, 이벤트 데이터 생성부(7)에 의해 생성된 이벤트 데이터를 저장하는 이벤트 데이터 저장부(9)와, 이벤트 데이터 저장부(9)에 저장되어 있는 이벤트 데이터로부터 프로세스 인스턴스를 생성하는 프로세스 인스턴스 생성부(13)와, 프로세스 인스턴스 생성부(13)에 의해 생성된 프로세스 인스턴스의 데이터를 저장하는 프로세스 인스턴스 데이터 저장부(15)와, 프로세스 인스턴스 데이터 저장부(15)에 저장되어 있는 프로세스 인스턴스의 데이터를 이용하여 프로세스 흐름을 생성하는 프로세스 흐름 생성부(17)와, 프로세스 흐름 생성부(17)에 의해 생성된 프로세스 흐름의 데이터를 저장하는 프로세스 흐름 데이터 저장부(19)와, 프로세스 흐름 데이터 저장부(19)에 저장되어 있는 데이터를 이용하여 각종 프로세스 분석 처리를 실시하는 프로세스 분석부(21)와, 프로세스 분석부(21)에 의한 분석 결과를 저장하는 분석 결과 저장부(23)를 포함한다.

또한, 입출력부(11)는 이벤트 후보 데이터 생성부(3), 프로세스 인스턴스 생성부(13), 프로세스 흐름 생성부(17) 및 프로세스 분석부(21)에 대해서도, 사용자와의 인터페이스로서 동작한다. 또한, 각 처리부는 처리 결과 등을 독출하여 입출력부(11)를 통해 사용자에게 제시하는 등의 처리도 실시하는 것도 있다. 단, 이벤트 데이터로부터 프로세스 흐름 데이터를 생성하는 처리는 자동적으로 행해지는 경우도 있고, 이 경우에는 프로세스 인스턴스 생성부(13) 및 프로세스 흐름 생성부(17)에 대해서는, 각 처리 결과의 중간 결과를 표시하는 경우를 제외하고, 인터 페이스는 불필요하다.

또한, 본 실시형태에서의 주요 구성 부분인 이벤트 후보 데이터 생성부(3)는, 타임스탬프 처리부(31)와, 이벤트 ID?관련 ID 후보 처리부(32)와, 이벤트명 처리부(34)와, 스코어표 저장부(35)를 갖는다.

다음에, 업무 시스템 분석 장치의 대략적인 처리 내용에 대해서 도 2의 (a) 내지 (d)를 이용하여 설명한다. 우선, 이벤트 후보 데이터 생성부(3)는 분석 대상 데이터 저장부(1)에 저장된 업무 시스템에 대한 데이터로부터 이벤트 후보 데이터를 생성한다. 이벤트 후보 데이터의 일례를 도 2의 (a)에 도시한다. 도 2의 (a)의 예에서는, 예컨대 하나의 테이블(예컨대 데이터베이스)로부터, 이벤트명과, 시각(이벤트의 발생 일시인 타임스탬프)과, 그 이외의 제1 값(값 1)과, 제2 값(값 2) 등을 포함하는 레코드군이 추출되도록 되어 있다. 즉, 이벤트명이나 타임스탬프, 그 이외에 이벤트 ID나 관련 ID의 후보가 되는 데이터?필드가 특정된다.

다음에, 이벤트 데이터 생성부(7)는 이벤트 후보 데이터 저장부(5)에 저장되어 있는 이벤트 후보 데이터로부터 이벤트 데이터를 생성한다. 이벤트 데이터의 일례를 도 2의 (b)에 도시한다. 도 2의 (b)의 예에서는, 복수의 테이블(예컨대 데이터베이스)로부터, 이벤트명, 시각(이벤트의 발생 일시인 타임스탬프), 이벤트 ID(여기서는 ID1) 및 다른 값을 포함하는 레코드군과, 이벤트명, 시각(타임스탬프), ID1및 ID2 등을 포함하는 레코드군이 추출되고, 제2 이벤트 클래스(즉, 이벤트의 종류)의 레코드의 관련 ID인 ID2의 필드값이, 제1 이벤트 클래스(즉, 이벤트의 종류)의 레코드의 이벤트 ID인 ID1의 필드값 중 어느 하나의 값을 취함으로써, 제2 이벤트 클래스의 각각의 레코드(즉 이벤트 인스턴스)가, 제1 이벤트 클래스의 어느 레코드(즉 이벤트 인스턴스)와 관련되어 있는지가 특정된다. 이러한 이벤트간의 관련 등을 추출하는 처리 자체는, 본 실시형태에서의 주요부가 아니라, 예컨대 일본 특허 출원 제2006-197294호(2006년 7월 19일 출원) 및 그 대응 외국 출원에 개시되어 있다.

그 후, 프로세스 인스턴스 생성부(13)는, 이벤트 데이터 저장부(9)에 저장되어 있는 이벤트 데이터로부터 프로세스 인스턴스의 데이터를 생성한다. 프로세스 인스턴스의 일례를 도 2의 (c)에 도시한다. 도 2의 (c)의 예에서는, 4개의 프로세스 인스턴스가 예시되어 있고, 각각의 프로세스 인스턴스에는, 일련의 이벤트 인스턴스(구체적인 이벤트)가 포함되어 있다. 즉, 예컨대 「수주」「기표」「납품」「검품」이라고 하는 이벤트 클래스에 속하는 연속하는 이벤트 인스턴스(구체적인 이벤트이며 특정한 레코드에 대응하는 이벤트)로 프로세스 인스턴스가 구성된다. 단, 프로세스 인스턴스에 포함되는 이벤트 인스턴스는 모든 이벤트 클래스에 유래될 필요는 없고, 하나의 이벤트 클래스에 속하는 이벤트 인스턴스가 복수 포함되어 있어도 좋다.

그리고, 프로세스 흐름 생성부(17)는, 프로세스 인스턴스 데이터 저장부(15)에 저장되어 있는 프로세스 인스턴스의 데이터로부터 프로세스 흐름의 데이터를 생성한다. 프로세스 흐름의 일례를 도 2의 (d)에 도시한다. 도 2의 (d)의 예에서는, 프로세스 인스턴스가 추상화되어 특정되는 업무 흐름이 표시되어 있다. 도 2의 (c) 및 (d)의 데이터를 생성하는 처리 자체는, 본 실시형태에서의 주요부가 아니라, 예컨대 일본 특허 출원 제2006-136518호(2006년 5월 16일 출원) 및 그 대응 외국 출원에 개시되어 있다.

또한, 프로세스 분석부(21)는, 프로세스 흐름 데이터 저장부(19)에 저장되어 있는 프로세스 흐름의 데이터에 대하여 각종 분석 처리를 실시한다. 프로세스 흐름에 대한 분석 처리에 대해서는, 본 실시형태에서의 주요부가 아니라, 여러 가지 분석 처리가 존재하고 있고, 여기서는 그 상세에 대해서는 생략한다. 또한, 분석 처리에 대해서도, 예컨대 일본 특허 출원 제2006-136518호(2006년 5월 16일 출원) 및 그 대응 외국 출원에 개시되어 있다.

다음에, 도 1에 도시한 업무 시스템 분석 장치의 처리의 상세를 도 3 내지 도 51을 이용하여 설명한다. 우선, 사용자는 업무 시스템에서의 해석 대상 테이블을 지정하고, 그 데이터를 복사하여 분석 대상 데이터 저장부(1)에 저장시킨다(도 3: 단계 S1). 예컨대, 수주 DB, 생산 DB, 수배 DB, 배송 DB, 품번 DB가 지정되고, 소정 기간에서 생성되어 축적되어 있던 레코드군을 복사하여, 분석 대상 데이터 저장부(1)에 저장한다. 또한, 이들 DB가 릴레이셔널 데이터베이스(relational database)이면, 스키마 정보도 복사하여, 분석 대상 데이터 저장부(1)에 저장해 둔다. 본 단계에 대해서는, 미리 사용자가 컴퓨터를 조작하여 행하는 처리이기 때문에, 도 3에서는 점선 블록으로 도시하고 있다.

예컨대 수주 DB가 릴레이셔널 데이터베이스인 경우에는, 도 4의 (a)와 같은 스키마 정보와 도 4의 (b)에 도시하는 바와 같은 레코드군이 분석 대상 데이터 저장부(1)에 저장된다. 도 4의 (a)에 도시한 스키마 정보의 예에서는, 필드 1 내지 4 의 각각에 대해서, 필드명, 키 설정 데이터, 데이터형, 레코드 길이 및 코멘트가 등록되도록 되어 있다. 도 4의 (a)로부터, 필드 1에는 일시가 등록되고, 필드 2에는 주 키인 수주 번호가 등록되며, 필드 3에는 지역이 등록되고, 필드 4에는 수주 내용이 등록되는 것을 알 수 있다. 구체적으로는 도 4의 (b)와 같은 레코드군이 되지만, 도 4의 (a)와 같은 스키마 정보를 얻으면, 도 4의 (b)와 같은 레코드군의 내용을 용이하게 해석할 수 있다.

마찬가지로, 생산 DB가 릴레이셔널 데이터베이스인 경우에는, 도 5의 (a)와 같은 스키마 정보와 도 5의 (b)에 도시하는 바와 같은 레코드군이 분석 대상 데이터 저장부(1)에 저장된다. 도 5의 (a)에 도시한 스키마 정보의 예에서는, 필드 1 내지 5의 각각에 대해서, 필드명, 키 설정 데이터, 데이터형, 레코드 길이 및 코멘트가 등록되도록 되어 있다. 도 5의 (a)로부터, 필드 1에는 일시가 등록되고, 필드 2에는 주 키인 생산 번호가 등록되며, 필드 3에는 부 키인 수주 번호가 등록되고, 필드 4에는 부 키인 품번이 등록되며, 필드 5에는 납기가 등록되는 것을 알 수 있다. 구체적으로는 도 5의 (b)와 같은 레코드군이 되지만, 도 5의 (a)와 같은 스키마 정보를 얻으면, 도 5의 (b)와 같은 레코드군의 내용을 용이하게 해석할 수 있다.

또한, 수배 DB가 릴레이셔널 데이터베이스인 경우에는, 도 6의 (a)와 같은 스키마 정보와 도 6의 (b)에 도시하는 바와 같은 레코드군이 분석 대상 데이터 저장부(1)에 저장된다. 도 6의 (a)에 도시하는 스키마 정보의 예에서는 필드 1 내지 5의 각각에 대해서, 필드명, 키 설정 데이터, 데이터형, 레코드 길이 및 코멘트가 등록되도록 되어 있다. 도 6의 (a)로부터, 필드 1에는 일시가 등록되고, 필드 2에는 주 키인 수배 번호가 등록되며, 필드 3에는 부 키인 수주 번호가 등록되고, 필드 4에는 부 키인 품번이 등록되며, 필드 5에는 납품처가 등록되는 것을 알 수 있다. 구체적으로는 도 6의 (b)와 같은 레코드군이 되지만, 도 6의 (a)와 같은 스키마 정보를 얻으면, 도 6의 (b)와 같은 레코드군의 내용을 용이하게 해석할 수 있다.

또한, 배송 DB가 릴레이셔널 데이터베이스인 경우에는, 도 7의 (a)와 같은 스키마 정보와 도 7의 (b)에 도시하는 바와 같은 레코드군이 분석 대상 데이터 저장부(1)에 저장된다. 도 7의 (a)에 도시하는 스키마 정보의 예에서는, 필드 1 내지 4의 각각에 대해서, 필드명, 키 설정 데이터, 데이터형, 레코드 길이 및 코멘트가 등록되도록 되어 있다. 도 7의 (a)로부터, 필드 1에는 일시가 등록되고, 필드 2에는 주 키인 수배 번호가 등록되며, 필드 3에는 부 키인 배송편이 등록되고, 필드 4에 납품처가 등록되는 것을 알 수 있다. 구체적으로는 도 7의 (b)와 같은 레코드군이 되지만, 도 7의 (a)와 같은 스키마 정보를 얻으면, 도 7의 (b)와 같은 레코드군의 내용을 용이하게 해석할 수 있다.

또한, 품번 DB가 릴레이셔널 데이터베이스인 경우에는, 도 8의 (a)와 같은 스키마 정보와 도 8의 (b)에 도시하는 바와 같은 레코드군이 분석 대상 데이터 저장부(1)에 저장된다. 도 8의 (a)에 도시하는 스키마 정보의 예에서는, 필드 1 및 2의 각각에 대해서, 필드명, 키 설정 데이터, 데이터형, 레코드 길이 및 코멘트가 등록되도록 되어 있다. 도 8의 (a)로부터, 필드 1에는 주 키인 품번이 등록되고, 필드 2에는 품명이 등록되는 것을 알 수 있다. 구체적으로는 도 8의 (b)와 같은 레코드군이 되지만, 도 8의 (a)와 같은 스키마 정보를 얻으면, 도 8의 (b)와 같은 레코드군의 내용을 용이하게 해석할 수 있다.

한편, 수주 DB의 데이터를 CSV 형식으로 취득한 경우에는, 도 9의 (a)에 도시하는 바와 같은 데이터가 분석 대상 데이터 저장부(1)에 저장된다. 도 9의 (a)의 예에서는, 일시, 수주 번호, 지역 및 수주 내용이라는 라벨 데이터가 선두에 포함되고, 그 후는 상기 라벨의 순서로 데이터가 나열되며, 데이터 사이는 콤마로써 구획되어 있다. 도 9의 (a)를 알기 쉽게 하기 위해 테이블 형식으로 하면 도 9의 (b)에 도시하는 바와 같이 된다. 즉, 일시의 열과, 수주 번호의 열과, 지역의 열과, 수주 내용의 열을 포함하는 테이블이 된다. 스키마 정보는 없기 때문에, 데이터는 모두 문자열로서 저장된다. 또한, 키 설정 데이터는 없다.

마찬가지로, 생산 DB의 데이터를 CSV 형식으로 취득한 경우에는, 도 10의 (a)에 도시하는 바와 같은 데이터가 분석 대상 데이터 저장부(1)에 저장된다. 도 10의 (a)의 예에서는, 일시, 생산 번호, 수주 번호, 품번 및 납기라는 라벨 데이터가 선두에 포함되고, 그 뒤에는 상기 라벨의 순서로 데이터가 나열되며, 데이터 사이는 콤마로써 구획되어 있다. 도 10의 (a)를 알기 쉽게 하기 위해 테이블 형식으로 하면 도 10의 (b)에 도시하는 바와 같이 된다. 즉, 일시의 열과, 생산 번호의 열과, 수주 번호의 열과, 품번의 열과, 납기의 열을 포함하는 테이블이 된다.

또한, 수배 DB의 데이터를 CSV 형식으로 취득한 경우에는, 도 11의 (a)에 도시하는 바와 같은 데이터가 분석 대상 데이터 저장부(1)에 저장된다. 도 11의 (a) 의 예에서는, 일시, 수배 번호, 수주 번호, 품번 및 납품처라는 라벨 데이터가 선두에 포함되고, 그 뒤에는 상기 라벨의 순서로 데이터가 나열되며, 데이터 사이는 콤마로써 구획되어 있다. 도 11의 (a)를 알기 쉽게 하기 위해 테이블 형식으로 하면 도 11의 (b)에 도시하는 바와 같이 된다. 즉, 일시의 열과, 수배 번호의 열과, 수주 번호의 열과, 품번의 열과, 납품처의 열을 포함하는 테이블이 된다.

또한, 배송 DB의 데이터를 CSV 형식으로 취득한 경우에는, 도 12의 (a)에 도시하는 바와 같은 데이터가 분석 대상 데이터 저장부(1)에 저장된다. 도 12의 (a)의 예에서는, 일시, 수배 번호, 배송편 및 납품처라는 라벨 데이터가 선두에 포함되고, 그 뒤에는 상기 라벨의 순서로 데이터가 나열되며, 데이터 사이는 콤마로써 구획되어 있다. 도 12의 (a)를 알기 쉽게 하기 위해 테이블 형식으로 하면 도 12의 (b)에 도시하는 바와 같이 된다. 즉, 일시의 열과, 수배 번호의 열과, 배송편의 열과, 납품처의 열을 포함하는 테이블이 된다.

또한, 품번 DB의 데이터를 CSV 형식으로 취득한 경우에는, 도 13의 (a)에 도시하는 바와 같은 데이터가 분석 대상 데이터 저장부(1)에 저장된다. 도 13의 (a)의 예에서는, 품번 및 품명이라는 라벨 데이터가 선두에 포함되고, 그 뒤에는 상기 라벨의 순서로 데이터가 나열되며, 데이터 사이는 콤마로써 구획되어 있다. 도 13의 (a)를 알기 쉽게 하기 위해 테이블 형식으로 하면 도 13의 (b)에 도시하는 바와 같이 된다. 즉, 품번의 열과, 품명의 열을 포함하는 테이블이 된다.

업무 시스템 분석 장치의 예컨대 이벤트 후보 데이터 생성부(3)는, 모든 해석 대상 테이블에 대해서 처리했는지 판단한다(단계 S3). 미처리의 해석 대상 테이 블이 존재하는 경우에는, 미처리의 해석 대상 테이블을 하나 특정한다(단계 S5). 그리고, 타임스탬프 판정 처리를 실시한다(단계 S7). 이 타임스탬프 판정 처리에 대해서는 도 14 및 도 15를 이용하여 설명한다.

우선, 이벤트 후보 데이터 생성부(3)의 타임스탬프 처리부(31)는, 분석 대상 데이터 저장부(1)를 참조하여, 해석 대상 테이블에서 미처리의 필드를 하나 특정한다(도 14: 단계 S31). 그리고 분석 대상 데이터 저장부(1)에서 해석 대상 테이블의 스키마 정보가 사용 가능해져 있는지 판단한다(단계 S33).

스키마 정보가 사용 가능해져 있는 경우에는, 스키마 정보에 있어서 처리 대상 필드에 대한 데이터 부분을 특정하고, 그 중에서 처리 대상 필드의 데이터형이 타임스탬프형인지 판단한다(단계 S35). 처리 대상 필드의 데이터형이 타임스탬프형이 아닌 경우에는 단계 S39에 이행한다. 예컨대 도 9의 (a) 내지 도 13의 (a)와 같은 데이터를 처리하는 경우에는 스키마 정보는 없기 때문에, 단계 S39에 이행한다.

한편, 처리 대상 필드의 데이터형이 타임스탬프형이라고 판단된 경우에는, 처리 대상 필드의 타임스탬프 판정을 「확정」으로 설정하고, 예컨대 메인 메모리 등의 기억장치에 저장한다(단계 S37). 그리고, 처리는 단계 S43에 이행한다.

예컨대, 도 4의 (a)와 같은 스키마 정보의 경우, 필드 1의 데이터형이 타임스탬프형이기 때문에, 필드 1이 처리 대상 필드이면, 타임스탬프 판정=「확정」으로 설정된다. 도 5의 (a)와 같은 스키마 정보의 경우, 필드 1의 데이터형이 타임스탬프형이기 때문에, 필드 1이 처리 대상 필드이면, 타임스탬프 판정=「확정」으로 설정된다. 도 6의 (a) 및 도 7의 (a)에 대해서도 마찬가지다. 도 8의 (a)의 경우에 는, 단계 S35로부터 단계 S39에 이행한다.

단계 S33에서 스키마 정보가 사용 불능으로 판단된 경우 또는 처리 대상 필드의 데이터형이 타임스탬프형이 아닌 경우, 스코어표 저장부(35)에 저장되어 있는 타임스탬프 정확도 스코어표를 참조하여, 스키마 정보에서의 처리 대상 필드의 해당 데이터 부분, 처리 대상 필드의 필드명을 나타내는 라벨 데이터, 및 처리 대상 필드의 필드값으로부터 정확도를 특정한다(단계 S39).

타임스탬프 정확도 스코어표의 일례를 도 15에 도시한다. 도 15의 예에서는, 「필드의 데이터형이 가변 길이 문자열」이면 정확도 스코어는 1(%)로 설정되고, 「필드의 데이터형이 실수」이면 정확도 스코어는 5(%)로 설정되며, 필드명의 말미가 「시각」「시간」 등이면 정확도 스코어는 90(%)로 설정되고, 필드명의 말미가 「월일」「일」 등으로서 시각 등이 포함되지 않는 경우이면 정확도 스코어는 70(%)로 설정되며, 필드명에 「예정」「납기」 등 장래의 시기가 포함되는 경우이면 정확도 스코어는 10(%)로 설정되고, 필드값의 문자열에 연호(기호), 「/」「:」「'」「.」「-」, 숫자, 공백이라고 하는 시간에 관련되는 문자 이외의 문자가 포함되어 있는 경우에는 정확도 스코어는 5(%)로 설정되며, 필드값의 문자열이 「YYYY/MM/DD hh:mm:ss」의 형식이면 정확도 스코어는 90(%)로 설정되고, 필드값의 문자열이 「YYYY/MM/DD」의 형식이면 정확도 스코어는 70(%)로 설정되며, 필드값에 동일해지는 것이 포함되어 있으면 정확도 스코어는 30(%)로 설정되고, 해당하는 항목이 없으면 정확도 스코어는 50(%)로 설정된다.

예컨대 도 4의 (a)와 같은 스키마 정보에서 도 4의 (b)와 같은 레코드군의 경우, 필드 2에 대해서는, 필드값에 시간에 관련되는 문자 이외의 문자가 포함되어 있는 것으로서 정확도 스코어 5(%)로 특정된다. 필드 3에 대해서도 마찬가지로, 필드값에 시간에 관련되는 문자 이외의 문자가 포함되어 있는 것으로서 정확도 스코어 5(%)로 특정된다. 또한 필드 4에 대해서는, 데이터형이 가변 길이 문자열이기 때문에, 정확도 스코어 1(%)로 특정된다. 또한 필드 4에 대해서는, 필드값에 시간에 관련되는 문자 이외의 문자도 포함되어 있기 때문에, 타임스탬프 정확도 스코어표에 있어서 복수 항목에 해당되어 있지만, 본 실시형태에서는 50(%)라고 하는 중앙값으로부터 보다 괴리된 값을 채용한다. 즉, 필드값에 시간에 관련되는 문자 이외의 문자가 포함되어 있는 경우의 정확도 스코어 5(%)보다 1(%)를 채용한다.

한편, 스키마 정보가 존재하지 않는 도 9의 (a)의 경우에는, 필드 1에 대해서는, 필드값의 문자열이 「YYYY/MM/DD hh:mm:ss」의 형식이기 때문에, 정확도 스코어 90(%)로 특정된다. 필드 2 및 3에 대해서는 마찬가지이지만, 필드 4에 대해서는, 이 필드의 데이터형을 특정할 수 없기 때문에, 필드값에 시간에 관련되는 문자 이외의 문자가 포함되어 있는 경우에 해당한다고 판단되고, 정확도 스코어 5(%)로 특정된다.

또한, 도 5의 (a)와 같은 스키마 정보로 도 5의 (b)와 같은 레코드군의 경우에도, 필드 2 내지 4에 대해서는, 필드값에 시간에 관련되는 문자 이외의 문자가 포함되어 있는 것으로서 정확도 스코어 5(%)로 특정된다. 필드 5에 대해서는, 필드명의 문자열에 「납기」가 포함되어 있기 때문에, 정확도 스코어 10(%)로 특정된다. 또한, 필드 5에 대해서는, 필드값의 문자열이 「YYYY/MM/DD」의 형식이기 때문에, 타임스탬프 정확도 스코어표에 있어서 복수 항목에 해당되어 있지만, 본 실시형태에서는 50(%)라고 하는 중앙값으로부터 보다 괴리된 값을 채용한다. 즉, 필드값의 문자열이 「YYYY/MM/DD」의 형식인 경우의 정확도 스코어 70(%)보다 10(%)를 채용한다. 스키마 정보가 존재하지 않는 도 10의 (a)의 경우에는, 필드 1에 대해서는, 필드값의 문자열이 「YYYY/MM/DD hh:mm:ss」의 형식이기 때문에, 정확도 스코어 90(%)로 특정된다. 필드 2 내지 5에 대해서는, 데이터형이 관계되지 않기 때문에, 스키마 정보가 존재하는 경우와 같은 결과를 얻을 수 있다.

또한, 도 6의 (a)와 같은 스키마 정보에서 도 6의 (b)와 같은 레코드군의 경우, 필드 2 내지 5에 대해서는, 필드값에 시간에 관련되는 문자 이외의 문자가 포함되어 있는 것으로서 정확도 스코어 5(%)로 특정된다. 스키마 정보가 존재하지 않는 도 11의 (a)의 경우에는, 필드 1에 대해서는, 필드값의 문자열이 「YYYY/MM/DD hh:mm:ss」의 형식이기 때문에, 정확도 스코어 90(%)로 특정된다. 필드 2 내지 5에 대해서는, 데이터형이 관계되지 않기 때문에, 스키마 정보가 존재하는 경우와 같은 결과를 얻을 수 있다.

또한, 도 7의 (a)와 같은 스키마 정보에서 도 7의 (b)와 같은 레코드군의 경우, 필드 2 내지 4에 대해서는, 필드값에 시간에 관련되는 문자 이외의 문자가 포함되어 있는 것으로서 정확도 스코어 5(%)로 특정된다. 스키마 정보가 존재하지 않는 도 12의 (a)의 경우는, 필드 1에 대해서는, 필드값의 문자열이 「YYYY/MM/DD hh:mm:ss」의 형식이기 때문에, 정확도 스코어 90(%)로 특정된다. 필드 2 내지 4에 대해서는, 데이터형이 관계되지 않기 때문에, 스키마 정보가 존재하는 경우와 같은 결과를 얻을 수 있다.

또한, 도 8의 (a)와 같은 스키마 정보에서 도 8의 (b)와 같은 레코드군의 경우, 필드 1 및 2에 대해서는, 필드값에 시간에 관련되는 문자 이외의 문자가 포함되어 있는 것으로서 정확도 스코어 5(%)로 특정된다. 스키마 정보가 존재하지 않는 도 13의 (a)의 경우도, 데이터형이 관계되지 않기 때문에, 스키마 정보가 존재하는 경우와 같은 결과를 얻을 수 있다.

도 14의 설명을 다시 참조하여, 처리 대상 필드의 타임스탬프 판정을 특정된 정확도 스코어로 설정한다(단계 S41). 위에서 진술한 수치가 특정된다.

그리고, 처리 대상 테이블에 있어서 모든 필드에 대해서 처리했는지 판단한다(단계 S43). 미처리 필드가 존재하는 경우에는 단계 S31에 되돌아간다. 한편, 모든 필드를 처리한 경우에는 원래의 처리에 되돌아간다.

이와 같이, 이벤트의 타임스탬프로서 개연성이 높은 필드에 높은 값의 정확도 스코어가 설정된다. 또한, 데이터형으로부터 타임스탬프인 것이 분명하면 「확정」이라는 개연성을 나타내는 데이터가 설정된다.

도 3의 설명을 다시 참조하여, 다음에, 이벤트 후보 데이터 생성부(3)의 이벤트 ID?관련 ID 후보 처리부(32)는, 이벤트 ID 및 관련 ID 후보 판정 처리를 실시한다(단계 S9). 이 이벤트 ID 및 관련 ID 후보 판정 처리에 대해서는, 도 16 및 도 17을 이용하여 설명한다.

이벤트 ID?관련 ID 후보 처리부(32)는, 분석 대상 데이터 저장부(1)에 저장되어 있는 해석 대상 테이블 중 미처리의 필드를 하나 특정한다(단계 S51). 그리고 분석 대상 데이터 저장부(1)에 저장되어 있는, 처리 대상 필드의 필드값이, 전체 레코드에서 일의로 되어있는지 판단한다(단계 S53). 처리 대상 필드의 필드값이, 전체 레코드에서 일의로 되어 있지 않는, 즉 값이 중복되어 있는 레코드가 존재하는 경우에는, 단계 S62에 이행한다.

이벤트 ID의 필드는 이벤트의 식별자의 저장 필드이기 때문에, 그 필드값이 서로 중복되지 않는다. 따라서, 처리 대상 필드에 중복되는 값이 존재하면, 그것은 이벤트 ID의 필드가 아니라고 판단할 수 있다.

한편, 처리 대상 필드의 필드값이, 전체 레코드에서 일의인 경우에는, 분석 대상 데이터 저장부(1)에 저장되어 있는, 처리 대상 필드의 필드값에 NULL이 포함되어 있는지 판단한다(단계 S55). 처리 대상 필드의 필드값에 NULL이 포함되어 있는 경우에는, 단계 S62에 이행한다. 이벤트 ID의 필드는 이벤트의 식별자의 저장 필드이기 때문에, 그 필드값이 NULL이라는 것은 있을 수 없다. 처리 대상 필드의 필드값이 전체 레코드에서 일의라고 할 수 없는 경우, 또는 처리 대상 필드의 필드값에 NULL을 포함하는 경우, 분석 대상 데이터 저장부(1)에 저장되어 있는, 처리 대상 필드의 필드값이, NULL을 제외하고 2 이상 있는지 판단한다(단계 S62). 처리 대상 필드의 필드값이, NULL을 제외하고 2 종류 이상 없는 경우에는, 이벤트 ID?관련 ID 후보 판정에 「부정」을 설정하고, 예컨대 메인 메모리 등의 기억장치에 저장한다(단계 S63). 그리고 처리는 단계 S61에 이행한다. 관련 ID는 어느 이벤트가 다른 이벤트의 어느 것에 대응하고 있는지를 나타내는 값이기 때문에, 그 필드값이 NULL을 제외하고 2 이상의 값을 갖지 않는 경우는, 의미가 있는 결과를 얻을 수 없다.

예컨대 도 4의 (b)나 도 9의 (b)와 같은 테이블의 경우, 필드 1과 필드 2와 필드 4에 대해서는 필드값에 중복이 존재하지 않고, 필드 3에 대해서는 필드값에 중복이 존재하지만, NULL 이외의 2 종류 이상의 값을 취하기 때문에, 이벤트 ID?관련 ID 후보 판정에 「부정」은 설정되지 않는다.

또한 도 5의 (b)나 도 10의 (b)와 같은 테이블의 경우, 필드 1과 필드 2에 대해서는, 필드값에 중복이 존재하지 않고, 필드 3 내지 5에 대해서는 중복이 존재하지만, NULL 이외의 2 종류 이상의 값을 취하기 때문에, 이벤트 ID?관련 ID 후보 판정에 「부정」은 설정되지 않는다.

또한 도 6의 (b)나 도 11의 (b)와 같은 테이블의 경우, 필드 1과 필드 2에 대해서는, 필드값에 중복이 존재하지 않고, 필드 3 내지 5에 대해서는 중복이 존재하지만, NULL 이외의 2 종류 이상의 값을 취하기 때문에, 이벤트 ID?관련 ID 후보 판정에 「부정」은 설정되지 않는다.

또한 도 7의 (b)나 도 12의 (b)와 같은 테이블의 경우, 필드 1과 필드 2에 대해서는, 필드값에 중복이 존재하지 않고, 필드 3 및 4에 대해서는 중복이 존재하지만, NULL 이외의 2 종류 이상의 값을 취하기 때문에, 이벤트 ID?관련 ID 후보 판정에 「부정」은 설정되지 않는다.

또한 도 8의 (b)나 도 13의 (b)와 같은 테이블의 경우, 필드 1과 필드 2에 대해서, 필드값에 중복이 존재하지 않기 때문에, 이벤트 ID?관련 ID 후보 판정에 「부정」은 설정되지 않는다.

단계 S55에 있어서 처리 대상 필드의 필드값에 NULL이 포함되어 있지 않다고 판단된 경우, 또는 단계 S62에서 처리 대상 필드의 필드값이, NULL을 제외하고 2 종류 이상값을 갖는다고 판단된 경우에는, 스코어표 저장부(35)에 저장되어 있는 이벤트 ID?관련 ID 후보 정확도 스코어표를 참조하여, 스키마 정보에서의 처리 대상 필드의 해당 데이터 부분, 처리 대상 필드의 필드명을 나타내는 라벨 데이터, 및 처리 대상 필드의 필드값으로부터 정확도를 특정한다(단계 S57). 단, 이벤트 ID?관련 ID 후보 정확도 스코어표에 해당 항목이 존재하지 않는 경우에는, 정확도 스코어 50(%)가 특정되는 것으로 한다.

이벤트 ID?관련 ID 후보 정확도 스코어표의 일례를 도 17에 도시한다. 도 17의 예에서는, 필드의 데이터형이 가변 길이 문자열이면 정확도 스코어는 1(%)로 설정되고, 필드의 데이터형이 실수이면 정확도 스코어는 5(%)로 설정되며, 필드의 데이터형이 정수이면 정확도 스코어는 80(%)로 설정되고, 필드의 데이터형이 고정 길이 문자열이면 정확도 스코어는 70(%)로 설정되며, 필드의 데이터형이 타임스탬프 또는 날짜이면 정확도 스코어는 10(%)로 설정되고, 필드명이 주 키 지정되어 있으면 정확도 스코어는 80(%)로 설정된다. 필드값 또는 필드명의 문자열에 대한 항목은 여기서는 정의되어 있지 않지만, 정의되는 경우도 있다. 필드값에 대한 항목이 정의되는 경우에는 단계 S57에서 참조된다.

예컨대 도 4의 (a)와 같은 스키마 정보의 경우, 필드 1에 대해서는 데이터형이 타임스탬프이기 때문에 정확도 스코어 10(%)로 특정되고, 필드 2에 대해서는 데이터형이 고정 길이 문자열로서 주 키 지정되어 있기 때문에 50%부터의 괴리가 큰 정확도 스코어 80(%)가 채용되며, 필드 3에 대해서는 데이터형이 고정 길이 문자열이기 때문에 정확도 스코어 70(%)로 특정되고, 필드 4에 대해서는 데이터형이 가변 길이 문자열이기 때문에 정확도 스코어 1(%)로 특정된다. 도 9의 (a)와 같은 스키마 정보가 존재하지 않는 예의 경우, 필드 1 내지 필드 4에 대해서, 이벤트 ID?관련 ID 후보 정확도 스코어표에는 이 항목이 존재하지 않기 때문에 정확도 스코어 50(%)가 특정된다.

예컨대 도 5의 (a)와 같은 스키마 정보의 경우, 필드 1에 대해서는 데이터형이 타임스탬프이기 때문에 정확도 스코어 10(%)로 특정되고, 필드 2에 대해서는 데이터형이 고정 길이 문자열로서 주 키 지정되어 있기 때문에 50%부터의 괴리가 큰 정확도 스코어 80(%)가 채용되며, 필드 3 내지 필드 4에 대해서는 데이터형이 고정 길이 문자열이기 때문에 정확도 스코어 70(%)가 특정되고, 필드 5에 대해서는 데이터형이 날짜로 되어 있기 때문에 정확도 스코어 1O(%)가 특정된다. 도 10의 (a)와 같은 스키마 정보가 존재하지 않는 예의 경우, 필드 1 내지 필드 5에 대해서, 이벤트 ID?관련 ID 후보 정확도 스코어표에는 해당 항목이 존재하지 않기 때문에 정확도 스코어 50(%)가 특정된다.

예컨대 도 6의 (a)와 같은 스키마 정보의 경우, 필드 1에 대해서는 데이터형이 타임스탬프이기 때문에 정확도 스코어 10(%)로 특정되고, 필드 2에 대해서는 데이터형이 고정 길이 문자열로서 주 키 지정되어 있기 때문에 50%부터의 괴리가 큰 정확도 스코어 80(%)가 채용되며, 필드 3 내지 필드 5에 대해서는 데이터형이 고정 길이 문자열이기 때문에 정확도 스코어 70(%)가 특정된다. 도 11의 (a)와 같은 스 키마 정보가 존재하지 않는 예의 경우, 필드 1 내지 필드 5에 대해서, 이벤트 ID?관련 ID 후보 정확도 스코어표에는 해당 항목이 존재하지 않기 때문에 정확도 스코어 50(%)가 특정된다.

예컨대 도 7의 (a)와 같은 스키마 정보의 경우, 필드 1에 대해서는 데이터형이 타임스탬프이기 때문에 정확도 스코어 10(%)로 특정되고, 필드 2에 대해서는 데이터형이 고정 길이 문자열으로서 주 키 지정되어 있기 때문에 50%부터의 괴리가 큰 정확도 스코어 80(%)가 채용되며, 필드 3 및 필드 4에 대해서는 데이터형이 고정 길이 문자열이기 때문에 정확도 스코어 70(%)가 특정된다. 도 12의 (a)와 같은 스키마 정보가 존재하지 않는 예의 경우, 필드 1 내지 필드 4에 대해서, 이벤트 ID?관련 ID 후보 정확도 스코어표에는 해당 항목이 존재하지 않기 때문에 정확도 스코어 50(%)가 특정된다.

예컨대 도 8의 (a)와 같은 스키마 정보의 경우, 필드 1에 대해서는 데이터형이 고정 길이 문자열로서 주 키 지정되어 있기 때문에 50%부터의 괴리가 큰 정확도 스코어 80(%)가 채용되고, 필드 2에 대해서는 데이터형이 고정 길이 문자열이기 때문에 정확도 스코어 70(%)가 채용된다. 도 13의 (a)와 같은 스키마 정보가 존재하지 않는 예의 경우, 필드 1 및 2에 대해서, 이벤트 ID?관련 ID 후보 정확도 스코어표에는 해당 항목이 존재하지 않기 때문에 정확도 스코어 50(%)가 특정된다.

그리고, 이벤트 ID?관련 ID 후보 처리부(32)는, 이벤트 ID?관련 ID 후보 판정에, 단계 S57에서 특정된 정확도 스코어를 설정하여, 예컨대 메인 메모리 등의 기억장치에 저장한다(단계 S59).

그 후, 처리 대상 테이블에서 모든 필드에 대해서 처리했는지 판단하고(단계 S61), 미처리의 필드가 존재하는 경우에는 단계 S51에 되돌아간다. 한편, 모든 필드에 대해서 처리한 경우에는 원래의 처리에 되돌아간다.

이와 같이 하면, 이벤트 ID 또는 관련 ID의 개연성이 높은 것에 대해서는 높은 정확도 스코어가 특정되도록 된다. 또한, 이벤트 ID 또는 관련 ID일 가능성이 완전히 없는 것에 대해서는 「부정」이라고 하는 개연성을 나타내는 데이터가 특정된다.

도 3의 설명을 다시 참조하여, 다음에, 이벤트 후보 데이터 생성부(3)의 이벤트명 처리부(34)는, 이벤트명 판정 처리를 실시한다(단계 S13). 이 이벤트명 판정 처리에 대해서는, 도 18 내지 도 20을 이용하여 설명한다.

우선, 이벤트명 처리부(34)는, 타임스탬프 판정 처리의 처리 결과로서 소정의 정확도 스코어 이상으로 타임스탬프의 필드로서 간주할 수 있는 필드의 수를 카운트한다(단계 S91). 예컨대 정확도 스코어 70(%) 이상 등의 임계값을 설정한다. 당연히 「확정」으로 특정되어 있는 필드는 타임스탬프의 필드이다. 위에서 진술한 예에서는 품번 DB를 제외하고, 필드명이 일시인 필드가 타임스탬프의 필드라고 판단되며, 필드수는 「1」이 된다. 품번 DB에서는, 타임스탬프라고 간주할 수 있는 필드는 없기 때문에, 필드수는 「0」이 된다.

그리고, 타임스탬프의 필드수가 0인지 판단한다(단계 S93). 필드수가 0이면, 해석 대상 테이블을 이하의 처리의 대상 외로서 설정한다(단계 S95). 타임스탬프가 없는 테이블(예컨대 품번 DB)은, 업무 프로세스중에 발생하는 이벤트에 대응하고 있는 테이블이 아니라고 판단된다. 그리고 원래의 처리에 되돌아간다.

한편, 타임스탬프의 필드수가 0이 아닌 경우에는, 필드수가 1인지 판단한다(단계 S97). 타임스탬프의 필드수가 1이면, 이벤트명에 테이블명을 설정하고, 예컨대 메인 메모리 등의 기억장치에 저장한다(단계 S99). 위의 예에서는, 수주 DB이면, 이벤트명은 「수주」로 특정되고, 생산 DB이면 이벤트명은 「생산」으로 특정되며, 수배 DB이면 이벤트명은 「수배」로 특정되고, 배송 DB이면 이벤트명은 「배송」으로 특정된다. 그리고 원래의 처리에 되돌아간다.

또한, 타임스탬프의 필드수가 복수인 경우에는, 타임스탬프로 간주된 필드의 필드명을 이벤트명으로 설정하고, 예컨대 메인 메모리 등의 기억장치에 저장한다(단계 S101). 그리고 원래의 처리에 되돌아간다.

예컨대 도 19와 같은 테이블이 처리 대상 테이블인 경우에 단계 S101이 실행된다. 도 19의 예에서는 기표 일시, 승인 일시, 발주 일시, 납품 일시, 검수 일시가 각각 이벤트의 타임스탬프로 간주되는 필드가 되고, 1 레코드에 이벤트가 복수 기록되는 형식으로 되어 있다. 이러한 테이블은 도 20의 (a) 내지 (e)에 도시한 바와 같은 기표 테이블, 승인 테이블, 발주 테이블, 납품 테이블 및 검수 테이블을 하나로 통합한 테이블로 생각할 수 있다. 따라서, 이러한 경우에는 「기표」「승인」「발주」「납품」「검수」가 각각 이벤트명으로서 특정된다.

이상과 같은 처리를 실시함으로써, 업무 프로세스중에 발생하는 이벤트에 대응하고 있는 테이블을 특정하고, 이벤트명을 추출할 수 있게 된다.

도 3의 설명을 다시 참조하여, 다음에 이벤트 후보 데이터 생성부(3)는 판정 결과를 입출력부(11)를 통해 사용자에게 제시한다(단계 S15). 예컨대 도 4의 (a) 및 (b)에 도시한 바와 같은 릴레이셔널 데이터베이스 형식의 수주 DB의 경우에는, 도 21에 도시하는 바와 같은 데이터가 사용자에게 제시된다. 도 21의 예에서는 일시 필드, 수주 번호 필드, 지역 필드, 수주 내용 필드의 각각에 대해, 단계 S7 내지 S13의 판정 결과가 제시되어 있다. 또한, 이벤트명에 대해서는 테이블명이 이벤트명으로 되기 때문에, 모두 「부정」으로 되어 있다. 이것을 보면, 일시 필드가 타임스탬프의 필드에서 「확정」으로 되어 있고, 수주 번호 필드 및 지역 필드가 이벤트 ID 또는 관련 ID일 가능성이 높은 것을 알 수 있다.

또한, 도 9의 (a)에 도시한 CSV 형식의 수주 DB의 경우에는, 도 22에 도시하는 바와 같은 데이터가 사용자에게 제시된다. 도 22의 예에서는, 일시 필드, 수주 번호 필드, 지역 필드, 수주 내용 필드의 각각에 대해, 단계 S7 내지 S13의 판정 결과가 제시되어 있다. 또한, 이벤트명에 대해서는 테이블명이 이벤트명으로 되기 때문에, 모두 「부정」으로 되어 있다. 이것을 보면, 일시 필드가 타임스탬프일 가능성이 높고, 이벤트 ID 또는 관련 ID일 가능성은 어느 필드라도 동등한 것을 알 수 있다.

예컨대, 도 5의 (a) 및 (b)에 도시한 바와 같은 릴레이셔널 데이터베이스 형식의 생산 DB의 경우에는, 도 23에 도시하는 바와 같은 데이터가 사용자에게 제시된다. 도 23의 예에서는 일시 필드, 생산 번호 필드, 수주 번호 필드, 품번 필드, 납기 필드의 각각에 대해, 단계 S7 내지 S13의 판정 결과가 제시되어 있다. 또한 이벤트명에 대해서는 테이블명이 이벤트명으로 되기 때문에, 모두 「부정」으로 되 어 있다. 이것을 보면, 일시 필드가 타임스탬프의 필드에서 「확정」으로 되어 있고, 생산 번호 필드와 수주 번호 필드와 품번 필드가 이벤트 ID 또는 관련 ID일 가능성이 높은 것을 알 수 있다.

또한, 도 10의 (a)에 도시한 CSV 형식의 생산 DB의 경우에는, 도 24에 도시하는 바와 같은 데이터가 사용자에게 제시된다. 도 24의 예에서는 일시 필드, 생산 번호 필드, 수주 번호 필드, 품번 필드, 납기 필드의 각각에 대해, 단계 S7 내지 S13의 판정 결과가 제시되어 있다. 또한, 이벤트명에 대해서는 테이블명이 이벤트명으로 되기 때문에, 모두 「부정」으로 되어 있다. 이것을 보면, 일시 필드가 타임스탬프일 가능성이 높고, 이벤트 ID 또는 관련 ID일 가능성은 어느 필드라도 동등한 것을 알 수 있다.

예컨대, 도 6의 (a) 및 (b)에 도시한 바와 같은 릴레이셔널 데이터베이스 형식의 수배 DB의 경우에는, 도 25에 도시하는 바와 같은 데이터가 사용자에게 제시된다. 도 25의 예에서는 일시 필드, 수배 번호 필드, 수주 번호 필드, 품번 필드, 납품처 필드의 각각에 대해, 단계 S7 내지 S13의 판정 결과가 제시되어 있다. 또한 이벤트명에 대해서는 테이블명이 이벤트명으로 되기 때문에, 모두 「부정」으로 되어 있다. 이것을 보면, 일시 필드가 타임스탬프의 필드에서 「확정」으로 되어 있고, 수배 번호 필드와 수주 번호 필드와 품번 필드와 납품처 필드가 이벤트 ID 또는 관련 ID일 가능성이 높은 것을 알 수 있다.

또한, 도 11의 (a)에 도시한 CSV 형식의 수배 DB의 경우에는, 도 26에 도시하는 바와 같은 데이터가 사용자에게 제시된다. 도 26의 예에서는 일시 필드, 수배 번호 필드, 수주 번호 필드, 품번 필드, 납품처 필드의 각각에 대해, 단계 S7 내지 S13의 판정 결과가 제시되어 있다. 또한, 이벤트명에 대해서는 테이블명이 이벤트명으로 되기 때문에, 모두 「부정」으로 되어 있다. 이것을 보면, 일시 필드가 타임스탬프일 가능성이 높고, 이벤트 ID 또는 관련 ID일 가능성은 어느 필드라도 동등한 것을 알 수 있다.

예컨대 도 7의 (a) 및 (b)에 도시한 바와 같은 릴레이셔널 데이터베이스 형식의 배송 DB의 경우에는, 도 27에 도시하는 바와 같은 데이터가 사용자에게 제시된다. 도 27의 예에서는, 일시 필드, 수배 번호 필드, 배송편 필드, 납품처 필드의 각각에 대해, 단계 S7 내지 S13의 판정 결과가 제시되어 있다. 또한, 이벤트명에 대해서는 테이블명이 이벤트명으로 되기 때문에, 모두 「부정」으로 되어 있다. 이것을 보면, 일시 필드가 타임스탬프의 필드에서 「확정」으로 되어 있고, 수배 번호 필드와 배송편 필드와 납품처 필드가 이벤트 ID 또는 관련 ID일 가능성이 높은 것을 알 수 있다.

또한, 도 12의 (a)에 도시하는 CSV 형식의 배송 DB의 경우에는, 도 28에 도시하는 바와 같은 데이터가 사용자에게 제시된다. 도 28의 예에서는 일시 필드, 수배 번호 필드, 배송편 필드, 납품처 필드의 각각에 대해, 단계 S7 내지 S13의 판정 결과가 제시되어 있다. 또한, 이벤트명에 대해서는 테이블명이 이벤트명으로 되기 때문에, 모두 「부정」으로 되어 있다. 이것을 보면, 일시 필드가 타임스탬프일 가능성이 높고, 이벤트 ID 또는 관련 ID일 가능성은 어느 필드도 동등한 것을 알 수 있다.

예컨대 도 8의 (a) 및 (b)에 도시한 바와 같은 릴레이셔널 데이터베이스 형식의 품번 DB의 경우에는, 도 29에 도시하는 바와 같은 데이터가 사용자에게 제시된다. 도 29의 예에서는, 품번 필드, 품명 필드의 각각에 대해, 단계 S7 내지 S13의 판정 결과가 제시되어 있다. 또한, 품번 DB는 타임스탬프가 없다고 판단되고, 이후의 처리 대상 외로 되어 있기 때문에, 이벤트명에 대해서는 모두 「부정」으로 되어 있다. 이것을 보면, 타임스탬프의 필드가 존재할 가능성이 매우 낮고, 품번 필드와 품명 필드는 이벤트 ID 또는 관련 ID일 가능성이 높은 것을 알 수 있다.

또한, 도 13의 (a)에 도시하는 CSV 형식의 품번 DB의 경우에는, 도 30에 도시한 바와 같은 데이터가 사용자에게 제시된다. 도 30의 예에서는, 품번 필드, 품명 필드의 각각에 대해, 단계 S7 내지 S13의 판정 결과가 제시되어 있다. 또한, 품번 DB는 타임스탬프가 없다고 판단되고, 이후의 처리 대상 외로 되어 있기 때문에, 이벤트명에 대해서는 모두 「부정」으로 되어 있다. 이것을 보면, 타임스탬프의 필드가 존재할 가능성은 매우 낮고, 이벤트 ID 또는 관련 ID일 가능성은 어느 필드라도 동등한 것을 알 수 있다.

도 3의 설명을 다시 참조하여, 단계 S15가 종료하면, 사용자는 입출력부(11)를 통해, 이벤트명, 타임스탬프, 이벤트 ID?관련 ID 후보 등에 대해서 수정 입력 또는 확정 입력을 행하고, 레코드의 복사 등을 행하거나 또는 명하여, 이벤트 후보 데이터를 생성하며, 이벤트 후보 데이터 생성부(3)에 이벤트 후보 데이터 저장부(5)에 저장시킨다(단계 S16). 이 작업은 주로 또는 일부 사용자에 의해 실시되기 때문에, 도 3에서는 점선 블록으로 그려지고 있다. 그리고 처리는 단계 S3에 되돌 아간다.

예컨대 도 21의 판정 결과에 따라서, 도 31에 도시하는 바와 같이 이벤트명에 대해서는 테이블명인 「수주」를 확정시키고, 타임스탬프에 대해서는 일시 필드를 확정시키며, 이벤트 ID?관련 ID 후보에 대해서는 수주 번호 필드 및 지역 필드를 확정시키는 경우, 예컨대 도 32에 도시하는 바와 같은 데이터가, 이벤트 후보 데이터 저장부(5)에 저장된다. 도 32에 도시하는 예에서는, 이벤트명 「수주」가 모든 레코드에 부가되고, 일시 필드의 필드값의 전체 레코드분이 타임스탬프의 필드에 복사되며, 수주 번호 필드 및 지역 필드가 이벤트 ID?관련 ID 후보로서, 필드명과 필드값의 전체 레코드분이 복사된다.

예컨대 도 22의 판정 결과에 따라서, 이벤트명에 대해서는 테이블명인 「수주」를 확정시키고, 타임스탬프에 대해서는 일시 필드를 확정시키며, 이벤트 ID?관련 ID 후보에 대해서는 수주 번호 필드 및 지역 필드 및 수주 내용 필드를 확정시키는 경우, 예컨대 도 33과 같은 데이터가, 이벤트 후보 데이터 저장부(5)에 저장된다.

또한 예컨대 도 23의 판정 결과에 따라서, 이벤트명에 대해서는 테이블명인 「생산」을 확정시키고, 타임스탬프에 대해서는 일시 필드를 확정시키며, 이벤트 ID?관련 ID 후보에 대해서는 생산 번호 필드 및 수주 번호 필드 및 품번 필드를 확정시키는 경우, 예컨대 도 34와 같은 데이터가, 이벤트 후보 데이터 저장부(5)에 저장된다.

또한 예컨대 도 24의 판정 결과에 따라서, 이벤트명에 대해서는 테이블명인 「생산」을 확정시키고, 타임스탬프에 대해서는 일시 필드를 확정시키며, 이벤트 ID?관련 ID 후보에 대해서는 생산 번호 필드 및 수주 번호 필드 및 품번 필드 및 납기 필드를 확정시키는 경우, 예컨대 도 35와 같은 데이터가 이벤트 후보 데이터 저장부(5)에 저장된다.

또한 예컨대 도 25의 판정 결과에 따라서, 이벤트명에 대해서는 테이블명인 「수배」를 확정시키고, 타임스탬프에 대해서는 일시 필드를 확정시키며, 이벤트 ID?관련 ID 후보에 대해서는 수배 번호 필드 및 수주 번호 필드 및 품번 필드 및 납품처 필드를 확정시키는 경우, 예컨대 도 36과 같은 데이터가, 이벤트 후보 데이터 저장부(5)에 저장된다.

또한 예컨대 도 26의 판정 결과에 따라서, 이벤트명에 대해서는 테이블명인 「수배」를 확정시키고, 타임스탬프에 대해서는 일시 필드를 확정시키며, 이벤트 ID?관련 ID 후보에 대해서는 수배 번호 필드 및 수주 번호 필드 및 품번 필드 및 납품처 필드를 확정시키는 경우, 예컨대 도 37과 같은 데이터가, 이벤트 후보 데이터 저장부(5)에 저장된다.

또한 예컨대 도 27의 판정 결과에 따라서, 이벤트명에 대해서는 테이블명인 「배송」을 확정시키고, 타임스탬프에 대해서는 일시 필드를 확정시키며, 이벤트 ID?관련 ID 후보에 관해서는 수배 번호 필드 및 배송편 필드 및 납품처 필드를 확정시키는 경우, 예컨대 도 38과 같은 데이터가, 이벤트 후보 데이터 저장부(5)에 저장된다.

또한 예컨대 도 28의 판정 결과에 따라서, 이벤트명에 대해서는 테이블명인 「배송」을 확정시키고, 타임스탬프에 대해서는 일시 필드를 확정시키며, 이벤트 ID?관련 ID 후보에 대해서는 수배 번호 필드 및 배송편 필드 및 납품처 필드를 확정시키는 경우, 예컨대 도 39와 같은 데이터가, 이벤트 후보 데이터 저장부(5)에 저장된다.

또한, 예컨대 도 19와 같은 테이블 내에 복수의 타임스탬프의 필드가 존재하도록 하는 테이블을 처리 대상으로 하는 경우는, 예컨대 도 40 내지 도 44에 도시하는 바와 같은 데이터가 이벤트 후보 데이터 저장부(5)에 저장된다. 도 40 내지 도 44에 도시하는 예에서는, 타임스탬프로서 확정된 필드인 기표 일시, 승인 일시, 발주 일시, 납품 일시, 검수 일시를 바탕으로, 이들의 필드마다, 각각 이벤트명을 「기표」, 「승인」, 「발주」, 「납품」, 「검수」로 확정시킨 이벤트 후보 데이터를 작성한다. 타임스탬프에 대해서는, 기표 일시 필드, 승인 일시 필드, 발주 일시 필드, 납품 일시 필드, 검수 일시 필드의 필드값의 전체 레코드분이 각각의 이벤트 후보 데이터의 타임스탬프의 필드에 복사된다. 또한 모든 이벤트 후보 데이터 공통으로, 기표 일시 필드, 승인 일시 필드, 발주 일시 필드, 납품 일시 필드, 검수 일시 필드 이외의 필드에 대해서는, 이벤트 ID?관련 ID 후보로서, 필드명과 필드값의 전체 레코드분이 복사된다.

이와 같이 하여 이하의 처리에서 이용하는 이벤트 후보 데이터가 이벤트 후보 데이터 저장부(5)에 저장되게 된다. 이상이 본 실시형태의 주요부이다. 또한, 이하는 후처리가 된다. 후처리에 대해서는 인간이 수동으로 행하여도 좋다.

단계 S3에서 모든 해석 대상 테이블을 처리하였다고 판단된 경우에는, 이벤 트 데이터 생성부(7)는, 이벤트 후보 데이터 저장부(5)에 저장되어 있는 이벤트 후보 데이터를 이용하여, 이벤트 데이터 생성 처리를 실시하고, 처리 결과를 이벤트 데이터 저장부(9)에 저장한다(단계 S17).

수주 이벤트, 생산 이벤트, 수배 이벤트, 배송 이벤트에 대응하여, 각각, 도 32, 도 34, 도 36, 도 38에 도시된 이벤트 후보 데이터의 세트, 또는 각각, 도 33, 도 35, 도 37, 도 39에 도시된 이벤트 후보 데이터의 세트를 이용하여 생성한 이벤트 데이터의 예를 도 45에 도시한다. 그 생성 방법으로서는, 위에서 진술한 일본 특허 출원 2006-197294의 기재와 같은 이벤트 데이터의 관련 정보의 자동 추출 방식을 이용하여도 좋고, 직접 사람이, 각 이벤트 후보 데이터의 이벤트 ID?관련 ID 후보의 필드값의 대응 관계를 조사?분석함으로써, 이벤트간의 관련성을 확정하여도 좋다.

도 45에서는, 수주 이벤트의 이벤트 ID는 수주 번호이고, 생산 이벤트의 이벤트 ID는 생산 번호, 관련 ID는 수주 번호이며, 수배 이벤트의 이벤트 ID는 수배 번호, 관련 ID는 수주 번호이고, 배송 이벤트의 이벤트 ID는 수배 번호, 관련 ID는 배송편인 것이 확정되어 있다. 또한, 생산 이벤트의 관련 ID의 필드값이, 수주 이벤트의 이벤트 ID의 필드값 중 어느 값을 취함으로써, 생산 이벤트의 각각의 레코드(즉 이벤트 인스턴스)가, 수주 이벤트의 어느 레코드(즉 이벤트 인스턴스)와 관련되어 있는지가 특정된다고 하는 이벤트간의 관련성이 확정되어 있다. 같은 관련성이, 수배 이벤트의 관련 ID와 수주 이벤트의 이벤트 ID 사이, 배송 이벤트의 이벤트 ID와 수배 이벤트의 이벤트 ID 사이에 확정되어 있다.

또한, 프로세스 인스턴스 생성부(13)는, 이벤트 데이터 저장부(9)에 저장되어 있는 이벤트 데이터를 이용하여 프로세스 인스턴스 생성 처리를 실시하고, 처리결과를 프로세스 인스턴스 데이터 저장부(15)에 저장한다(단계 S19). 그 생성 방법으로서는, 미국 특허 공개 공보 2005/076059 A1과 같은 업무 프로세스 트래킹 방법 등을 이용할 수 있다.

도 45의 이벤트 데이터를 이용하여, 수주 번호: JT01의 수주 이벤트 인스턴스를 기점으로 하는 프로세스 인스턴스를 생성하는 처리 과정의 개략 설명을 도 46에 도시한다. 처음에, 관련 ID의 필드값이, 수주 이벤트의 이벤트 ID인 수주 번호의 필드값: JT01을 취하는 레코드(즉, 이벤트 인스턴스)로 하여, 생산 이벤트로부터 2개, 수배 이벤트로부터 3개의 이벤트 인스턴스가 확정된다. 다음에, 상기 확정된 수배 이벤트의 이벤트 ID인 수배 번호: TH01, TH02, TH03을 관련 ID의 필드값으로서 취하는 레코드(즉, 이벤트 인스턴스)로 하여, 배송 이벤트로부터 3개의 이벤트 인스턴스가 확정된다. 마지막으로, 상기 확정된, 수주 번호: JT01의 수주 이벤트 인스턴스를 기점으로서, 직접?간접적으로 관련성을 갖는 이벤트 인스턴스를, 그 타임스탬프의 값에 기초하여 시간 경과의 순으로 서로 연결시키는 것에 의해, 프로세스 인스턴스가 생성된다.

마찬가지로 하여, 도 45의 이벤트 데이터를 이용하여, 생성한 전체 프로세스 인스턴스를 도 47에 도시한다.

또한, 프로세스 흐름 생성부(17)는 프로세스 인스턴스 데이터 저장부(15)에 저장되어 있는 데이터를 이용하여 프로세스 흐름 생성 처리를 실시하고, 처리 결과 를 프로세스 흐름 데이터 저장부(19)에 저장한다(단계 S21). 그 생성 방법으로서는, 위에서 진술한 일본 특허 출원 2006-136518의 기재와 같은 업무 모델 생성 프로그램의 처리 방법 등을 이용할 수 있다.

도 47의 전체 프로세스 인스턴스를 중합하여 생성한 프로세스 흐름을 도 48에 도시한다. 도면의 원은 이벤트 클래스(즉, 이벤트 종류)를 도시하고, 화살표는 업무 프로세스 중에서 발생한 이벤트간의 천이를 도시한다.

마지막으로, 프로세스 분석부(21)는, 프로세스 흐름 데이터 저장부(19)에 저장되어 있는 데이터를 이용하여 프로세스 분석 처리를 실시하고, 처리 결과를 분석 결과 저장부(23)에 저장한다(단계 S23). 그 분석 방법으로서는, 위에서 진술한 특허 출원 2006-136518의 기재와 같은 업무 모델 생성 프로그램의 분석 방법 등을 이용할 수 있다.

도 47의 전체 프로세스 인스턴스를 바탕으로, 업무 프로세스를 분석한 예를 도 49에 도시한다. 출현 빈도가 높은 프로세스 인스턴스의 상위로부터 50%의 중합 즉, 도 47의 프로세스 인스턴스의 2번째와 3번째를 중합시킴으로써, 해석 대상의 업무 프로세스의 주요 흐름의 분석을 위한 표시를 행할 수 있다. 또한, 그 주요 흐름 표시에, 예외 흐름으로서, 도 47의 프로세스 인스턴스의 첫번째를 중합시키는 것에 의해, 상정 외의 이벤트간의 천이를 발견하기 위한 표시를 행할 수 있다.

도 49의 표시로부터는, 배송 이벤트로부터 생산 이벤트로의 복귀의 발생을 의심하게 하는 이벤트간의 천이를 발견할 수 있다.

이상과 같은 처리를 실시하여, 입출력부(11)는, 각 처리부의 처리 결과를 사 용자에 대하여 제시한다(단계 S25).

이러한 처리를 실시하는 것에 의해, 사용자는 업무 시스템을 손보지 않고, 그 업무 시스템의 데이터를 복사하는 것만으로 업무 프로세스의 분석을 실시할 수 있게 된다. 또한, 업무 시스템의 데이터는 RDB여도 CSV여도 좋다. 또 다른 형식이어도, 위에서 진술한 바와 같은 기술 사상에 기초하여 대처 가능하다.

또한, 도 3의 처리 흐름에 있어서, 단계 S7 내지 S13에 대해서는 순서의 교체가 가능하고, 또한 병렬로 실시하도록 하여도 좋다.

또한, 판정 결과의 출력에서는, 각 판정 항목에 있어서 「확정」 판정이나 소정의 임계값 이상의 정확도 스코어로 되어 있는 필드를 자동적으로 선택하여 사용자에게 제시하고, 자동 선택할 수 없는 판정 항목에 대해서 사용자에게 선택 또는 입력을 재촉하도록 하여도 좋다.

또한, 처리 대상 필드에 대한 루프는, 단계 S7 내지 S13 내의 각각에서 구성되어 있지만, 단계 S7 내지 S13의 외측에 처리 대상 필드에 대한 루프를 내도록 하여도 좋다.

도 3의 변형예를 도 50에 도시한다. 우선 사용자는, 업무 시스템에서의 해석 대상 테이블을 지정하고, 그 데이터를 복사하여 분석 대상 데이터 저장부(1)에 저장시킨다(도 50: 단계 S111). 사용자의 동작이기 때문에 도 50에서는 점선 블록으로 나타내고 있다. 다음에, 예컨대 이벤트 후보 데이터 생성부(3)는, 모든 해석 대상 테이블에 대해서 처리했는지 판단한다(단계 S113).

미처리의 해석 대상 테이블이 존재하는 경우에는, 예컨대 이벤트 후보 데이 터 생성부(3)는, 미처리의 해석 대상 테이블을 특정한다(단계 S115). 그리고 타임스탬프 처리부(31)는, 타임스탬프 판정 처리를 실시한다(단계 S117). 이 처리는 도 14의 처리 흐름과 같다. 또한 이벤트명 처리부(34)는 이벤트명 판정 처리를 실시한다(단계 S119). 이 처리도 도 18의 처리 흐름과 동일하다. 이와 같이 본 실시형태에서는, 이벤트명 판정 처리의 실시 타이밍을 앞당기고 있다.

그 후, 이벤트 ID?관련 ID 후보 처리부(32)는, 이벤트 ID 및 관련 ID 후보 판정 처리를 실시한다(단계 S121). 이 처리도 도 16의 처리 흐름과 같다.

그리고, 이벤트 후보 데이터 생성부(3)는, 입출력부(11)를 통해 단계 S117 내지 S121의 판정 결과를 사용자에게 제시한다(단계 S125). 제시하는 내용에 대해서도, 위에서 진술한 예와 같다. 단계 S125가 종료하면, 사용자는 입출력부(11)를 통해, 이벤트명, 타임스탬프, 이벤트 ID?관련 ID 후보 등에 대해서 수정 입력 또는 확정 입력을 행하고, 레코드의 복사 등을 행하거나 또는 명하여, 이벤트 후보 데이터를 생성하며, 이벤트 후보 데이터 생성부(3)에 이벤트 후보 데이터 저장부(5)에 저장시킨다(단계 S127). 이 작업은 주 사용자 또는 일부 사용자에 의해 실시되기 때문에, 도 50에서는 점선 블록으로 도시되어 있다. 그리고 처리는 단계 S113에 되돌아간다.

단계 S113에서 모든 해석 대상 테이블을 처리하였다고 판단된 경우에는, 이벤트 데이터 생성부(7)는, 이벤트 후보 데이터 저장부(5)에 저장되어 있는 이벤트 후보 데이터를 이용하여, 이벤트 데이터 생성 처리를 실시하고, 처리 결과를 이벤트 데이터 저장부(9)에 저장한다(단계 S129).

또한, 프로세스 인스턴스 생성부(13)는, 이벤트 데이터 저장부(9)에 저장되어 있는 이벤트 데이터를 이용하여 프로세스 인스턴스 생성 처리를 실시하고, 처리 결과를 프로세스 인스턴스 데이터 저장부(15)에 저장한다(단계 S131).

또한, 프로세스 흐름 생성부(17)는 프로세스 인스턴스 데이터 저장부(15)에 저장되어 있는 데이터를 이용하여 프로세스 흐름 생성 처리를 실시하고, 처리 결과를 프로세스 흐름 데이터 저장부(19)에 저장한다(단계 S133).

마지막으로, 프로세스 분석부(21)는, 프로세스 흐름 데이터 저장부(19)에 저장되어 있는 데이터를 이용하여 프로세스 분석 처리를 실시하고, 처리 결과를 분석 결과 저장부(23)에 저장한다(단계 S135).

이상과 같은 처리를 실시하고, 입출력부(11)는 각 처리부의 처리 결과를 사용자에 대하여 제시한다(단계 S137).

이러한 처리를 실시하는 것에 의해, 사용자는 업무 시스템을 손보지 않고, 원래 업무를 위한 데이터 처리의 결과 및 운용 관리를 위해 기록하고 있는 데이터를 업무 시스템으로부터 수집하는 것만으로 업무 프로세스의 분석을 실시할 수 있게 된다. 또한, 업무 시스템의 데이터는, RDB이어도 CSV여도 좋다. 또 다른 형식이어도, 위에서 진술한 바와 같은 사상에 기초하여 대처 가능하다.

또한, 판정 결과의 출력으로서는, 각 판정 항목에 있어서 「확정」 판정이나 소정의 임계값 이상의 정확도 스코어로 되어 있는 필드를 자동적으로 선택하여 사용자에게 제시하고, 자동 선택할 수 없는 판정 항목에 대해서 사용자에게 선택 또는 입력을 재촉하도록 하여도 좋다.

또한, 처리 대상 필드에 대한 루프는, 단계 S121 내에서 구성되어 있지만, 단계 S121의 외측에 처리 대상 필드에 대한 루프를 내도록 하여도 좋다.

또한, 도 3의 경우도 도 50의 경우도, 자동적으로 이벤트 후보 데이터로부터 이벤트 데이터를 생성하는 것이 아니라(즉 단계 S17 또는 단계 S129를 실시하는 것이 아니라), 사용자가 예컨대 단계 S15 또는 S125의 출력을 베이스로 검토하여, 단계 S16 또는 S127에 있어서, 이벤트 후보 데이터를 경유하지 않고 이벤트 데이터를 생성하도록 하여도 좋다. 즉, ID 사이에 관련이 지어지기까지 사용자가 자기의 스킬을 가지고 지정 입력하고, 이 데이터를 이벤트 데이터 저장부(9)에 저장하도록 하여도 좋다.

이상 본 발명의 일 실시형태에 대해서 설명하였지만, 본 발명은 이것에 한정되는 것이 아니다. 예컨대 도 1에 도시한 기능 블록도는 일례로서, 반드시 실제의 프로그램 모듈에 대응하지 않는다. 또한 각 스코어표도 일례로서, 정확도 스코어값의 설정 방법은, 경험적으로 더 까다롭게 결정되는 경우도 있다. 또한, 스코어표의 항목에 대해서도, 보다 적은 항목이 설정되는 경우도 있으면, 보다 많은 항목이 설정되는 경우도 있다.

또한, 업무 시스템 분석 장치는 컴퓨터 장치로서, 도 51에 도시하는 바와 같이, 메모리(2501)와 CPU(2503)와 하드디스크?드라이브(HDD)(2505)와 표시 장치(2509)에 접속되는 표시 제어부(2507)와 착탈 가능형?디스크(2511)용 드라이브 장치(2513)와 입력 장치(2515)와 네트워크에 접속하기 위한 통신 제어부(2517)가 버스(2519)로 접속되어 있다. 오퍼레이팅?시스템(OS: Operating System) 및 본 실 시예에서의 처리를 실시하기 위한 애플리케이션?프로그램은 HDD(2505)에 저장되어 있고, CPU(2503)에 의해 실행될 때는 HDD(2505)로부터 메모리(2501)에 판독된다. 필요에 따라서 CPU(2503)는, 표시 제어부(2507), 통신 제어부(2517), 드라이브 장치(2513)를 제어하여, 필요한 동작을 하게 한다. 또한 처리 도중의 데이터에 대해서는, 메모리(2501)에 저장되고, 필요가 있으면 HDD(2505)에 저장된다. 본 발명의 실시예에서는, 위에서 진술한 처리를 실시하기 위한 애플리케이션?프로그램은 착탈 가능형?디스크(2511)에 저장되어 반포되고, 드라이브 장치(2513)로부터 HDD(2505)에 인스톨된다. 인터넷 등의 네트워크 및 통신 제어부(2517)를 경유하여, HDD(2505)에 인스톨되는 경우도 있다. 이러한 컴퓨터 장치는 위에서 진술한 CPU(2503), 메모리(2501) 등의 하드웨어와 OS 및 필요한 애플리케이션?프로그램이 유기적으로 협동함으로써, 위에서 진술한 바와 같은 각종 기능을 실현한다.

Claims

데이터 저장부를 갖는 컴퓨터에 의해 실행되는 업무 프로세스 분석을 위한 정보 처리 방법으로서,

상기 컴퓨터와는 다른 해석 대상 시스템에 의해 생성되고 상기 데이터 저장부에 저장되어 있는 레코드에 포함되는 하나 이상의 필드 중 하나의 필드를 처리 대상 필드로 선택하는 단계와,

필드의 필드값이 갖는 특성과, 상기 특성을 갖는 필드값을 포함하는 필드가 이벤트의 타임스탬프인 정확도를 대응시켜 저장하는 표로부터, 상기 처리 대상 필드의 필드값이 갖는 특성에 대응하는 정확도를 특정하는 특정 단계

를 포함하는 정보 처리 방법.
데이터 저장부를 갖는 컴퓨터에 의해 실행되는 업무 프로세스 분석을 위한 정보 처리 방법으로서,

상기 컴퓨터와는 다른 해석 대상 시스템에 의해 생성되고 상기 데이터 저장부에 저장되어 있는 레코드에 포함되는 하나 이상의 필드 중 하나의 필드를 처리 대상 필드로 선택하는 단계와,

상기 처리 대상 필드의 필드값이 모든 레코드에서 일의(一意)이고, 상기 처리 대상 필드의 필드값에 NULL이 포함되어 있지 않는 경우, 필드의 데이터형 또는 필드가 갖는 특성과, 상기 데이터형의 필드 또는 상기 특성을 갖는 필드가 이벤트의 이벤트 ID인 정확도를 대응시켜 저장하는 표로부터, 상기 처리 대상 필드의 데이터형 또는 상기 처리 대상 필드가 갖는 특성에 대응하는 정확도를 특정하는 특정 단계

를 포함하는 정보 처리 방법.
데이터 저장부를 갖는 컴퓨터에 의해 실행되는 업무 프로세스 분석을 위한 정보 처리 방법으로서,

상기 컴퓨터와는 다른 해석 대상 시스템에 의해 생성되고 상기 데이터 저장부에 저장되어 있는 레코드에 포함되는 하나 이상의 필드 중 하나의 필드를 처리 대상 필드로 선택하는 단계와,

상기 처리 대상 필드의 필드값이 NULL을 제외하고 2 이상의 값을 갖는 경우, 필드의 데이터형 또는 필드가 갖는 특성과, 상기 데이터형의 필드 또는 상기 특성을 갖는 필드가 이벤트의 관련 ID인 정확도를 대응시켜 저장하는 표로부터, 상기 처리 대상 필드의 데이터형 또는 상기 처리 대상 필드가 갖는 특성에 대응하는 정확도를 특정하는 특정 단계

를 포함하는 정보 처리 방법.
데이터 저장부를 갖는 컴퓨터에 의해 실행되는 업무 프로세스 분석을 위한 정보 처리 방법으로서,

상기 컴퓨터와는 다른 해석 대상 시스템에 의해 생성되고 상기 데이터 저장부에 저장되어 있는 레코드에서의 각 필드에 대해서, 필드의 데이터형, 필드명에 포함되는 문자열 또는 필드값과, 상기 데이터형의 필드, 상기 문자열을 포함하는 필드명의 필드 또는 상기 필드값의 필드가 이벤트의 타임스탬프인 정확도를 대응시켜 저장하는 표로부터, 상기 처리 대상 필드의 데이터형, 상기 처리 대상 필드의 필드명 또는 상기 처리 대상 필드의 필드값에 대응하는 정확도를 특정하는 특정 단계와,

상기 이벤트의 타임스탬프인 정확도가 미리 결정된 값 이상인 필드 또는 사용자에 의해 타임스탬프라고 지정된 필드를 결정하는 단계와,

결정된 상기 필드의 수가 단수인 경우에는 상기 필드가 포함되는 테이블명을 이벤트명으로서 특정하고, 결정된 상기 필드의 수가 복수인 경우에는 상기 필드의 필드명에 기초하여 이벤트명을 특정하는 이벤트명 결정 단계

를 포함하는 정보 처리 방법.
데이터 저장부를 가지며 업무 프로세스를 분석하기 위한 정보 처리 장치로서,

상기 정보 처리 장치와는 다른 해석 대상 시스템에 의해 생성되고 상기 데이터 저장부에 저장되어 있는 레코드에 포함되는 하나 이상의 필드 중 하나의 필드를 처리 대상 필드로 선택하는 수단과,

필드의 필드값이 갖는 특성과, 상기 특성을 갖는 필드값을 포함하는 필드가 이벤트의 타임스탬프인 정확도를 대응시켜 저장하는 표로부터, 상기 처리 대상 필드의 필드값이 갖는 특성에 대응하는 정확도를 특정하는 특정 수단

을 포함하는 정보 처리 장치.
데이터 저장부를 가지며 업무 프로세스를 분석하기 위한 정보 처리 장치로서,

상기 정보 처리 장치와는 다른 해석 대상 시스템에 의해 생성되고 상기 데이터 저장부에 저장되어 있는 레코드에 포함되는 하나 이상의 필드 중 하나의 필드를 처리 대상 필드로 선택하는 수단와,

상기 처리 대상 필드의 필드값이 모든 레코드에서 일의(一意)이고, 상기 처리 대상 필드의 필드값에 NULL이 포함되어 있지 않는 경우, 필드의 데이터형 또는 필드가 갖는 특성과, 상기 데이터형의 필드 또는 상기 특성을 갖는 필드가 이벤트의 이벤트 ID인 정확도를 대응시켜 저장하는 표로부터, 상기 처리 대상 필드의 데이터형 또는 상기 처리 대상 필드가 갖는 특성에 대응하는 정확도를 특정하는 특정 수단

을 포함하는 정보 처리 장치.
데이터 저장부를 가지며 업무 프로세스를 분석하기 위한 정보 처리 장치로서,

상기 정보 처리 장치와는 다른 해석 대상 시스템에 의해 생성되고 상기 데이터 저장부에 저장되어 있는 레코드에 포함되는 하나 이상의 필드 중 하나의 필드를 처리 대상 필드로 선택하는 수단과,

상기 처리 대상 필드의 필드값이 NULL을 제외하고 2 이상의 값을 갖는 경우, 필드의 데이터형 또는 필드가 갖는 특성과, 상기 데이터형의 필드 또는 상기 특성을 갖는 필드가 이벤트의 관련 ID인 정확도를 대응시켜 저장하는 표로부터, 상기 처리 대상 필드의 데이터형 또는 상기 처리 대상 필드가 갖는 특성에 대응하는 정확도를 특정하는 특정 수단

을 포함하는 정보 처리 장치.
데이터 저장부를 가지며 업무 프로세스를 분석하기 위한 정보 처리 장치로서,

상기 정보 처리 장치와는 다른 해석 대상 시스템에 의해 생성되고 상기 데이터 저장부에 저장되어 있는 레코드에서의 각 필드에 대해서, 필드의 데이터형, 필드명에 포함되는 문자열 또는 필드값과, 상기 데이터형의 필드, 상기 문자열을 포함하는 필드명의 필드 또는 상기 필드값의 필드가 이벤트의 타임스탬프인 정확도를 대응시켜 저장하는 표로부터, 상기 처리 대상 필드의 데이터형, 상기 처리 대상 필드의 필드명 또는 상기 처리 대상 필드의 필드값에 대응하는 정확도를 특정하는 특정 수단과,

상기 이벤트의 타임스탬프인 정확도가 미리 결정된 값 이상인 필드 또는 사용자에 의해 타임스탬프라고 지정된 필드를 결정하는 수단과,

결정된 상기 필드의 수가 단수인 경우에는 상기 필드가 포함되는 테이블명을 이벤트명으로서 특정하고, 결정된 상기 필드의 수가 복수인 경우에는 상기 필드의 필드명에 기초하여 이벤트명을 특정하는 이벤트명 결정 수단

을 포함하는 정보 처리 장치.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제