WO2013061674A1 - 文書ファイル出力装置、文書ファイル出力方法、及びコンピュータプログラム - Google Patents

文書ファイル出力装置、文書ファイル出力方法、及びコンピュータプログラム Download PDF

Info

Publication number
WO2013061674A1
WO2013061674A1 PCT/JP2012/070962 JP2012070962W WO2013061674A1 WO 2013061674 A1 WO2013061674 A1 WO 2013061674A1 JP 2012070962 W JP2012070962 W JP 2012070962W WO 2013061674 A1 WO2013061674 A1 WO 2013061674A1
Authority
WO
WIPO (PCT)
Prior art keywords
document
image data
document file
control unit
file output
Prior art date
Application number
PCT/JP2012/070962
Other languages
English (en)
French (fr)
Inventor
義典 永田
Original Assignee
シャープ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シャープ株式会社 filed Critical シャープ株式会社
Priority to CN201280052797.9A priority Critical patent/CN103907339B/zh
Priority to US14/353,819 priority patent/US9858513B2/en
Publication of WO2013061674A1 publication Critical patent/WO2013061674A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K15/00Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers
    • G06K15/02Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers using printers
    • G06K15/18Conditioning data for presenting it to the physical printing elements
    • G06K15/1894Outputting the image data to the printing elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/333Mode signalling or mode changing; Handshaking therefor
    • H04N1/33307Mode signalling or mode changing; Handshaking therefor prior to start of transmission, input or output of the picture signal only
    • H04N1/33315Mode signalling or mode changing; Handshaking therefor prior to start of transmission, input or output of the picture signal only reading or reproducing mode only, e.g. sheet size, resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3242Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of processing required or performed, e.g. for reproduction or before recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/333Mode signalling or mode changing; Handshaking therefor
    • H04N2201/33307Mode signalling or mode changing; Handshaking therefor of a particular mode
    • H04N2201/33314Mode signalling or mode changing; Handshaking therefor of a particular mode of reading or reproducing mode
    • H04N2201/33321Image or page size, e.g. A3, A4
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/333Mode signalling or mode changing; Handshaking therefor
    • H04N2201/33307Mode signalling or mode changing; Handshaking therefor of a particular mode
    • H04N2201/33378Type or format of data, e.g. colour or B/W, halftone or binary, computer image file or facsimile data

Definitions

  • the present invention relates to a document file output device that reads an image from a printed document and outputs the read image data as a document file.
  • a document file output device capable of appropriately outputting each document as a different file according to a difference in print settings even when a document that should be a different document for each one or a plurality of sheets is continuously read.
  • the present invention relates to a document file output method and a computer program that causes a computer to operate as the document file output apparatus.
  • the image reading device can use the image reading device as image data for documents or figures that have been recorded and stored on paper or cloth media. Processing to read and convert into digital data is performed.
  • the image reading apparatus includes an automatic document conveying device, and automatically reads a plurality of printing media placed on the automatic document conveying device, and continuously reads the image data for each content by a predetermined method.
  • a method of recording as a separate file is employed (Patent Documents 1, 2, etc.).
  • an image processing apparatus disclosed in Patent Document 1 detects a special sheet called a separator from sheets on which a plurality of documents or figures placed on an automatic document feeder of an image reading unit are printed. Save the file before and after the separator as different files.
  • Patent Document 2 extracts the features of the document every time image data is continuously read from the document, and separates and stores the documents when the extracted features change.
  • Document features include character size, character spacing, line spacing, margins, vertical / horizontal writing differences, presence / absence of columns, document orientation differences, character / image area differences, Examples include keywords, continuity of serial numbers, presence / absence of marks, presence / absence of specific colors, presence / absence of special paper (separator), and the like.
  • Patent Document 1 still requires a user to hold a special sheet.
  • Patent Document 2 reads each page as one image data and extracts various features, but does not consider extracting a difference in print settings as a feature.
  • the present invention has been made in view of such circumstances, and even when an original document that should be a different document for each one or a plurality of sheets is continuously read, each document is appropriately selected according to a difference in print settings. It is an object of the present invention to provide a document file output device, a document file output method, and a computer program that causes a computer to operate as the document file output device that can be stored as different files.
  • the document file output apparatus includes means for acquiring image data read continuously from a plurality of originals on which characters or graphics are printed in association with the reading order.
  • the specifying means for specifying the original document print settings of the plurality of image data and the print setting of one document are Determining means for determining whether or not the print setting of the original has changed, and means for outputting image data of the previous or subsequent original as one document file when it is determined that the determining means has changed. It is characterized by providing.
  • the specifying means includes the number of allocated pages included in the original document of each image data, the reduction ratio of the original document, the presence or absence of frame printing in the original document, and the original document in color printing. Whether or not the original document size, embedded image, original document print format, or character string in a specific area in the original document is specified. It is characterized by being.
  • the document file output apparatus is characterized in that the specifying means specifies whether or not the image data matches a specific image pattern stored in advance.
  • the document file output method acquires image data continuously read from a plurality of originals printed with characters or graphics in association with the reading order, and acquires one or a plurality of the acquired plurality of image data.
  • the step of specifying the original document print settings of the plurality of image data, and the print setting of one original is the print setting of the previous or subsequent document
  • a computer program causes a computer to acquire image data continuously read from a plurality of originals on which characters or figures are printed in association with the reading order, and to acquire one of the plurality of acquired image data.
  • the computer includes a specifying step of specifying the original document print settings of the plurality of image data, and a single document print setting before or after A determination step for determining whether or not the print setting has changed compared to the original document print setting, and if it is determined that the determination step has changed, the image data of the previous or subsequent document is output as one document file. And executing a step.
  • the print settings of each document may be specified in the reading order, and image data until the print settings change may be output as a series of one document file.
  • the print settings when the original document of each image data is printed the reduction ratio of the original document, the presence or absence of frame printing in the original document, whether or not the original document is color printing, Any one or more of the size of the original document, the embedded image, the print format of the original document, or the character string in the specific area in the original document is specified.
  • a specific method of print setting for example, for each image data, a pixel value that is a part of a character or a graphic, specifically, for example, an original number of pixels whose pixel value of a predetermined color component is equal to or less than a predetermined value is used.
  • whether or not a specific print setting is made is determined by whether or not each image data matches a specific image pattern. For example, the presence / absence of an embedded image and the contents thereof are specified by pattern matching with a specific embedded image pattern stored in advance. Whether there is a specific print format and whether there are a plurality of specific print formats is also determined by pattern matching with a specific print format pattern stored in advance.
  • the print format pattern is specified by the shape, arrangement and size of the frame.
  • the change when it is determined that the print setting has changed, the change is notified, and the user can recognize the change. It is preferable to accept the approval after the notification. As a result, the user can visually recognize the print settings and output them as separate document files where they should be divided, thereby avoiding unnecessary divisions and erroneous divisions.
  • the document file composed of the image data of the manuscript having the same print setting among the plurality of document files is combined into one document file.
  • each document it is possible to specify the print settings of each document, so that each document can be appropriately saved as a different file according to the difference in the print settings that differ for each document.
  • FIG. 1 is a block diagram illustrating a configuration of a document file output system according to Embodiment 1.
  • FIG. 3 is a functional block diagram illustrating functions implemented by the document file output apparatus according to Embodiment 1.
  • FIG. 4 is a flowchart illustrating an example of a processing procedure performed by a control unit of the document file output apparatus according to the first embodiment.
  • FIG. 6 is an image diagram of a process of dividing image data acquired by the document file output apparatus according to the first embodiment as a document file.
  • 10 is a flowchart illustrating an example of a detailed procedure of print setting specifying processing. It is an image figure of the example of a document by which layout printing is carried out. It is an image figure of the example of a document by which layout printing and frame printing are performed.
  • FIG. 1 is a block diagram illustrating a configuration of a document file output system according to Embodiment 1.
  • FIG. 3 is a functional block diagram illustrating functions implemented by the document file output apparatus according to Embodiment 1.
  • FIG. 6 is an image diagram of an example of a document that is reduced in size.
  • FIG. 10 is a block diagram illustrating a configuration of a document file output system according to a second embodiment.
  • FIG. 6 is a schematic diagram schematically showing a configuration of a document size discrimination mechanism of an automatic document feeder of a reading device according to a second embodiment as viewed from below.
  • FIG. 10 is a functional block diagram illustrating functions realized by the document file output apparatus according to the second embodiment. 10 is a flowchart illustrating an example of a detailed procedure of print setting specifying processing that is further executed.
  • FIG. 3 is an image diagram of an example of a document that is a FAX output. It is an image figure of the example of a document with an embedded image.
  • FIG. 10 is a block diagram illustrating a configuration of a document file output system according to a third embodiment.
  • 15 is a flowchart illustrating an example of a processing procedure performed by a control unit of the document file output apparatus according to the third embodiment.
  • 15 is a flowchart illustrating an example of a processing procedure performed by a control unit of the document file output apparatus according to the third embodiment.
  • FIG. 10 is a block diagram illustrating a configuration of a document file output system according to a fourth embodiment.
  • FIG. 10 is a functional block diagram illustrating functions implemented by the document file output apparatus according to the fourth embodiment.
  • 15 is a flowchart illustrating an example of a processing procedure performed by a control unit of the document file output apparatus according to the fourth embodiment.
  • FIG. 1 is a block diagram illustrating a configuration of a document file output system according to the first embodiment.
  • the document file output system according to the first embodiment includes a document file output device 1, a storage device 2, and a reading device 3.
  • the reading device 3 is a scanner using a CCD (Charge Coupled Device) image sensor or the like.
  • the reading device 3 includes an automatic document conveying device that automatically takes a plurality of sheets of printing paper placed on a document table one by one. When the printing paper is placed on the platen of the automatic document feeder and the reading operation is performed by the user, the reading device 3 takes in all the printing paper placed on the platen one by one and prints each print sheet. Scan an image from one or both sides of the paper.
  • the reading device 3 converts the read image into analog image data or digital image data, and stores the image once in a built-in storage unit in the order of reading or sequentially outputs it to the document file output device 1.
  • the storage device 2 stores the data of the document file output from the document file output device 1 using a storage medium such as a hard disk drive or SSD (Solid State Drive).
  • a storage medium such as a hard disk drive or SSD (Solid State Drive).
  • the document file output device 1 uses a personal computer.
  • the document file output device 1 includes a control unit 10, a storage unit 11, a temporary storage unit 12, an input / output unit 13, a communication unit 14, and a reading unit 15.
  • the control unit 10 functions as a document file output device by reading out and executing the document file output program 1P stored in the storage unit 11 to the temporary storage unit 12 using a CPU (Central Processing Unit).
  • the storage unit 11 uses a hard disk.
  • the storage unit 11 may use an SSD (Solid State Drive), a flash memory, or the like.
  • the storage unit 11 stores the document file output program 1P described above, image data acquired by the communication unit 14, information used by the control unit 10 during calculation, and document file data output by the control unit 10. Is memorized.
  • the temporary storage unit 12 uses a RAM such as SRAM (Static Random Access Memory) or DRAM (Dynamic Random Access Memory).
  • the temporary storage unit 12 temporarily stores information generated by the processing of the control unit 10, for example, pixel data being processed, information extracted from image data, and the like.
  • the input / output unit 13 uses, for example, a USB (Universal Serial Bus) interface.
  • the input / output unit 13 is connected to the storage device 2 and sends the document file data output by the control unit 10 to the storage device 2.
  • the input / output unit 13 may be connected to another reading device that supports USB connection. In this case, the control unit 10 acquires image data from another reading device via the input / output unit 13.
  • the input / output unit 13 is not limited to the USB, and may be connected to an external device such as a storage device or a reading device based on another communication protocol.
  • the communication unit 14 uses, for example, a LAN (Local Area Network) interface.
  • the communication unit 14 transmits and receives information based on a predetermined communication protocol via the LAN.
  • the control unit 10 can receive and acquire the image data transmitted from the reading device 3 via the communication unit 14.
  • the communication unit 14 may be connected to another storage device on the same network having a communication function. In this case, the control unit 10 transmits the data of the document file to be output from the communication unit 14 to another storage device.
  • the reading unit 15 uses a disk drive.
  • the reading unit 15 reads information recorded on the recording medium 4 such as a CD (Compact Disk), a DVD (Digital Versatile Disk), a BD (Blu-Ray (registered trademark) Disk), a flash memory, or a flexible disk.
  • a document file output program 4P is recorded on the recording medium 4 of the present embodiment.
  • the control unit 10 reads information recorded on the recording medium 4 by the reading unit 15 and stores the information in the storage unit 11 or the temporary storage unit 12.
  • the document file output program 1P stored in the storage unit 11 may be a copy of the document file output program 4P read from the recording medium 4.
  • FIG. 2 is a functional block diagram showing functions realized by the document file output apparatus 1 according to the first embodiment.
  • the control unit 10 of the document file output device 1 reads out and executes the document file output program 1P stored in the storage unit 11, thereby executing an image data acquisition unit 16, a print setting specifying unit 17, a division determination unit 18, and a division. It functions as the output unit 19.
  • Each may be realized by hardware as a specific integrated circuit.
  • the control unit 10 acquires a series of image data read from the document by the reading device 3 and output by the function of the image data acquisition unit 16, and temporarily stores the data. 12 or the storage unit 11. Further, the control unit 10 specifies the print setting by processing each image data acquired and stored by the function of the print setting specifying unit 17 in the reading order. The control unit 10 determines whether or not the print setting has been changed by the function of the division determination unit 18 based on the print setting specified for the image data of each document. The control unit 10 stores up to the image data determined to have changed print settings in the storage unit 11 as one document file by the function of the division output unit 19. The document file output device 1 outputs each document file stored in the storage unit 11 from the input / output unit 13 to the storage device 2.
  • FIG. 3 is a flowchart illustrating an example of a processing procedure performed by the control unit 10 of the document file output apparatus 1 according to the first embodiment.
  • the control unit 10 acquires the image data output from the reading device 3 by the function of the image data acquisition unit 16, and stores it in the temporary storage unit 12 or the storage unit 11 (step S101).
  • the control unit 10 assigns 1 to the variable I corresponding to the document reading order by the function of the print setting specifying unit 17 (step S102).
  • control unit 10 determines whether or not there is an I + 1th document (step S105). When it is determined that there is an (I + 1) th document (S105: YES), the control unit 10 reads the image data of the I + 1th document read from the storage unit 11 (step S106). Based on the read image data, the control unit 10 specifies print settings for the (I + 1) th document (step S107).
  • the control unit 10 compares the print setting of the I-th original document already specified by the function of the division determination unit 18 with the print setting of the I + 1-th original document specified in step S107 (step S108). It is determined whether or not there is any change (step S109).
  • step S109 determines that there is a change in print settings by the function of the division determination unit 18 (S109: YES)
  • the document file to which the image data of the I-th original is output by the function of the division output unit 19 Step S110
  • the image data up to the I-th is completed as one document file, the file is closed, and output (step S111).
  • the control unit 10 adds 1 to the variable I (step S112), returns the process to step S105, and repeats until the last document is reached.
  • step S109 If the control unit 10 determines in step S109 that there is no change in print settings (S109: NO), the function of the division output unit 19 writes the image data of the I-th document into the output document file (step S109). S113), the process proceeds to step S112.
  • control unit 10 ends the processing for the image data of all the read originals and determines that there is no (I + 1) th original (S105: NO)
  • the function of the divided output unit 19 causes the image of the Ith original to be read.
  • the data is written in the document file to be output (step S114), the image data of up to the Ith document is completed as one document file, the file is closed and output (step S115), and the process is terminated.
  • FIG. 4 is an image diagram of a process of dividing the image data acquired by the document file output apparatus 1 of the first embodiment as a document file.
  • the upper row shows image data output from the reading device 3 and acquired by the document file output device 1, and the lower row shows an image of the document file divided and output by the document file output device 1.
  • the control unit 10 executes the processing as shown in the flowchart of FIG. 3 to read the acquired image data in the reading order in the order of document 1 ⁇ document 2 ⁇ document 3,.
  • the control unit 10 compares the print settings specified from the image data of each document with the documents 1 and 2, the documents 2 and 3,. Then, for example, when the control unit 10 determines that there is a change as a result of comparing the print setting of the document 2 with the print setting of the document 3, the image data up to the document 2, that is, the image data of the document 1 and the document 2 is set to 1. Output as one document file. By repeatedly performing such processing up to the last document N, the control unit 10 can appropriately divide and output each document file.
  • the document 1 is read in the order of the document 2, the document 3,..., The document N, and the print settings are specified one by one. It was set as the structure to compare.
  • the present invention is not limited to this, and the document N may be processed in the order of the document N-1,.
  • the print settings of all the originals are specified in advance from the acquired image data of all the originals, the number of the originals with the changed print settings is specified, and the document before and after the specified originals.
  • the file may be divided and output.
  • FIG. 5 is a flowchart illustrating an example of a detailed procedure of print setting specifying processing.
  • the control unit 10 checks all the pixels of the read image data by the function of the print setting specifying unit 17 and compares the pixel value with a predetermined value (step S41). At this time, when the image data is composed of pixel values for each of RGB (R: red, G: green, B: blue) components, the control unit 10 sets a value obtained by adding the pixel values of all the color components for each pixel as a predetermined value. Comparison may be performed, or an average value of pixel values of all color components may be compared with a predetermined value. The control unit 10 may separate the image data for each block in advance, separate each block from the white area / gray area / black area, and extract the blocks that are the gray area and the black area.
  • RGB red, G: green, B: blue
  • the control unit 10 compares in step S41, and extracts a pixel whose pixel value is equal to or smaller than a predetermined value, that is, a dark color and on which a character or a graphic is printed (step S42). At this time, the control unit 10 may extract a plurality of pixels for each block as described above.
  • the control unit 10 calculates the distribution of the appearance frequency of the extracted pixels in the vertical and horizontal directions of the image (original) (step S43). That is, the control unit 10 applies the vertical and horizontal directions of the document to the XY coordinates in pixel units, projects the extracted pixel positions in the X-axis direction and the Y-axis direction, and displays a histogram of the number of pixels of the appearance frequency. Obtained as a distribution.
  • the control unit 10 Based on the appearance frequency distribution in each of the vertical and horizontal directions of the image, the control unit 10 shows the appearance of the extracted pixels in each of the regions divided into the center, right, left, top, bottom, top right, bottom right, bottom left, top left, etc.
  • the frequency is calculated (step S44).
  • the range of the area such as the center, right, left, upper, lower, upper right, lower right, lower left, upper left, and the like is determined in advance based on the XY coordinates described above, and the coordinate information is stored in the storage unit 11.
  • the configuration is as follows. Each area
  • the control unit 10 compares the appearance frequencies in the right, left, top, and bottom in the vertical direction and the horizontal direction, respectively, with the appearance frequency in the central part (step S45).
  • the control unit 10 specifies the number of regions whose appearance frequency is higher than that of the central portion (step S46), and specifies the area of each region whose appearance frequency is higher than that of the central portion (step S47).
  • the control unit 10 determines whether the appearance frequency in the central part is higher than a predetermined range (for example, several percent), whether it is higher than the appearance frequency in the central part, or not. What is necessary is just to judge that the appearance frequency is the same or the appearance frequency in the center part is high otherwise.
  • the control unit 10 determines whether or not there is at least two occurrences of bias in the appearance frequency compared to the center portion in the vertical and horizontal directions. Is determined (step S48). When it is determined that there are two or more (S48: YES), the control unit 10 identifies the layout printing (step S49) and identifies the number of layouts (step S50). For example, when the controller 10 determines that there are two deviations in the horizontal direction and one deviation in the vertical direction, the control unit 10 determines that the number of allocation is two, two deviations in the horizontal direction, and two deviations in the vertical direction. In such a case, the number of assignments can be four.
  • step S51 the control unit 10 determines NO in step S48 (S48: NO).
  • step S51 the control unit 10 determines whether or not the size calculated in step S51 is equal to or less than a predetermined value set in advance (step S52).
  • the predetermined value may be stored in the storage unit 11.
  • the control unit 10 specifies that the print is reduced printing (step S53), and advances the processing to the next step S54.
  • step S53 the control unit 10 exceeds the predetermined value (S52: NO)
  • the process proceeds to the next step S54 as it is.
  • the control unit 10 determines whether or not the bias has a frame shape (step S54).
  • the control unit 10 determines that the deviation is in a frame shape when the frequency distribution at a specific coordinate is, for example, three times or more of other regions, or when the frequency of appearance is 80% or more. That's fine. For example, if the appearance frequency at the Yth to Y + 5th positions from the top of the document is 80% or more, it is determined that a ruled line is drawn near the Yth, and the Xth to When the appearance frequency at the X + 5th position is 80% or more, a ruled line is drawn near the Xth position, and it can be determined that the frame is printed.
  • control unit 10 determines that the deviation is frame-shaped (S54: YES)
  • the control unit 10 specifies that the frame printing is performed (step S55). If the control unit 10 determines NO in step S54 (S54: NO), the control unit 10 proceeds to the next step S56.
  • the control unit 10 further compares the RGB values of each pixel with each other (step S56), and determines whether or not the RGB values are comparable within a predetermined error range (step S57). If the control unit 10 determines that the print quality is the same (S57: YES), it specifies monochrome printing (step S58), and if it is determined that the difference exceeds a predetermined error range (S57: NO), color control is performed. The printing is specified (step S59), the process for specifying the print setting is terminated, and the process is returned to the processing procedure shown in the flowchart of FIG. At this time, the control unit 10 may compare the RGB values for each block.
  • FIG. 6 is an image diagram of an example of a document on which layout printing is performed.
  • the upper part of FIG. 6 shows an example of a document including a sentence that has not been assigned print settings, and a lower part of the document that is assigned a print setting.
  • the allocation number is “2”.
  • FIG. 6 is a graph showing the distribution in the vertical direction of the appearance frequency of pixels (pixels on which characters or figures are printed) having pixel values equal to or less than a predetermined value for each document. Each graph shows the position in the vertical direction and the frequency of appearance at each position.
  • the control unit 10 of the document file output apparatus 1 acquires image data obtained by reading a document as shown in the upper part of FIG. 6, the vertical appearance frequency distribution is calculated from the pixel values as shown in the upper left part of FIG. .
  • the control unit 10 compares the appearance frequency of pixels such as characters or graphics in the central portion with the appearance frequencies of the upper and lower portions. In this case, the control unit 10 determines that the appearance frequency in the central part is the same as the appearance frequency in each of the upper part and the lower part, and can determine that there is one bias in the appearance frequency, and specifies that no assignment is set. can do.
  • the control unit 10 of the document file output apparatus 1 acquires image data obtained by reading a document as shown in the lower part of FIG. 6, the distribution of the appearance frequency in the vertical direction from the pixel value is shown on the left side of the lower part of FIG. Calculate as follows.
  • the control unit compares the appearance frequency in the central part with the appearance frequency in each of the upper part and the lower part, and determines that the appearance frequency in each of the upper part and the lower part is higher than the appearance frequency in the central part. It can be determined that there are two. Then, the control unit 10 can specify that the assignment setting has been made, and can specify the number of assignments as “2”.
  • FIG. 7 is an image diagram of an example of a document on which layout printing and frame printing are performed.
  • the upper part of FIG. 7 shows an example of a manuscript including text and figures that have been assigned layout print settings but not frame-printed.
  • the middle section shows an example of a document including text and graphics with layout print settings and frame print settings.
  • the number of allocation is “4”.
  • FIG. 7 is a graph showing the vertical and horizontal distribution of the frequency of pixels (pixels on which characters or graphics are printed) whose pixel value is equal to or less than a predetermined value for each document. Each graph shows the position in the image and the frequency of appearance at each position.
  • the control unit 10 of the document file output apparatus 1 acquires the image data obtained by reading the original as shown in the upper part of FIG. 7, the vertical appearance frequency distribution is calculated from the pixel values as shown in the upper left part of FIG.
  • the horizontal frequency distribution is calculated as indicated by the thin line in the lower graph of FIG.
  • the control unit 10 compares the appearance frequency of pixels such as characters or graphics in the central part, the appearance frequency of the upper part and the lower part, and the appearance frequency on the left side and the right side, respectively. In this case, the control unit 10 determines that the appearance frequency in the upper part and the lower part is higher than the appearance frequency in the central part in the vertical direction as compared with the appearance frequency in the central part.
  • control unit 10 determines that the appearance frequencies on the left and right sides are higher in the horizontal direction than the appearance frequency in the central portion. Therefore, the control unit 10 determines that there are four (2 ⁇ 2) deviations in the appearance frequency. Then, the control unit 10 can specify that the assignment setting has been made, and can specify the number of assignments as “4”. Further, in this case, the control unit 10 determines that the frequency distribution in the Yth to Y + 5th pixels from the top in the vertical direction is higher than that in the other central part from the vertical and horizontal distributions of the appearance frequency. Therefore, it can be determined that the frame printing is not set.
  • the control unit 10 of the document file output apparatus 1 obtains image data obtained by reading a document as shown in the middle part of FIG. 7, the vertical appearance frequency distribution is calculated from the pixel values as shown in the left part of the middle part of FIG. The horizontal frequency distribution is calculated as indicated by the bold line in the lower graph of FIG. In this case as well, the control unit 10 has an appearance frequency at each of the upper, lower, left, and right sides higher than the appearance frequency at the central portion, and the appearance frequency bias is 4 as compared to the appearance frequency at the central portion. Judge that there is. Then, the control unit 10 can specify that the assignment setting has been made, and can specify the number of assignments as “4”.
  • the control unit 10 determines that the frequency distribution at specific coordinates, for example, the Y to Y + 5th pixel from the top in the vertical direction and the Y to Y + 5 pixel from the bottom is different from the distribution of the appearance frequency in the vertical direction. It is determined that it is several times or more than the frequency in the region having a higher frequency than the central portion, or 80% or more.
  • the control unit 10 determines that the frequency distribution at a specific coordinate, for example, the X to X + 5th pixel from the left and the X to X + 5th pixel from the right is higher than the other central part from the appearance frequency distribution in the horizontal direction. It is determined that the frequency is several times or more of the frequency in the high frequency area. Thereby, the control unit 10 can specify that the frame printing is set.
  • FIG. 8 is an image diagram of an example of a document on which reduced printing is performed.
  • the upper part of FIG. 8 shows an example of a document including texts that are normally printed, and the lower part shows an example of a document that includes texts that are set to reduced printing.
  • FIG. 8 is a graph showing the distribution in the vertical and horizontal directions of the frequency of pixels (pixels on which characters or graphics are printed) whose pixel value is equal to or less than a predetermined value for each document. Each graph shows the position in the image and the frequency of appearance at each position.
  • the control unit 10 of the document file output apparatus 1 obtains image data obtained by reading a document as shown in the upper part of FIG. 8, the vertical appearance frequency distribution is calculated from the pixel values as shown in the upper left part of FIG. The horizontal frequency distribution is calculated as indicated by the thin line in the lower graph of FIG.
  • the control unit 10 compares the appearance frequency of pixels such as characters or graphics in the central portion with the appearance frequencies of the upper and lower portions. In this case, the control unit 10 determines that the appearance frequency in the central part is approximately the same as the appearance frequency in each of the upper part and the lower part, and determines that there is one bias in the appearance frequency. Then, the control unit 10 calculates the size of the bias range.
  • control unit 10 specifies a continuous range of distribution in the vertical direction and the horizontal direction as indicated by a broken line, and calculates a size from the specified range in the vertical direction and the horizontal direction. In this case, the control unit 10 determines that the calculated size is not less than or equal to a predetermined value set in advance, and can specify that no special print setting has been made.
  • the control unit 10 of the document file output apparatus 1 obtains image data obtained by reading a document as shown in the lower part of FIG. 8, the vertical appearance frequency distribution is calculated from the pixel values as shown on the left side of the lower part of FIG. The horizontal appearance frequency distribution is calculated as indicated by the bold line in the lower graph of FIG.
  • the control unit 10 determines that the appearance frequency in each of the upper part and the lower part is lower than the appearance frequency in the central part, and determines that there is one bias in the appearance frequency. Then, the control unit 10 calculates the size of the bias range. In this case, the control unit 10 determines that the calculated size is equal to or smaller than a predetermined value set in advance, and can specify that the reduced print setting has been made.
  • the document file output apparatus 1 specifies the print setting of each original document of the image data based on the image data of the plurality of documents acquired from the reading device 3, and changes the print settings. Accordingly, the document file can be appropriately divided and output.
  • the print setting is not limited to the example shown above, and settings such as dark / light or saving printing from the average density of pixel values, or settings for vivid printing from saturation in the case of color printing, etc. A method of specifying various print settings, distinguishing them appropriately, and dividing the document appropriately can also be considered.
  • the document file output apparatus 1 is configured to divide and output image data into document files based only on differences in print settings. However, the document file output apparatus 1 may be configured to calculate the feature value of each document and determine whether or not the image data of each document is a different document file together with the calculated feature value.
  • FIG. 9 is a block diagram showing the configuration of the document file output system of the second embodiment.
  • the document file output system according to the second embodiment includes a document file output device 1b, a storage device 2, and a reading device 30.
  • the configuration of the document file output system according to the second embodiment is the same as the configuration according to the first embodiment except for the print setting specifying method by the document file output device 1b and the function of the reading device 30.
  • the configuration of the reading device 30 is substantially the same as the configuration of the reading device 3 in the first embodiment, except that the automatic document feeder has a mechanism for determining the document size.
  • FIG. 10 is a schematic diagram schematically illustrating a configuration of the document size discrimination mechanism of the automatic document feeder of the reading device 30 according to the second embodiment as viewed from below.
  • the automatic document conveyance device of the reading device 30 includes a control unit 31, a communication unit 32, two conveyance rollers 33, and a plurality of optical sensors 34 arranged in a direction substantially orthogonal to the rotation direction of the conveyance roller 33. Have.
  • the control unit 31 uses MPU (Micro Processing Unit) to control each component.
  • the control unit 31 can detect the rotation speed of the conveyance roller 33 and specify the conveyance speed of the document.
  • the control unit 31 acquires a detection result from each of the plurality of optical sensors 34.
  • the control unit 31 specifies the size of the conveyed document based on the document conveyance speed and the detection result from each optical sensor 34, and stores it in the built-in storage unit together with the image data of the conveyed document, or sequentially communicates.
  • the unit 32 transmits the document file to the document file output device 1b.
  • the communication unit 32 is an interface corresponding to the communication unit 14 of the document file output apparatus 1b.
  • the communication unit 32 transmits and receives information based on a predetermined communication protocol via the LAN.
  • the communication unit 32 can be replaced with an interface such as USB, and the control unit 31 may output image data and the specified document size to the document file output apparatus 1.
  • Each of the plurality of optical sensors 34 includes a light emitting element 35 and a light receiving element 36.
  • the optical sensor 34 causes the light emitting element 35 to emit light, for example, every 30 milliseconds while a document is present on the automatic document feeder, and receives light reflected from the document by the light receiving element 36, and according to the amount of light received.
  • a signal is output to the control unit 31.
  • the control unit 31 specifies on which optical sensor 34 the document being conveyed is present based on the signal obtained from the optical sensor 34, and specifies the width of the document. Further, the control unit 31 calculates the passage time of one document based on a signal at regular intervals from the optical sensor 34, and specifies the length of the document based on the conveyance speed. The control unit 31 specifies the document size based on the width and length of the document, for example, A4, A4 portrait, B5, and the like. The control unit 31 stores the identified result together with the image data read from each document or transmits it from the communication unit 32.
  • the document file output apparatus 1b in the second embodiment uses a personal computer as in the first embodiment, and includes a control unit 10b, a storage unit 11b, a temporary storage unit 12, an input / output unit 13, a communication unit 14, and a reading unit 15. Prepare.
  • the control unit 10b realizes each function described below based on the document file output program 1Pb stored in the storage unit 11b.
  • the storage unit 11b stores image data of an embedded image (background pattern) used for pattern matching described later, and image data of a specific print format.
  • FIG. 11 is a functional block diagram illustrating functions realized by the document file output apparatus 1b according to the second embodiment.
  • the control unit 10b of the document file output apparatus 1b functions as an image data acquisition unit 16, a print setting specification unit 17b, a division determination unit 18, and a division output unit 19.
  • Each may be realized by hardware as a specific integrated circuit. Functions common to the functions in the first embodiment are denoted by the same reference numerals, and detailed description thereof is omitted.
  • the control unit 10b of the document file output apparatus 1b functions as the print setting specifying unit 17b.
  • the control unit 10b uses the image size and pattern matching acquired from the reading device 30.
  • the presence / absence and content of an embedded image (background pattern), the print format such as a specific form format, the presence / absence of a character string printed in a specific area such as the header portion of the document, and the print setting including the content are specified.
  • the control unit 10b executes the processing procedure shown in the flowchart of FIG. 3 as in the first embodiment.
  • the following processing is executed as the print setting specifying processing in steps S104 and S107 in the processing procedure.
  • FIG. 12 is a flowchart illustrating an example of a detailed procedure of print setting specifying processing to be further executed.
  • the control unit 10b specifies the image size acquired corresponding to the read image data by the function of the print setting specifying unit 17b (step S60).
  • the control unit 10b performs OCR (Optical Character Reader) processing on a specific area in the read image data by the function of the print setting specifying unit 17b (step S61).
  • the document file output apparatus 1b may include hardware for performing OCR processing.
  • the control unit 10b performs an OCR process on the header portion when the original is read, and acquires the read character string.
  • the control unit 10b determines whether or not a telephone number has been acquired by OCR processing (step S62). When it is determined that the telephone number has been acquired (S62: YES), the control unit 10b specifies that the original is FAX and the acquired number is the transmission source telephone number (step S63). If the control unit 10b determines that the telephone number could not be acquired in step S62 (S62: NO), the process proceeds to the next step.
  • OCR Optical Character Reader
  • the control unit 10b extracts a specific minute area in the read image data by the function of the print setting specifying unit 17b (step S64).
  • the control unit 10b compares the extracted image of the region with a plurality of embedded image patterns stored in the storage unit 11b (step S65), and determines whether there is a matching pattern (step S66). ). If the control unit 10b determines that it is step S66 (S66: YES), the control unit 10b specifies that there is an embedded image in association with the information for identifying the matching image pattern (step S67), and advances the processing to step S70.
  • Control part 10b judges whether it performed more than a predetermined number of times, when it judges that it does not correspond in Step S66 (S66: NO) (Step S68).
  • Step S68 determines that the number is less than the predetermined number of times (S68: NO)
  • the control unit 10b shifts the micro area to be extracted by a predetermined pixel (step S69), returns the process to step S64, and performs the processes of steps S65 to S69. repeat.
  • the control unit 10b has performed the predetermined number of times or more in step S68 (S68: YES)
  • the process proceeds to the next step S70. In this case, it is specified that there is no embedded image (background pattern) in the document.
  • the control unit 10b performs edge processing on the read image data (step S70), and compares the image of the image data after the edge processing with a plurality of patterns corresponding to a specific print format stored in the storage unit 11b. (Step S71), it is determined whether or not there is a matching pattern (step S72). If the control unit 10b determines that there is a matching pattern in step S72 (S72: YES), the control unit 10b specifies a specific print format in association with the information for identifying the matching image pattern (step S73), and sets the print settings. The process to specify is complete
  • a process of dividing and outputting a document file by the document file output device 1b will be described with a specific example.
  • control unit 10b determines that the print setting has changed when the document size specified next differs from the previous document size by the function of the division determination unit 18, and the image of the document until the document size changes.
  • the data is completed as one document file.
  • FIG. 13 is an image diagram of an example of a manuscript that is a FAX output. As shown in FIG. 13, depending on the setting, the telephone number (FAX number) of the transmission source is printed on the header portion (indicated by hatching in the figure) of the document that has been faxed.
  • the telephone number (FAX number) of the transmission source is printed on the header portion (indicated by hatching in the figure) of the document that has been faxed.
  • control unit 10b of the document file output device 1b acquires image data obtained by reading a document as shown in FIG. 13, it can acquire a telephone number by OCR processing.
  • the control unit 10b specifies that the original document is a FAX output, and specifies the acquired telephone number as information for identifying the other document.
  • the control unit 10b uses the function of the division determination unit 18 to change the print setting when the next specified original print setting is not FAX output. Is determined. Alternatively, the control unit 10b determines that there is a change in the print setting when the acquired telephone number (FAX number) is different even in the case of FAX output. Then, the control unit 10b completes one document file with the image data up to the original as shown in FIG.
  • FIG. 14 is an image diagram of an example of a document with an embedded image.
  • an image forming apparatus capable of embedding an image can superimpose a specific image so as to be scattered in a plurality of locations of a document according to print settings.
  • the position of the embedded image may be an arbitrary position or may be set so as to be embedded at a specific location.
  • control unit 10b of the document file output apparatus 1b acquires image data obtained by reading a document as shown in FIG. 14, the control unit 10b starts from a specific position (for example, the lower left corner of the image) of the image data to a specific size (for example, 32). A region of ( ⁇ 32 pixels) is extracted, and pattern matching processing with a plurality of embedded image patterns stored in the storage unit 11b is performed. When determining that the pattern does not match the stored pattern, the control unit 10b performs pattern matching processing while shifting the region at a predetermined interval, for example, by shifting the pixel by 5 pixels to the right in the horizontal direction.
  • the control unit 10b When there is a matching pattern in any of the image patterns stored in the storage unit 11b by pattern matching, the control unit 10b specifies that the print setting includes image embedding and the matched image Pattern identification information (for example, serial number or pattern name) is specified as information for identifying another document. The control unit 10b determines that there is no image embedding when there is no matching pattern by pattern matching.
  • the matched image Pattern identification information for example, serial number or pattern name
  • the control unit 10b uses the function of the division determination unit 18 to set the print setting when the next specified original print setting is “no image embedding”. It is determined that there is a change. Alternatively, the control unit 10b determines that there is a change in the print setting when the pattern of the matched image is different even if the image is embedded. Then, the control unit 10b completes the original document data up to the original as shown in FIG. 14 as one document file.
  • FIG. 15 is an image diagram of an example of a document printed in a specific print format.
  • the frame is printed with a specific layout as shown in FIG.
  • the frame processing is specified by performing edge processing or extraction of pixels that are black, and stores it in the storage unit 11b.
  • Pattern matching processing is performed with a plurality of frame patterns corresponding to a specific print format stored.
  • the control unit 10b specifies that the print setting has a specific format, and also identifies identification information (for example, a serial number or a matching format). Format name) is specified as information for distinguishing it from other documents.
  • the control unit 10b determines that the print format is not a specific print format when there is no matching pattern by pattern matching.
  • the control unit 10b determines that the print setting of the next specified original is not a specific print format by the function of the division determination unit 18. It is determined that there is a change in print settings. Alternatively, even when the control unit 10b determines that the print format is a specific print format, the control unit 10b determines that there is a change in print settings if the patterns of the matched formats are different. Then, the control unit 10b completes the original document data up to the original as shown in FIG. 15 as one document file.
  • the document file output apparatus 1b specifies the print setting of each original document of the image data based on the image data of the plurality of documents acquired from the reading device 30, changes the document size, and the like.
  • the document file can be appropriately divided and output in accordance with the change in the print setting.
  • the document file output apparatus 1c is configured to notify the user when it is determined that the print setting has changed.
  • FIG. 16 is a block diagram illustrating a configuration of the document file output system according to the third embodiment.
  • the document file output system according to the third embodiment includes a document file output device 1c, a storage device 2, a reading device 3, and a server device 5.
  • the configuration of the document file output system in the third embodiment is the same as the configuration in the first embodiment except that notification processing by the document file output device 1c is added. Detailed description will be omitted.
  • the server device 5 has a mail server function and a Web server function.
  • the server device 5 receives a notification as described later from the document file output device 1c, the server device 5 can send and receive mail or create a Web page in response to the received notification.
  • the server device 5 acquires input information through a UI (User Interface) on a Web page created in response to a notification from the document file output device 1c, the server device 5 transmits the acquired information to the document file output device 1c.
  • UI User Interface
  • the mail server function and the Web server function of the server device 5 may be provided in the document file output device 1c.
  • the document file output device 1c in the third embodiment uses a personal computer as in the first embodiment, and includes a control unit 10c, a storage unit 11c, a temporary storage unit 12, an input / output unit 13, a communication unit 14, a reading unit 15, and A display unit 20 is provided. Based on the document file output program 1Pc stored in the storage unit 11c, the control unit 10c executes processes described below.
  • the display unit 20 is a monitor of the document file output device 1c using a liquid crystal panel, for example.
  • a UI screen is displayed based on an instruction from the control unit 10c.
  • the document file output device 1 c can communicate with the server device 5 via the communication unit 14.
  • the control unit 10c can send the mail created by the communication unit 14 to the server device 5 and notify it to be sent to the destination. Further, the control unit 10c can connect to the server device 5 through the communication unit 14, can make a notification requesting creation of a Web page, and can receive input information from the server device 5 to the Web page. is there.
  • FIGS. 17 and 18 are flowcharts illustrating an example of a processing procedure performed by the control unit 10c of the document file output apparatus 1c according to the third embodiment.
  • the same steps as those shown in the flowchart of FIG. 3 in the first embodiment are denoted by the same step numbers, and detailed description thereof is omitted.
  • the control unit 10c of the document file output device 1c functions as an image data acquisition unit 16 and a print setting specifying unit 17, specifies print settings for image data acquired from the reading device 3 one by one, and prints before and after. Processing for comparing the settings is performed (S101 to S108).
  • the mail destination at this time may be a specific address stored in the storage unit 11c or a corresponding address obtained from authentication information of a user who has performed reading by the reading device 3 or the like.
  • the control unit 10c transmits the created mail to the server apparatus 5 and transmits it to the destination terminal apparatus by the mail server function.
  • the control unit 10c requests the Web server function of the server apparatus 5 to create a Web page to which a UI screen for confirmation and image data of a confirmation original are attached as means for notifying the user.
  • the control part 10c notifies a user of the address information for accessing the produced web page by the function of a mail or a messenger.
  • the control unit 10c determines whether or not a file division instruction has been received as a response to the notification to the user (step S122). Specifically, the control unit 10c determines whether or not a division instruction has been received depending on whether or not a division instruction input button on the UI screen displayed on the display unit 20 has been pressed by an input device such as a keyboard or a mouse (not shown). to decide. Alternatively, when transmitting a mail, the control unit 10c may determine whether or not a reply indicating a division instruction for the transmitted mail has been received. Further, the control unit 10c may determine whether or not a division instruction has been received based on information input on the UI screen of the Web page created by the Web server function of the server device 5.
  • step S122 For the first time when the control unit 10c determines that a division instruction has been received in step S122 (S122: YES), the image data of the I-th original is written in the output document file (S110), and the image data up to the I-th is obtained.
  • the file is completed as one document file, the file is closed and output (S111).
  • step S122 the control unit 10c writes the image data of the I-th document in the output document file by the function of the division output unit 19 (S113). Then, the process proceeds to step S112. At this time, the control unit 10c determines that the division instruction on the UI screen displayed on the display unit 20 is not received when a button to be rejected is pressed by an input device such as a keyboard or a mouse (not shown). To do. Alternatively, the control unit 10c may determine that the division instruction has not been received when the pressing of the input button for the division instruction is not detected even after a predetermined time (for example, 1 minute) has elapsed. Further, the control unit 10c may determine that the division instruction has not been received when the reply to the transmitted mail has not elapsed for a predetermined time, or when there is no access to the Web page or input information.
  • a predetermined time for example, 1 minute
  • the control unit 10c determines that there is a change in the print setting, the control unit 10c notifies the user of a division instruction for confirmation, thereby dividing the file by mistake. Can be prevented.
  • the document file output apparatus 1c is visually recognized by the user and the print settings are changed so that the document file is output as a separate document file where it should be divided, thereby avoiding unnecessary division or erroneous division. .
  • the document file output device 1d is configured to combine document files having the same print settings when the number of output document files is large.
  • FIG. 19 is a block diagram illustrating a configuration of the document file output system according to the fourth embodiment.
  • the document file output system according to the fourth embodiment includes a document file output device 1d, a storage device 2, and a reading device 3.
  • the configuration of the document file output system according to the fourth embodiment is the same as the configuration according to the first embodiment except that the document file combining process by the document file output device 1d is added. Detailed description will be omitted.
  • the document file output device 1d uses a personal computer as in the first embodiment, and includes a control unit 10d, a storage unit 11d, a temporary storage unit 12, an input / output unit 13, a communication unit 14, and a reading unit 15.
  • the control unit 10d realizes functions to be described later based on the document file output program 1Pd stored in the storage unit 11d.
  • FIG. 20 is a functional block diagram illustrating functions realized by the document file output apparatus 1d according to the fourth embodiment.
  • the control unit 10d of the document file output apparatus 1d according to the fourth embodiment reads and executes the document file output program 1Pd stored in the storage unit 11d, so that the image data acquisition unit 16, as in the first embodiment, It functions as the print setting specifying unit 17, the division determination unit 18, and the division output unit 19 d and also functions as the file combination unit 21.
  • Each may be realized by hardware as a specific integrated circuit.
  • the control unit 10d functions as the division output unit 19d to identify the print setting that is determined to have changed when the document file is divided when the divided file is stored in the storage unit 11d as one document file. Both pieces of information to be stored are stored in the storage unit 11d. Then, the control unit 10d functions as the file combination unit 21 to partially combine the document files output by the function of the divided output unit 19 based on the print setting identification information stored in the storage unit 11d.
  • the document file output device 1 d outputs each document file after division and part combination from the input / output unit 13 to the storage device 2.
  • FIG. 21 is a flowchart illustrating an example of a processing procedure performed by the control unit 10d of the document file output apparatus 1d according to the fourth embodiment.
  • the same steps as those shown in the flowchart of FIG. 3 in the first embodiment are denoted by the same step numbers, and detailed description thereof is omitted.
  • the control unit 10d of the document file output device 1d functions as an image data acquisition unit 16, a print setting specifying unit 17, and a division determination unit 18, and sets print settings one by one for the image data acquired from the reading device 3.
  • a process for comparing the print settings before and after is performed, and if it is determined that there is a change in the print settings, the document file is divided and output (S101 to S115).
  • control unit 10d of the document file output device 1d uses the function of the division output unit 19d to output the print setting specified for the I-th original in step S107 when outputting the document file in steps S111 and S115. And stored in the storage unit 11d in association with the document file to be output.
  • control unit 10d performs the document file dividing process by the function of the file combining unit 21, and then determines whether there are three or more output document files stored in the storage unit 11d ( Step S116). Note that the number of document files at this time is not limited to three, and may be four or more.
  • control unit 10d determines that there are three or more document files (S116: YES).
  • the control unit 10d reads print setting identification information stored in association with each document file (step S117). Based on the read print setting identification information, the control unit 10d determines whether there is a print setting that is the same or of the same type and that matches (step S118). If the control unit 10d determines that there is a matching print setting (S118: YES), the control unit 10d combines the document files in which the matching print settings are stored in association with each other in the order of the output serial numbers (step S119). Then, the process is terminated as it is.
  • control unit 10d determines that the number of document files is two or less (S116: NO). If the control unit 10d determines that there is no matching print setting in step S118 (S118: NO), the control unit 10d ends the processing without performing the combination.
  • the control unit 10d performs a process of combining document files having matching print settings, so that, for example, image data of a document that has been allocated and printed in four can be obtained. Output as one document file. Further, the image data of the original in the same form format is output as one document file. As a result, it is possible to combine original data with the same print settings scattered in a plurality of read originals into one, and to avoid unnecessary output of a large number of document files.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimiles In General (AREA)
  • Record Information Processing For Printing (AREA)

Abstract

 1又は複数枚毎に異なる文書であるはずの原稿を連続して読み取らせた場合でも、印刷設定の違いに応じて各文書を適切に異なるファイルとして保存することができる文書ファイル出力装置、文書ファイル出力方法及びコンピュータを前記文書ファイル出力装置として動作させるコンピュータプログラムを提供する。 文書ファイル出力装置は、取得した画像データから各原稿の印刷設定、例えば割り付け、原稿サイズの違い、枠組印刷の有無、縮小印刷の有無、カラー/モノクロ設定、又は画像埋め込みなどを夫々特定し、印刷設定が変化した原稿の前後で文書ファイルを分割して出力する。

Description

文書ファイル出力装置、文書ファイル出力方法、及びコンピュータプログラム
 本発明は、印刷された原稿から画像を読み取り、読み取った画像のデータを文書ファイルとして出力する文書ファイル出力装置に関する。特に、1又は複数枚毎に異なる文書であるはずの原稿を連続して読み取らせた場合でも、印刷設定の違いに応じて各文書を適切に異なるファイルとして出力することができる文書ファイル出力装置、文書ファイル出力方法、及びコンピュータを前記文書ファイル出力装置として動作させるコンピュータプログラムに関する。
 昨今では、文書又は図形はデジタルデータで作成・記録され、必要とされる場面でのみ紙又は布などの媒体に印刷されて利用されることが一般的である。電子的記録媒体への記録により、紙、布等の資源の節約、且つ膨大な情報量に対する省スペース化が図られる。
 特に、昨今の画像読取技術並びに印刷技術の再現性向上、及び記録媒体の小型化により、従来から紙又は布媒体に記録されて保管されていた文書又は図形等を、画像読取装置が画像データとして読み取ってデジタルデータ化する処理が行なわれる。
 画像読取装置は自動原稿搬送装置を備え、自動原稿搬送装置に載置された複数の印刷用媒体を自動的に連続して読み取り、且つ、連続的に読み取った画像データを所定の方法で内容毎に、別ファイルとして記録する方法が採られている(特許文献1、2等)。
 これによりユーザは、異なる文書又は図形毎に、読み取りを実行させる別作業を行なう必要がない。ユーザは、異なる文書又は図形が印刷された印刷用媒体をまとめて画像読取装置の自動原稿搬送装置に載置し、読み取りを実行させる作業を一度で済ませたとしても、個々の文書又は図形を、異なるファイルとしてデジタルデータ化することができる。
 例えば、特許文献1に開示されている画像処理装置は、画像読取部の自動原稿搬送装置に載置された複数の文書又は図形が夫々印刷された用紙から、セパレータと呼ばれる特殊な用紙を検出し、セパレータの前後を異なるファイルとして保存する。
 また、特許文献2に開示されている画像読取装置は、連続的に原稿から画像データを読み取る都度、原稿の特徴を抽出し、抽出した特徴が変化したときに文書を区切って蓄積する。原稿の特徴として、文字の大きさ、文字間隔、行間隔、マージン、縦書き/横書きの差異、段組の有無、原稿の向きの差異、文字領域/画像領域の差異、原稿上に記載されたキーワード、通し番号の連続性、マークの有無、特定色の有無、又は、専用紙(セパレータ)の有無、などが挙げられている。
特開2010-198257号公報 特開2000-354144号公報
 しかしながら、特許文献1及び2に開示されている技術を用いた場合でも、ユーザの作業負担を減らすには不十分なときがある。
 特許文献1の画像処理装置は、依然として、ユーザによる特殊な用紙を挟む作業を必要とする。
 昨今では、印刷の際の機能が向上しており、印刷時点で複数のページ分の原稿を1枚の印刷用媒体にレイアウトして出力するなどの設定での印刷が可能である。更に、元の文書がカラーであってもモノクロ設定での印刷も可能である。特許文献2の画像読取装置は、各ページを1つの画像データとして読み取って種々の特徴を抽出するが、印刷設定の違いを特徴として抽出することは考慮されていない。
 本発明は斯かる事情に鑑みてなされたものであり、1又は複数枚毎に異なる文書であるはずの原稿を連続して読み取らせた場合でも、印刷設定の違いに応じて各文書を適切に異なるファイルとして保存することができる文書ファイル出力装置、文書ファイル出力方法及びコンピュータを前記文書ファイル出力装置として動作させるコンピュータプログラムを提供することを目的とする。
 本発明に係る文書ファイル出力装置は、文字又は図形が印刷された複数の原稿から連続して読み取られる画像データを、読み取り順と対応付けて取得する手段を備え、取得した複数の画像データを1つ又は複数ずつ分割し、各々文書ファイルとして出力する文書ファイル出力装置において、前記複数の画像データの元の原稿の印刷設定を特定する特定手段と、1つの原稿の印刷設定が、前又は後の原稿の印刷設定と比して変化したか否かを判定する判定手段と、該判定手段が変化したと判定した場合に、前又は後の原稿の画像データまでを1つの文書ファイルとして出力する手段とを備えることを特徴とする。
 本発明に係る文書ファイル出力装置は、前記特定手段は、各画像データの元の原稿が含む割り付けページ数、元の原稿の縮小率、元の原稿における枠組印刷の有無、元の原稿がカラー印刷であるか否か、元の原稿のサイズ、埋め込み画像、元の原稿の印刷フォーマット、又は、元の原稿内の特定領域内の文字列の内のいずれか1つ又は複数を特定するようにしてあることを特徴とする。
 本発明に係る文書ファイル出力装置は、前記特定手段は、画像データと予め記憶してある特定の画像パターンとが符合するか否かにより特定するようにしてあることを特徴とする。
 本発明に係る文書ファイル出力方法は、文字又は図形が印刷された複数の原稿から連続して読み取られる画像データを、読み取り順と対応付けて取得し、取得した複数の画像データを1つ又は複数ずつ分割し、各々文書ファイルとして出力する文書ファイル出力方法において、前記複数の画像データの元の原稿の印刷設定を特定するステップと、1つの原稿の印刷設定が、前又は後の原稿の印刷設定と比して変化したか否かを判定する判定ステップと、該判定ステップが変化したと判定した場合に、前又は後の原稿の画像データまでを1つの文書ファイルとして出力するステップとを含むことを特徴とする。
 本発明に係るコンピュータプログラムは、コンピュータに、文字又は図形が印刷された複数の原稿から連続して読み取られる画像データを、読み取り順と対応付けて取得させ、取得された複数の画像データを1つ又は複数ずつ分割させて各々文書ファイルとして出力させるコンピュータプログラムにおいて、前記コンピュータに、前記複数の画像データの元の原稿の印刷設定を特定する特定ステップと、1つの原稿の印刷設定が、前又は後の原稿の印刷設定と比して変化したか否かを判定する判定ステップと、該判定ステップが変化したと判定した場合に、前又は後の原稿の画像データまでを1つの文書ファイルとして出力するステップとを実行させることを特徴とする。
 本発明では、原稿を連続的に読み取って得られた複数の画像データ夫々について、元の原稿の印刷設定が夫々特定され、印刷設定が変化したと判定された場合に、変化した前後の画像データは、異なる文書ファイルであるとして分割され、文書ファイルとして出力される。なお、本発明では各原稿の印刷設定が読み取り順に特定され、印刷設定が変化するまでの画像データが一連の1つの文書ファイルとして出力されるようにしてもよい。
 本発明では、各画像データの元の原稿が印刷されたときの印刷設定として、元の原稿の縮小率、元の原稿における枠組印刷の有無、元の原稿がカラー印刷であるか否か、元の原稿のサイズ、埋め込み画像、元の原稿の印刷フォーマット、又は、元の原稿内の特定領域内の文字列の内のいずれか1つ又は複数が特定される。
 印刷設定の特定の方法としては例えば、各画像データについて、文字又は図形の一部である画素値、具体的には例えば所定の色成分の画素値が所定値以下である画素数の、元の原稿上における出現頻度の分布を取得し、出現頻度の平面的な特徴から印刷設定を特定する方法がある。例えば、中央、左右、上下、右上、左上、右下、左下等の位置夫々における頻度が比較され、中央部よりも左、右の頻度が高い場合には2ページ分の割り付け印刷、特定の位置の頻度が高い場合には枠組印刷、更に枠組の形状が特殊なパターンであるか否かによって特定の印刷フォーマットであるか否かを推定することが可能となる。また、中央部よりも高頻度である箇所の範囲の大きさが特定の大きさよりも小さい場合には縮小印刷、又は、特定の色成分の頻度が高い範囲がある場合はカラー印刷など、印刷設定を推定することが可能となる。
 また本発明では、各画像データについて特定の画像パターンと符合するか否かによって特定の印刷設定であるか否かが特定される。例えば、埋め込み画像の有無及びその内容の特定は、予め記憶してある特定の埋め込み画像のパターンとのパターンマッチングにより行なわれる。特定の印刷フォーマットであるか否か、及び特定の印刷フォーマットが複数ある場合にいずれであるかの特定についても、予め記憶してある特定の印刷フォーマットパターンとのパターンマッチングにより行なわれる。印刷フォーマットのパターンは、枠組の形、配置及び大きさから特定される。
 本発明では、印刷設定が変化したと判定された場合に、変化したことが通知され、ユーザが変化を認識することが可能となる。通知の上、更に承認を受け付ける構成とすることが好ましい。これにより、ユーザが視認して本当に印刷設定が変化し、分割されるべきところで別の文書ファイルとして出力され、不要な分割や誤った分割を回避することが可能である。
 本発明では、複数の文書ファイルが出力される場合、複数の文書ファイルの内の符合する印刷設定の原稿の画像データからなる文書ファイルは、1つの文書ファイルに結合される。これにより、読み取られる複数の原稿に散在する同一の印刷設定の原稿データを1つにまとめ、不要に多数の文書ファイルが出力されることを回避することが可能である。
 本発明による場合、各原稿の印刷設定を特定することが可能なので、文書毎に異なる印刷設定の違いに応じて各文書を適切に、異なるファイルとして保存することができる。
実施の形態1の文書ファイル出力システムの構成を示すブロック図である。 実施の形態1の文書ファイル出力装置で実現される機能を示す機能ブロック図である。 実施の形態1の文書ファイル出力装置の制御部が行なう処理手順の一例を示すフローチャートである。 実施の形態1の文書ファイル出力装置が取得した画像データを文書ファイルとして分割する処理のイメージ図である。 印刷設定の特定処理の詳細な手順の一例を示すフローチャートである。 割り付け印刷がされている原稿例のイメージ図である。 割り付け印刷及び枠組印刷がされている原稿例のイメージ図である。 縮小印刷がされている原稿例のイメージ図である。 実施の形態2の文書ファイル出力システムの構成を示すブロック図である。 実施の形態2における読取装置の自動原稿搬送装置の原稿サイズ判別機構を下方から見た構成を模式的に示す模式図である。 実施の形態2の文書ファイル出力装置で実現される機能を示す機能ブロック図である。 更に実行される印刷設定の特定処理の詳細な手順の一例を示すフローチャートである。 FAX出力である原稿例のイメージ図である。 埋め込み画像有りの原稿例のイメージ図である。 特定の印刷フォーマットで印刷された原稿例のイメージ図である。 実施の形態3の文書ファイル出力システムの構成を示すブロック図である。 実施の形態3の文書ファイル出力装置の制御部が行なう処理手順の一例を示すフローチャートである。 実施の形態3の文書ファイル出力装置の制御部が行なう処理手順の一例を示すフローチャートである。 実施の形態4の文書ファイル出力システムの構成を示すブロック図である。 実施の形態4の文書ファイル出力装置で実現される機能を示す機能ブロック図である。 実施の形態4の文書ファイル出力装置の制御部が行なう処理手順の一例を示すフローチャートである。
 以下本発明をその実施の形態を示す図面に基づき具体的に説明する。
 (実施の形態1)
 図1は、実施の形態1の文書ファイル出力システムの構成を示すブロック図である。実施の形態1の文書ファイル出力システムは、文書ファイル出力装置1、記憶装置2、及び読取装置3を含む。
 読取装置3は、CCD(Charge Coupled Device)イメージセンサ等を用いたスキャナである。読取装置3は、原稿台に載置された複数枚の印刷用紙を自動的に1枚ずつ取り込む自動原稿搬送装置を備えている。読取装置3は、自動原稿搬送装置の原稿台に印刷用紙が載置され、ユーザによる読み取り開始の操作がされた場合に、原稿台に載置された印刷用紙を1枚ずつ全て取り込み、各印刷用紙の片面または両面から画像を読み取る。読取装置3は読み取った画像をアナログの画像データ又はデジタル画像データとし、読み取った順に内蔵する記憶部に一度記憶するか、順次文書ファイル出力装置1へ出力する。
 記憶装置2は、ハードディスクドライブ、SSD(Solid State Drive)等の記憶媒体を用い、文書ファイル出力装置1から出力された文書ファイルのデータを記憶する。
 文書ファイル出力装置1はパーソナルコンピュータを用いる。文書ファイル出力装置1は、制御部10、記憶部11、一時記憶部12、入出力部13、通信部14、及び読出部15を備える。
 制御部10は、CPU(Central Processing Unit)を用いて、記憶部11に記憶してある文書ファイル出力プログラム1Pを一時記憶部12に読み出して実行することにより、パーソナルコンピュータを文書ファイル出力装置として機能させる。
 記憶部11は、ハードディスクを用いる。記憶部11は、SSD(Solid State Drive)、又はフラッシュメモリ等を用いてもよい。記憶部11には、上述の文書ファイル出力プログラム1Pが記憶されているほか、通信部14により取得された画像データ、制御部10が演算時に用いる情報、及び制御部10が出力する文書ファイルのデータが記憶される。
 一時記憶部12は、SRAM(Static Random Access Memory)又はDRAM(Dynamic Random Access Memory)等のRAMを用いる。一時記憶部12は、制御部10の処理により発生した情報、例えば処理中の画素データ、画像データから抽出された情報などを一時的に記憶する。
 入出力部13は、例えばUSB(Universal Serial Bus)インタフェースを用いる。入出力部13は、記憶装置2と接続されており、制御部10が出力した文書ファイルのデータを記憶装置2へ送出する。入出力部13はUSB接続に対応した他の読取装置と接続されてもよい。この場合、制御部10は他の読取装置から入出力部13を介して画像データを取得する。なお、入出力部13はUSBに限らず他の通信プロトコルに基づき記憶装置又は読取装置などの外部装置と接続されてもよい。
 通信部14は、例えばLAN(Local Area Network)インタフェースを用いる。通信部14はLANを介して所定の通信プロトコルに基づき情報を送受信する。制御部10は、通信部14を介して、読取装置3から送信された画像データを受信して取得することができる。通信部14は、通信機能を備えた同一ネットワーク上の他の記憶装置と接続されてもよい。この場合、制御部10は、出力する文書ファイルのデータを通信部14から他の記憶装置へ送信する。
 読出部15は、ディスクドライブを用いる。読出部15は、CD(Compact Disk)、DVD(Digital Versatile Disk)、BD(Blu-Ray(登録商標) Disk)、フラッシュメモリ、又はフレキシブルディスクなどである記録媒体4に記録されている情報を読み出す。本実施の形態の記録媒体4には、文書ファイル出力プログラム4Pが記録されている。制御部10は、読出部15によって記録媒体4に記録されている情報を読み出し、記憶部11又は一時記憶部12に記憶する。記憶部11に記憶されている文書ファイル出力プログラム1Pは、記録媒体4から読み出された文書ファイル出力プログラム4Pの複製であってもよい。
 図2は、実施の形態1の文書ファイル出力装置1で実現される機能を示す機能ブロック図である。文書ファイル出力装置1の制御部10は、記憶部11に記憶されている文書ファイル出力プログラム1Pを読み出して実行することにより、画像データ取得部16、印刷設定特定部17、分割判定部18及び分割出力部19として機能する。なお、夫々を特定の集積回路としてハードウェアにて実現してもよい。
 このように構成される文書ファイル出力装置1にて制御部10は、画像データ取得部16の機能により、読取装置3で原稿から読み取られて出力される一連の画像データを取得し、一時記憶部12又は記憶部11に記憶する。また制御部10は、印刷設定特定部17の機能により、取得して記憶してある各画像データを、読み取り順に処理して印刷設定を特定する。制御部10は、各原稿の画像データに対して特定された印刷設定に基づき、分割判定部18の機能により、印刷設定が変化したか否かを判定する。制御部10は、印刷設定が変化したと判定された画像データまでを、分割出力部19の機能により、1つの文書ファイルとして記憶部11に記憶する。文書ファイル出力装置1は、記憶部11に記憶した各文書ファイルを入出力部13から記憶装置2へ出力する。
 図3は、実施の形態1の文書ファイル出力装置1の制御部10が行なう処理手順の一例を示すフローチャートである。
 制御部10は、画像データ取得部16の機能により、読取装置3から出力される画像データを取得し、一時記憶部12又は記憶部11に記憶する(ステップS101)。
 制御部10は、印刷設定特定部17の機能により、原稿の読み取り順に対応させる変数Iに1を代入しておく(ステップS102)。制御部10は、一時記憶部12又は記憶部11に記憶してある画像データの内、I番目に読み取られた原稿の画像データを読み出す(ステップS103)。制御部10は、印刷設定特定部17の機能により、I(I=1)番目の原稿の画像データに基づき、I番目の原稿の印刷設定を特定する(ステップS104)。
 次に制御部10は、I+1番目の原稿の有無を判断する(ステップS105)。制御部10は、I+1番目の原稿が有ると判断した場合(S105:YES)、記憶部11からI+1番目に読み取られた原稿の画像データを読み出す(ステップS106)。制御部10は、読み出した画像データに基づき、I+1番目の原稿の印刷設定を特定する(ステップS107)。
 制御部10は、分割判定部18の機能により、既に特定してあるI番目の原稿の印刷設定と、ステップS107で特定したI+1番目の原稿の印刷設定とを比較し(ステップS108)、印刷設定の変化の有無を判定する(ステップS109)。制御部10は、分割判定部18の機能により、印刷設定の変化は有りと判定した場合(S109:YES)、分割出力部19の機能により、I番目の原稿の画像データを、出力する文書ファイルに書き込み(ステップS110)、I番目までの画像データで1つの文書ファイルとして完成させてファイルをクローズし、出力する(ステップS111)。制御部10は、変数Iに1を加算し(ステップS112)、処理をステップS105へ戻し、最後の原稿となるまで繰り返す。
 制御部10は、ステップS109にて印刷設定の変化は無しと判定した場合(S109:NO)、分割出力部19の機能により、I番目の原稿の画像データを、出力する文書ファイルに書き込み(ステップS113)、処理をステップS112へ進める。
 制御部10は、読み取られた全ての原稿の画像データについて処理を終了し、I+1番目の原稿は無しと判断した場合(S105:NO)、分割出力部19の機能により、I番目の原稿の画像データを、出力する文書ファイルに書き込み(ステップS114)、I番目までの原稿の画像データで1つの文書ファイルとして完成させてファイルをクローズして出力し(ステップS115)、処理を終了する。
 図4は、実施の形態1の文書ファイル出力装置1が取得した画像データを文書ファイルとして分割する処理のイメージ図である。上段に読取装置3から出力され、文書ファイル出力装置1が取得した画像データ、下段に文書ファイル出力装置1が分割出力した文書ファイルのイメージを示している。
 制御部10は、図3のフローチャートに示したように処理を実行することにより、取得した画像データを読み取り順に、原稿1→原稿2→原稿3、…原稿Nと順に読み出す。制御部10は、各原稿の画像データから特定した印刷設定を、原稿1と2、原稿2と3、…と比較する。そして制御部10は、例えば原稿2の印刷設定について原稿3の印刷設定と比較した結果、変化は有りと判定した場合、原稿2までの画像データを、即ち原稿1及び原稿2の画像データを1つの文書ファイルとして出力する。制御部10はこのような処理を最後の原稿Nまで繰り返し行なうことにより、適切に各文書ファイルに分割して出力することができる。
 なお、図3に示した処理手順及び図4の説明では、原稿1→原稿2→原稿3、…原稿Nと順に読み出して、夫々1つずつ印刷設定を特定し、前の原稿の印刷設定と比較する構成とした。しかしながら本発明はこれに限らず、原稿N→原稿N-1、…の順序で処理してもよい。また、図4に示すように取得した全原稿の画像データから、全原稿の印刷設定を予め特定し、印刷設定が変化した原稿が何番目であるかを特定し、特定した原稿の前後で文書ファイルを分割出力する構成としてもよい。
 次に、制御部10の印刷設定特定部17による機能の詳細を説明する。図5は、印刷設定の特定処理の詳細な手順の一例を示すフローチャートである。
 制御部10は、印刷設定特定部17の機能により、読み出した画像データの全画素を検査し、画素値を所定値と比較する(ステップS41)。このとき制御部10は、画像データがRGB(R:赤、G:緑、B:青)成分毎の画素値からなる場合、各画素について全色成分の画素値を加算した値を所定値と比較しても良いし、全色成分の画素値の平均値を所定値と比較しても良い。制御部10は、予め画像データをブロック毎に分別しておき、各ブロックを白色領域/灰色領域/黒色領域と分別しておき、灰色領域及び黒色領域であるブロックを抽出するようにしてもよい。
 制御部10は、ステップS41で比較し、画素値が所定値以下、即ち暗色であって文字又は図形が印刷されている画素を抽出する(ステップS42)。このとき制御部10は、上述のように複数の画素をブロック毎に抽出するようにしても良い。
 制御部10は、抽出した画素の出現頻度の分布を画像(原稿)の縦方向及び横方向に算出する(ステップS43)。即ち、制御部10は、原稿の縦方向及び横方向を画素単位でXY座標に当てはめ、抽出された画素の位置をX軸方向及びY軸方向夫々に射影し、画素数のヒストグラムを出現頻度の分布として求める。
 制御部10は、画像の縦方向及び横方向夫々の出現頻度分布に基づき、中央、右、左、上、下、右上、右下、左下、左上などに区分した夫々の領域における抽出画素の出現頻度を算出する(ステップS44)。このときの中央、右、左、上、下、右上、右下、左下、左上などの領域の範囲は、上述のXY座標を基準に予め定められており、記憶部11に座標情報が記憶されている構成とする。各領域は相互に重複していてもよい。更に具体的には制御部10は、各領域における抽出画素の出現頻度を、各領域における抽出画素数の平均値として算出するようにしてもよいし、中央値、最多値などで算出してもよい。
 制御部10は、縦方向及び横方向夫々に、右、左又は上、下夫々における出現頻度を、中央部の出現頻度と比較する(ステップS45)。制御部10は、出現頻度が中央部よりも高い領域の数を特定し(ステップS46)、出現頻度が中央部よりも高い領域の夫々の面積を特定する(ステップS47)。このとき制御部10は、中央部における出現頻度に対し、所定の範囲(例えば数%)を超えて高いか否か、中央部における出現頻度の数倍以上であるか否かなどによって、出現頻度が高いか否かを判断し、それ以外は同程度又は中央部における出現頻度の方が高いと判断すればよい。
 制御部10は、ステップS46及びS47で特定した領域の数、及び領域の面積に基づき、中央部と比較して出現頻度の偏りが少なくとも縦方向及び横方向のいずれか2つ以上あるか否かを判断する(ステップS48)。制御部10は、2つ以上あると判断した場合(S48:YES)、割り付け印刷であると特定し(ステップS49)、割り付け数を特定する(ステップS50)。制御部10は例えば、横方向に偏りが2つ、縦方向には偏りが1つと判断した場合には割り付け数を2とし、横方向に偏りが2つ、縦方向にも偏りが2つと判断した場合には割り付け数を4とすることができる。
 制御部10は、ステップS48で否と判断した場合(S48:NO)、偏りがある範囲の大きさを算出する(ステップS51)。制御部10は、ステップS51で算出した大きさが予め設定されてある所定値以下であるか否かを判断する(ステップS52)。このとき所定値は、記憶部11に記憶しておけばよい。制御部10は、所定値以下であると判断した場合(S52:YES)、縮小印刷であると特定し(ステップS53)、処理を次のステップS54へ進める。制御部10は、所定値を超えると判断した場合(S52:NO)、処理をそのまま次のステップS54へ進める。
 次に制御部10は、偏りが枠状になっているか否かを判断する(ステップS54)。制御部10は、特定の座標における頻度分布が他の領域の例えば3倍以上であるとき、又は出現頻度が8割以上であると特定できた場合、偏りが枠状になっていると判断すればよい。例えば、原稿の上からY番目~Y+5番目の位置における出現頻度が8割以上である場合には当該Y番目付近に罫線が引かれていると判断し、同様にして原稿の左からX番目~X+5番目の位置における出現頻度が8割以上であるときには当該X番目付近にも罫線が引かれており、枠組が印刷されていると判断できる。勿論、枠組が印刷されているか否かを判断できるのであれば、他の方法を用いてもよい。制御部10は、偏りが枠状になっていると判断した場合(S54:YES)、枠組印刷であると特定する(ステップS55)。制御部10は、ステップS54で否と判断した場合(S54:NO)、そのまま処理を次のステップS56へ進める。
 制御部10は、更に各画素の画素値のRGB値を相互に比較し(ステップS56)、RGB値が相互に所定の誤差範囲内で同程度であるか否かを判断する(ステップS57)。制御部10は、同程度であると判断した場合は(S57:YES)、モノクロ印刷と特定し(ステップS58)、所定の誤差範囲を超えて異なると判断した場合は(S57:NO)、カラー印刷と特定し(ステップS59)、印刷設定を特定する処理を終了し、処理を図3のフローチャートに示した処理手順へ戻す。このとき制御部10は、ブロック毎にRGB値を相互に比較してもよい。
 文書ファイル出力装置1によって文書ファイルが分割されて出力される処理を、具体的例を挙げて説明する。
 図6は、割り付け印刷がされている原稿例のイメージ図である。図6の上段に、割り付けの印刷設定がされていない文章を含む原稿、下段に印刷設定に割り付け設定がされている文章の原稿の例を示している。なお、図6の下段に示す例では、割り付け数は「2」である。また、図6には、各々の原稿について、画素値が所定値以下である画素(文字又は図形が印刷されている画素)の出現頻度の縦方向における分布をグラフで示している。各グラフは縦方向の位置と、各位置における出現の頻度を示している。
 文書ファイル出力装置1の制御部10は、図6の上段に示すような原稿を読み取った画像データを取得した場合、画素値から縦方向の出現頻度分布を図6上段左側に示すように算出する。制御部10は、中央部における文字又は図形等の画素の出現頻度と、上部及び下部の出現頻度とを夫々比較する。この場合、制御部10は、中央部における出現頻度と、上部及び下部夫々における出現頻度とは同程度であると判断し、出現頻度の偏りは1つと判断でき、割り付け設定はされていないと特定することができる。
 文書ファイル出力装置1の制御部10は、図6の下段に示すような原稿を読み取った画像データを取得した場合も同様に、画素値から縦方向における出現頻度の分布を図6下段左側に示すように算出する。この場合制御部は、中央部における出現頻度と、上部及び下部夫々における出現頻度とを比較し、上部及び下部夫々の出現頻度は中央部における出現頻度よりも高いと判断し、出現頻度の偏りは2つであると判断できる。そして制御部10は、割り付け設定がされていると特定し、割り付けの数を「2」と特定することができる。
 図7は、割り付け印刷及び枠組印刷がされている原稿例のイメージ図である。図7の上段に、割り付けの印刷設定はされているものの、枠組印刷がされていない文章及び図形を含む原稿の例を示している。中段に、割り付けの印刷設定及び枠組印刷設定がされている文章及び図形を含む原稿の例を示している。なお、図7に示す例では、割り付け数は「4」である。また、図7には、各々の原稿について、画素値が所定値以下である画素(文字又は図形が印刷されている画素)の頻度の縦方向及び横方向の分布をグラフで示している。各グラフは、画像における位置と、各位置における出現の頻度を示している。
 文書ファイル出力装置1の制御部10は、図7の上段に示すような原稿を読み取った画像データを取得した場合、画素値から縦方向の出現頻度分布を図7上段左側に示すように算出し、横方向の出現頻度分布を図7下段のグラフ中の細線で示すように算出する。制御部10は、中央部における文字又は図形等の画素の出現頻度と、上部及び下部の出現頻度と、左側及び右側における出現頻度とを夫々比較する。この場合、制御部10は、中央部における出現頻度に比して、上部及び下部における出現頻度は縦方向で中央部における出現頻度よりも高いと判断する。同様に、制御部10は、左側及び右側における出現頻度は横方向で中央部における出現頻度よりも高いと判断する。したがって制御部10は、出現頻度の偏りは4つ(2×2)であると判断する。そして制御部10は、割り付け設定がされていると特定し、割り付けの数を「4」と特定することができる。更にこの場合、制御部10は、出現頻度の縦方向及び横方向における分布から、特定の座標、例えば縦方向の上からY~Y+5番目の画素における頻度分布は、他の中央部よりも高頻度である領域における頻度と同程度であると判断し、枠組印刷の設定はされていないと特定することができる。
 文書ファイル出力装置1の制御部10は、図7の中段に示すような原稿を読み取った画像データを取得した場合、画素値から縦方向の出現頻度分布を図7中段左側に示すように算出し、横方向の出現頻度分布を図7下段のグラフ中の太線で示すように算出する。この場合も、制御部10は、中央部における出現頻度に比して、上部、下部、左側、及び右側夫々の出現頻度はいずれも中央部における出現頻度よりも高く、出現頻度の偏りは4であると判断する。そして制御部10は、割り付け設定がされていると特定し、割り付けの数を「4」と特定することができる。更にこの場合、制御部10は、縦方向における出現頻度の分布から、特定の座標、例えば縦方向の上からY~Y+5番目の画素、下からY~Y+5番目の画素における頻度分布は、他の中央部よりも高頻度である領域における頻度の数倍以上、又は8割以上であると判断する。同様に、制御部10は、横方向における出現頻度の分布から、特定の座標、例えば左からX~X+5番目の画素、右からX~X+5番目の画素における頻度分布は、他の中央部よりも高頻度である領域における頻度の数倍以上であると判断する。これにより制御部10は、枠組印刷の設定がされていると特定することができる。
 図8は、縮小印刷がされている原稿例のイメージ図である。図8の上段に、通常の印刷がされている文章を含む原稿の例を示し、下段に、縮小印刷設定がされている文章を含む原稿の例を示している。なお、図8には、各々の原稿について、画素値が所定値以下である画素(文字又は図形が印刷されている画素)の頻度の縦方向及び横方向における分布をグラフで示している。各グラフは、画像における位置と、各位置における出現の頻度を示している。
 文書ファイル出力装置1の制御部10は、図8の上段に示すような原稿を読み取った画像データを取得した場合、画素値から縦方向の出現頻度分布を図8上段左側に示すように算出し、横方向の出現頻度分布を図8下段下部のグラフ中の細線で示すように算出する。制御部10は、中央部における文字又は図形等の画素の出現頻度と、上部及び下部の出現頻度とを夫々比較する。この場合、制御部10は、中央部における出現頻度と、上部及び下部夫々における出現頻度とは同程度であると判断し、出現頻度の偏りは1つと判断する。そして制御部10は、偏りの範囲の大きさを算出する。具体的には、制御部10は、破線で示すような縦方向及び横方向における分布の連続範囲を特定し、特定した縦方向及び横方向の範囲から大きさを算出する。この場合、制御部10は、算出した大きさが予め設定されている所定値以下ではないと判断し、特別な印刷設定はされていないと特定できる。
 文書ファイル出力装置1の制御部10は、図8の下段に示すような原稿を読み取った画像データを取得した場合、画素値から縦方向の出現頻度分布を図8下段左側に示すように算出し、横方向の出現頻度分布を図8下段下部のグラフ中の太線で示すように算出する。この場合、制御部10は、中央部における出現頻度と比して、上部及び下部夫々における出現頻度は低いと判断し、出現頻度の偏りは1つと判断する。そして制御部10は、偏りの範囲の大きさを算出する。この場合制御部10は、算出した大きさは、予め設定されている所定値以下であると判断し、縮小印刷設定がされていると特定できる。
 このように、実施の形態1における文書ファイル出力装置1は、読取装置3から取得した複数の原稿の画像データに基づき、画像データの元の原稿夫々の印刷設定を特定し、印刷設定の変化に応じて文書ファイルを適切に分割して出力することができる。なお、印刷設定は上述に示した例のみに限られず、画素値の平均的な濃度から濃い/薄い若しくは節約印刷などの設定、又は、カラー印刷の場合の彩度から鮮やかに印刷する設定など、種々の印刷設定を特定し、区別して適切に文書を分割する方法も考え得る。
 実施の形態1では、文書ファイル出力装置1は印刷設定の違いのみを基準として画像データを文書ファイルへ分割・出力する構成とした。しかしながら、文書ファイル出力装置1は、各原稿の特徴量を算出し、算出された特徴量と併せて各原稿の画像データを異なる文書ファイルとするか否かを判定する構成としてもよい。
 (実施の形態2)
 実施の形態2では、実施の形態1における文書ファイル出力装置1の印刷設定特定部17の機能が特定する印刷設定に加え、原稿サイズ、埋め込み画像、特定の印刷フォーマット、及び原稿内の特定領域内の文字列を特定し、それらが変化した場合に文書ファイルを分割する例について説明する。
 図9は、実施の形態2の文書ファイル出力システムの構成を示すブロック図である。実施の形態2の文書ファイル出力システムは、文書ファイル出力装置1b、記憶装置2、及び読取装置30を含む。実施の形態2における文書ファイル出力システムの構成は、文書ファイル出力装置1bによる印刷設定の特定方法、及び読取装置30の機能以外は、実施の形態1における構成と同様であるので、共通する構成には同一の符号を付して詳細な説明を省略する。
 読取装置30の構成は、実施の形態1における読取装置3の構成とほぼ同様であるが、自動原稿搬送装置が、原稿サイズを判別する機構を有する点が異なる。図10は、実施の形態2における読取装置30の自動原稿搬送装置の原稿サイズ判別機構を下方から見た構成を模式的に示す模式図である。読取装置30の自動原稿搬送装置は、制御部31と、通信部32と、2つの搬送ローラ33と、該搬送ローラ33の回転方向と略直交する方向に並べられた複数の光学センサ34とを有する。
 制御部31は、MPU(Micro Processing Unit)を用い、各構成部を制御する。制御部31は、搬送ローラ33の回転速度を検知して原稿の搬送速度を特定することが可能である。また制御部31は、複数の光学センサ34夫々から検知結果を取得する。制御部31は、原稿の搬送速度と各光学センサ34からの検知結果に基づいて、搬送した原稿サイズを特定し、搬送した原稿の画像データと共に、内蔵する記憶部に一度記憶するか、順次通信部32により文書ファイル出力装置1bへ送信する。
 通信部32は、文書ファイル出力装置1bの通信部14と対応するインタフェースである。通信部32は、LANを介して所定の通信プロトコルに基づき情報を送受信する。なお、通信部32はUSBなどのインタフェースに代替可能であり、制御部31が文書ファイル出力装置1へ画像データ及び特定した原稿サイズが出力できればよい。
 複数の光学センサ34は夫々、発光素子35及び受光素子36を有する。光学センサ34は、自動原稿搬送装置上に原稿が存在する間、例えば30ミリ秒毎に、発光素子35を発光させ、原稿からの反射光を受光素子36にて受光し、受光量に応じた信号を制御部31へ出力する。
 制御部31は、光学センサ34から得られる信号に基づき、搬送中の原稿がいずれの光学センサ34上に存在するかを特定し、原稿の幅を特定する。また、光学センサ34からの一定時間毎の信号に基づき、制御部31は、1枚の原稿の通過時間を算出し、搬送速度に基づき原稿の長さを特定する。制御部31は、原稿の幅及び長さに基づいて原稿サイズを、例えばA4、A4縦、B5などと特定する。制御部31は、特定した結果を各原稿から読み取った画像データと共に記憶するか、通信部32から送信する。
 実施の形態2における文書ファイル出力装置1bは、実施の形態1同様にパーソナルコンピュータを用い、制御部10b、記憶部11b、一時記憶部12、入出力部13、通信部14、及び読出部15を備える。制御部10bは、記憶部11bに記憶してある文書ファイル出力プログラム1Pbに基づき、後述するような各機能を実現する。記憶部11bには、文書ファイル出力プログラム1Pのほか、後述するパターンマッチングに用いる埋め込み画像(地紋)の画像データ、及び、特定の印刷フォーマットの画像データが記憶されている。
 図11は、実施の形態2の文書ファイル出力装置1bで実現される機能を示す機能ブロック図である。文書ファイル出力装置1bの制御部10bは、画像データ取得部16、印刷設定特定部17b、分割判定部18及び分割出力部19として機能する。なお、夫々を特定の集積回路としてハードウェアにて実現してもよい。実施の形態1における各機能と共通する機能には同一の符号を付して詳細な説明を省略する。
 実施の形態2における文書ファイル出力装置1bの制御部10bは、印刷設定特定部17bとして機能し、実施の形態1で示した印刷設定のほかに、読取装置30から取得した画像サイズ、パターンマッチングによる埋め込み画像(地紋)の有無とその内容、特定の帳票フォーマットなどの印刷フォーマット、原稿のヘッダ部分などの特定領域に印刷されている文字列の有無及びその内容を含む印刷設定を特定する。
 制御部10bは、実施の形態1同様に図3のフローチャートに示した処理手順を実行する。その処理手順の内のステップS104及びS107の印刷設定の特定処理として、図5に示したフローチャートに加えて、以下の処理を実行する。図12は、更に実行される印刷設定の特定処理の詳細な手順の一例を示すフローチャートである。
 制御部10bは、印刷設定特定部17bの機能により、読み出した画像データに対応して取得した画像サイズを特定する(ステップS60)。
 次に制御部10bは、印刷設定特定部17bの機能により、読み出した画像データの内の特定領域に対してOCR(Optical Character Reader)処理を行なう(ステップS61)。文書ファイル出力装置1bはこのために、OCR処理を行なうためのハードウェアを備えていてもよい。詳細には制御部10bは、原稿を読み取る向きとした場合のヘッダ部に対してOCR処理を行ない、読み取られた文字列を取得する。制御部10bは、OCR処理により、電話番号が取得できたか否かを判断する(ステップS62)。制御部10bは、電話番号が取得できたと判断した場合(S62:YES)、原稿がFAXであって取得した番号は送信元の電話番号であると特定する(ステップS63)。制御部10bは、ステップS62で電話番号が取得できなかったと判断した場合(S62:NO)、処理を次のステップへ進める。
 制御部10bは、印刷設定特定部17bの機能により、読み出した画像データの内の特定の微小領域を抽出する(ステップS64)。制御部10bは、抽出した領域の画像と、記憶部11bに記憶してある複数の埋め込み画像のパターンとの比較を行ない(ステップS65)、符合するパターンがあるか否かを判断する(ステップS66)。制御部10bは、ステップS66であると判断した場合(S66:YES)、符合する画像パターンを識別する情報と対応付けて埋め込み画像有りと特定し(ステップS67)、処理をステップS70へ進める。
 制御部10bは、ステップS66にて符合しないと判断した場合(S66:NO)、所定の回数以上行なったか否かを判断する(ステップS68)。制御部10bは、所定の回数未満であると判断した場合に(S68:NO)、抽出する微小領域を所定の画素分ずらし(ステップS69)、ステップS64へ処理を戻し、ステップS65~S69の処理を繰り返す。制御部10bは、ステップS68で所定の回数以上行なったと判断した場合(S68:YES)、処理を次のステップS70へ進める。この場合、原稿に埋め込み画像(地紋)はないと特定される。
 制御部10bは、読み出した画像データにエッジ処理を行ない(ステップS70)、エッジ処理後の画像データの画像と、記憶部11bに記憶してある特定の印刷フォーマットに対応する複数のパターンとの比較を行ない(ステップS71)、符合するパターンがあるか否かを判断する(ステップS72)。制御部10bは、ステップS72で符合するパターンがあると判断した場合(S72:YES)、符合する画像パターンを識別する情報と対応付けて特定の印刷フォーマットと特定し(ステップS73)、印刷設定を特定する処理を終了し、処理を図3のフローチャートに示した処理手順へ戻す。制御部10bは、ステップS72で符合しないと判断した場合(S72:NO)、そのまま印刷設定を特定する処理を終了し、処理を図3のフローチャートに示した処理手順へ戻す。
 文書ファイル出力装置1bによって文書ファイルが分割されて出力される処理を、具体的例を挙げて説明する。
 まず制御部10bは、分割判定部18の機能により、次に特定した原稿サイズがそれまでの原稿サイズと異なる場合、印刷設定の変化は有りと判定し、原稿サイズが変化するまでの原稿の画像データで1つの文書ファイルとして完成させる。
 図13は、FAX出力である原稿例のイメージ図である。図13に示すように、設定によってはFAX出力された原稿のヘッダ部(図中、ハッチングで示す)には、送信元の電話番号(FAX番号)が印字されている。
 文書ファイル出力装置1bの制御部10bは、図13に示したような原稿を読み取った画像データを取得した場合、OCR処理によって電話番号を取得できる。この場合、制御部10bは元の原稿はFAX出力であったと特定し、且つ、取得した電話番号を他の原稿と識別する情報として特定する。
 図13に示したような原稿を読み取った画像データを取得した場合、制御部10bは分割判定部18の機能により、次に特定した原稿の印刷設定がFAX出力でない場合、印刷設定の変化はありと判定する。又は制御部10bは、FAX出力であっても取得できた電話番号(FAX番号)が異なる場合、印刷設定の変化は有りと判定する。そして制御部10bは、図13に示したような原稿までの画像データで1つの文書ファイルとして完成させる。
 図14は、埋め込み画像有りの原稿例のイメージ図である。図14に示すように、画像埋め込みが可能な画像形成装置は、印刷設定により、特定の画像を原稿の複数の箇所に散在させるように重畳させることが可能である。埋め込み画像の位置は、任意の位置でもよいし、特定の箇所に埋め込まれるように設定されてもよい。
 文書ファイル出力装置1bの制御部10bは、図14に示したような原稿を読み取った画像データを取得した場合、画像データの特定の位置(例えば画像の左下端)から、特定のサイズ(例えば32×32画素)の領域を抽出し、記憶部11bに記憶してある複数の埋め込み画像のパターンとのパターンマッチングの処理を行なう。制御部10bは、記憶してあるパターンと符合しないと判断した場合には例えば、水平方向に右へ5画素ずらすなどして所定間隔で領域をずらしながらパターンマッチングの処理を行なう。制御部10bは、パターンマッチングにより、記憶部11bに記憶してある画像のパターンのいずれかに、符合するパターンが存在した場合、画像埋め込み有りの印刷設定であると特定し、且つ、符合した画像のパターンの識別情報(例えば通し番号、又はパターン名)を他の原稿と識別する情報として特定する。制御部10bは、パターンマッチングにより符合するパターンが存在しない場合には画像埋め込み無しと判断する。
 図14に示したような原稿を読み取った画像データを取得した場合、制御部10bは、分割判定部18の機能により、次に特定した原稿の印刷設定が画像埋め込み無しである場合、印刷設定の変化は有りと判定する。又は制御部10bは、画像埋め込み有りであっても符合した画像のパターンが異なる場合、印刷設定の変化は有りと判定する。そして制御部10bは、図14に示したような原稿までの原稿データで1つの文書ファイルとして完成させる。
 図15は、特定の印刷フォーマットで印刷された原稿例のイメージ図である。特定の帳票フォーマットなど、特定のレイアウトで印刷することが可能な画像形成装置もある。この場合、図15に示すように枠組が特定のレイアウトで印刷される。
 文書ファイル出力装置1bの制御部10bは、図15に示したような原稿を読み取った画像データを取得した場合、エッジ処理又は黒である画素の抽出を行なって枠組を特定し、記憶部11bに記憶してある特定の印刷フォーマットに対応する複数の枠組パターンとのパターンマッチングの処理を行なう。制御部10bは、記憶してあるパターンのいずれかに、符合するパターンが存在した場合、特定のフォーマットの印刷設定であると特定し、且つ、符合したフォーマットのパターンの識別情報(例えば通し番号、又はフォーマット名)を他の原稿と識別する情報として特定する。制御部10bは、パターンマッチングにより符合するパターンが存在しない場合には、特定の印刷フォーマットではないと判断する。
 図15に示したような原稿を読み取った画像データを取得した場合、制御部10bは、分割判定部18の機能により、次に特定した原稿の印刷設定が特定の印刷フォーマットでないと判断した場合、印刷設定の変化は有りと判定する。又は制御部10bは、特定の印刷フォーマットであると判断した場合であっても、符合したフォーマットのパターンが異なる場合、印刷設定の変化は有りと判定する。そして制御部10bは、図15に示したような原稿までの原稿データで1つの文書ファイルとして完成させる。
 このように、実施の形態1における文書ファイル出力装置1bは、読取装置30から取得した複数の原稿の画像データに基づき、画像データの元の原稿夫々の印刷設定を特定し、原稿サイズの変化等の印刷設定の変化に応じて文書ファイルを適切に分割して出力することができる。
 (実施の形態3)
 実施の形態3では、文書ファイル出力装置1cは、印刷設定の変化が有ったと判定した場合に、ユーザへ通知を行なう構成とする。
 図16は、実施の形態3の文書ファイル出力システムの構成を示すブロック図である。実施の形態3における文書ファイル出力システムは、文書ファイル出力装置1c、記憶装置2、読取装置3、及びサーバ装置5を含む。実施の形態3における文書ファイル出力システムの構成は、文書ファイル出力装置1cによる通知処理が追加されたこと以外は、実施の形態1における構成と同様であるので、共通する構成には同一の符号を付して詳細な説明を省略する。
 サーバ装置5は、メールサーバ機能及びWebサーバ機能を有する。サーバ装置5は、文書ファイル出力装置1cから後述するような通知を受けた場合、受けた通知に応じてメールを送受信したり、Webページを作成したりすることが可能である。サーバ装置5は、文書ファイル出力装置1cからの通知を受けて作成したWebページ上のUI(User Interface)により、入力情報を取得した場合、取得した情報を文書ファイル出力装置1cへ送信する。なおサーバ装置5のメールサーバ機能及びWebサーバ機能は、文書ファイル出力装置1cが備える構成としてもよい。
 実施の形態3における文書ファイル出力装置1cは、実施の形態1同様にパーソナルコンピュータを用い、制御部10c、記憶部11c、一時記憶部12、入出力部13、通信部14、読出部15、及び表示部20を備える。制御部10cは、記憶部11cに記憶してある文書ファイル出力プログラム1Pcに基づき、後述するような各処理を実行する。
 表示部20は、例えば液晶パネルを用いた文書ファイル出力装置1cのモニタである。制御部10cからの指示に基づきUI画面を表示する。
 文書ファイル出力装置1cは、通信部14を介してサーバ装置5と通信することが可能である。制御部10cは、通信部14により作成したメールをサーバ装置5へ送信し、宛先へ送信するべく通知することが可能である。また制御部10cは、通信部14によりサーバ装置5へ接続し、Webページの作成を依頼する通知を行なうことが可能であり、サーバ装置5からWebページへの入力情報を受信することが可能である。
 図17及び図18は、実施の形態3における文書ファイル出力装置1cの制御部10cが行なう処理手順の一例を示すフローチャートである。以下のフローチャートの内、実施の形態1における図3のフローチャートに示した処理手順と共通する手順については同一のステップ番号を付し、詳細な説明を省略する。
 文書ファイル出力装置1cの制御部10cは、画像データ取得部16、及び印刷設定特定部17として機能し、読取装置3から取得した画像データに対し、1つずつ印刷設定を特定し、前後の印刷設定を比較する処理を行なう(S101~S108)。
 そして制御部10cは、印刷設定の変化は有りと判定した場合(S109:YES)、ユーザへの通知を行なう(ステップS121)。このとき制御部10cは、ユーザへの通知手段として、確認のためのUI画面を表示部20に表示させる。このときUI画面には、印刷設定の変化は有りと判定した場合のI番目又はI+1番目の原稿の画像データが含まれ、ユーザが分割箇所を確認できるようにしてある。又は、制御部10cは、ユーザへの通知手段として、確認のためのUI画面及び確認用の原稿の画像データを貼付したメールを作成する。このときのメールの宛先は記憶部11cに記憶してある特定のアドレス、又は読取装置3による読み取りを実行したユーザの認証情報等から対応するアドレスを取得したものであってもよい。制御部10cは通知手段として、作成したメールを、サーバ装置5へ送信し、メールサーバ機能により宛先の端末装置へ送信させる。又は制御部10cはユーザへの通知手段として、確認のためのUI画面及び確認用の原稿の画像データを貼付したWebページの作成をサーバ装置5のWebサーバ機能に依頼する。そして制御部10cは、作成されたWebページへアクセスするためのアドレス情報を、メール又はメッセンジャーの機能によってユーザへ通知する。
 制御部10cは、ユーザへの通知への応答としてファイルの分割指示を受けたか否かを判断する(ステップS122)。具体的には制御部10cは、表示部20に表示させたUI画面上の分割指示の入力釦が図示しないキーボード又はマウスなどの入力デバイスによって押下されたか否かで分割指示を受けたか否かを判断する。又は制御部10cは、メールを送信している場合、送信したメールへの分割指示の示す返信を受信したか否かによって判断してもよい。また、制御部10cは、サーバ装置5のWebサーバ機能によって作成されたWebページのUI画面にて入力された情報に基づき、分割指示を受けたか否かを判断してもよい。
 制御部10cは、ステップS122にて分割指示を受けたと判断した場合に初めて(S122:YES)、I番目の原稿の画像データを、出力する文書ファイルに書き込み(S110)、I番目までの画像データで1つの文書ファイルとして完成させてファイルをクローズし、出力する(S111)。
 制御部10cは、ステップS122にて文書指示を受けなかったと判断した場合(S122:NO)、分割出力部19の機能により、I番目の原稿の画像データを、出力する文書ファイルに書き込み(S113)、処理をステップS112へ進める。このとき制御部10cは、表示部20に表示させたUI画面上の分割指示に対し、否とする釦が図示しないキーボード又はマウスなどの入力デバイスによって押下された場合に分割指示を受けなかったと判断する。又は、制御部10cは、所定時間(例えば1分)経過しても分割指示の入力釦の押下を検知しなかった場合に分割指示を受けなかったと判断してもよい。更に制御部10cは、送信したメールへの返信が所定時間経過してもなかった場合、又はWebページへのアクセス若しくは入力情報がなかった場合に、分割指示を受けなかったと判断してもよい。
 実施の形態3にて示したように、制御部10cが印刷設定の変化は有りと判定した場合に確認のためにユーザに分割指示を促す通知を行なうことにより、誤ってファイルを分割することを防止することができる。これにより、文書ファイル出力装置1cは、ユーザが視認して本当に印刷設定が変化し、分割されるべきところで別の文書ファイルとして出力され、不要な分割や誤った分割を回避することが可能である。
 (実施の形態4)
 実施の形態4では、文書ファイル出力装置1dは、出力する文書ファイルの数が多い場合に、同一の印刷設定の文書ファイルを結合する構成とする。
 図19は、実施の形態4の文書ファイル出力システムの構成を示すブロック図である。実施の形態4における文書ファイル出力システムは、文書ファイル出力装置1d、記憶装置2、及び読取装置3を含む。実施の形態4のおける文書ファイル出力システムの構成は、文書ファイル出力装置1dによる文書ファイル結合処理が追加されたこと以外は、実施の形態1における構成と同様であるので、共通する構成には同一の符合を付して詳細な説明を省略する。
 文書ファイル出力装置1dは、実施の形態1同様にパーソナルコンピュータを用い、制御部10d、記憶部11d、一時記憶部12、入出力部13、通信部14、及び読出部15を備える。制御部10dは、記憶部11dに記憶してある文書ファイル出力プログラム1Pdに基づき、後述するような機能を実現する。
 図20は、実施の形態4の文書ファイル出力装置1dで実現される機能を示す機能ブロック図である。実施の形態4における文書ファイル出力装置1dの制御部10dは、記憶部11dに記憶されている文書ファイル出力プログラム1Pdを読み出して実行することにより、実施の形態1と同様に画像データ取得部16、印刷設定特定部17、分割判定部18及び分割出力部19dとして機能すると共に、ファイル結合部21として機能する。なお、夫々を特定の集積回路としてハードウェアにて実現してもよい。
 制御部10dは、分割出力部19dとして機能することにより、分割後のファイルを1つの文書ファイルとして記憶部11dに記憶するに際し、当該文書ファイルを分割するときに変化有りと判定した印刷設定を識別する情報を共に記憶部11dに記憶する。そして制御部10dは、ファイル結合部21として機能することにより、分割出力部19の機能によって出力した文書ファイルを、記憶部11dに記憶してある印刷設定の識別情報に基づき一部結合する。文書ファイル出力装置1dは、分割及び一部を結合した後の各文書ファイルを入出力部13から記憶装置2へ出力する。
 図21は、実施の形態4の文書ファイル出力装置1dの制御部10dが行なう処理手順の一例を示すフローチャートである。以下のフローチャートの内、実施の形態1における図3のフローチャートに示した処理手順と共通する手順については同一のステップ番号を付し、詳細な説明を省略する。
 文書ファイル出力装置1dの制御部10dは、画像データ取得部16、印刷設定特定部17、及び、分割判定部18として機能し、読取装置3から取得した画像データに対し、1つずつ印刷設定を特定し、前後の印刷設定を比較する処理を行ない、印刷設定に変化有りと判定した場合に文書ファイルを分割して出力する(S101~S115)。
 このとき文書ファイル出力装置1dの制御部10dは、分割出力部19dの機能により、ステップS111及びステップS115にて文書ファイルを出力するに際し、ステップS107でI番目の原稿に対して特定した印刷設定を、出力する文書ファイルに対応付けて記憶部11dに記憶しておく。
 そして制御部10dは、ファイル結合部21の機能により、文書ファイルの分割処理を行なった後、記憶部11dに記憶されてある出力された文書ファイルは3つ以上であるか否かを判断する(ステップS116)。なお、このときの文書ファイルの数は3つとは限らず、4又はそれ以上であってもよい。
 制御部10dは、文書ファイルが3つ以上であると判断した場合(S116:YES)、各文書ファイルに対応付けて記憶してある印刷設定の識別情報を読み出す(ステップS117)。制御部10dは、読み出した印刷設定の識別情報に基づき、同一又は同種であって符合する印刷設定が有るか否かを判断する(ステップS118)。制御部10dは、符合する印刷設定が有ると判断した場合(S118:YES)、符合する印刷設定が対応付けて記憶されてある文書ファイルを、出力してある連番順に結合し(ステップS119)、処理をそのまま終了する。
 制御部10dは、文書ファイルが2つ以下であると判断した場合(S116:NO)、処理をそのまま終了する。また制御部10dは、ステップS118にて符合する印刷設定が無いと判断した場合(S118:NO)、結合を行なわずに処理をそのまま終了する。
 実施の形態4にて示したように、制御部10dが分割処理後に、符合する印刷設定の文書ファイルを結合する処理を行なうことにより、例えば、4つに割り付けて印刷された原稿の画像データは1つの文書ファイルとして出力される。また、同一の帳票フォーマットの原稿の画像データは1つの文書ファイルとして出力される。これにより、読み取られる複数の原稿に散在する同一の印刷設定の原稿データを1つにまとめ、不要に多数の文書ファイルが出力されることを回避することが可能である。
 上述の実施の形態1から4はいずれも、相互に組み合わせて機能を実現してもよいことは勿論である。
 なお、開示された実施の形態は、全ての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上述の説明ではなくて請求の範囲によって示され、請求の範囲と均等の意味及び範囲内での全ての変更が含まれることが意図される。
 1,1b,1c,1d 文書ファイル出力装置
 10,10b,10c,10d 制御部
 11,11b,11c,11d 記憶部
 12 一時記憶部
 13 入出力部
 14 通信部
 16 画像データ取得部
 17,17b 印刷設定特定部
 18 分割判定部
 19,19d 分割出力部
 20 表示部
 21 ファイル結合部
 1P,1Pb,1Pc,1Pd 文書ファイル出力プログラム
 4P 文書ファイル出力プログラム

Claims (5)

  1.  文字又は図形が印刷された複数の原稿から連続して読み取られる画像データを、読み取り順と対応付けて取得する手段を備え、取得した複数の画像データを1つ又は複数ずつ分割し、各々文書ファイルとして出力する文書ファイル出力装置において、
     前記複数の画像データの元の原稿の印刷設定を特定する特定手段と、
     1つの原稿の印刷設定が、前又は後の原稿の印刷設定と比して変化したか否かを判定する判定手段と、
     該判定手段が変化したと判定した場合に、前又は後の原稿の画像データまでを1つの文書ファイルとして出力する手段と
     を備えることを特徴とする文書ファイル出力装置。
  2.  前記特定手段は、
     各画像データの元の原稿が含む割り付けページ数、元の原稿の縮小率、元の原稿における枠組印刷の有無、元の原稿がカラー印刷であるか否か、元の原稿のサイズ、埋め込み画像、元の原稿の印刷フォーマット、又は、元の原稿内の特定領域内の文字列
     の内のいずれか1つ又は複数を特定するようにしてあること
     を特徴とする請求項1に記載の文書ファイル出力装置。
  3.  前記特定手段は、
     画像データと予め記憶してある特定の画像パターンとが符合するか否かにより特定するようにしてあること
     を特徴とする請求項2に記載の文書ファイル出力装置。
  4.  文字又は図形が印刷された複数の原稿から連続して読み取られる画像データを、読み取り順と対応付けて取得し、取得した複数の画像データを1つ又は複数ずつ分割し、各々文書ファイルとして出力する文書ファイル出力方法において、
     前記複数の画像データの元の原稿の印刷設定を特定するステップと、
     1つの原稿の印刷設定が、前又は後の原稿の印刷設定と比して変化したか否かを判定する判定ステップと、
     該判定ステップが変化したと判定した場合に、前又は後の原稿の画像データまでを1つの文書ファイルとして出力するステップと
     を含むことを特徴とする文書ファイル出力方法。
  5.  コンピュータに、文字又は図形が印刷された複数の原稿から連続して読み取られる画像データを、読み取り順と対応付けて取得させ、取得された複数の画像データを1つ又は複数ずつ分割させて各々文書ファイルとして出力させるコンピュータプログラムにおいて、
     前記コンピュータに、
     前記複数の画像データの元の原稿の印刷設定を特定する特定ステップと、
     1つの原稿の印刷設定が、前又は後の原稿の印刷設定と比して変化したか否かを判定する判定ステップと、
     該判定ステップが変化したと判定した場合に、前又は後の原稿の画像データまでを1つの文書ファイルとして出力するステップと
     を実行させることを特徴とするコンピュータプログラム。
PCT/JP2012/070962 2011-10-26 2012-08-20 文書ファイル出力装置、文書ファイル出力方法、及びコンピュータプログラム WO2013061674A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201280052797.9A CN103907339B (zh) 2011-10-26 2012-08-20 文档文件输出装置以及文档文件输出方法
US14/353,819 US9858513B2 (en) 2011-10-26 2012-08-20 Document file output apparatus, document file output method, and computer readable medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011-235396 2011-10-26
JP2011235396A JP5583103B2 (ja) 2011-10-26 2011-10-26 文書ファイル出力装置、文書ファイル出力方法、及びコンピュータプログラム

Publications (1)

Publication Number Publication Date
WO2013061674A1 true WO2013061674A1 (ja) 2013-05-02

Family

ID=48167516

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/070962 WO2013061674A1 (ja) 2011-10-26 2012-08-20 文書ファイル出力装置、文書ファイル出力方法、及びコンピュータプログラム

Country Status (4)

Country Link
US (1) US9858513B2 (ja)
JP (1) JP5583103B2 (ja)
CN (1) CN103907339B (ja)
WO (1) WO2013061674A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6058615B2 (ja) * 2014-10-31 2017-01-11 京セラドキュメントソリューションズ株式会社 画像形成装置及び画像形成方法
TWI543110B (zh) 2015-04-27 2016-07-21 虹光精密工業股份有限公司 產生影像之方法及影像處理設備
JP6380317B2 (ja) * 2015-09-29 2018-08-29 ブラザー工業株式会社 データ作成装置、及び、データ作成プログラム
CA3035097C (en) 2016-09-02 2024-05-21 FutureVault Inc. Automated document filing and processing methods and systems
US11227189B2 (en) * 2019-07-17 2022-01-18 Walmart Apollo, Llc Systems and methods for identifying items in a digital image

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006072484A (ja) * 2004-08-31 2006-03-16 Fuji Xerox Co Ltd 画像処理装置、プログラムおよび記録媒体
JP2009169675A (ja) * 2008-01-16 2009-07-30 Konica Minolta Business Technologies Inc 文書処理装置、文書処理方法および文書処理プログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4881270A (en) * 1983-10-28 1989-11-14 The United States Of America As Represented By The Secretary Of The Navy Automatic classification of images
US5892591A (en) * 1996-11-22 1999-04-06 International Data Forwarders, Llc Facsimile transmission via packet switched data networks
JP2000354144A (ja) 1999-06-11 2000-12-19 Ricoh Co Ltd 文書読取装置
JP3824209B2 (ja) 2001-04-18 2006-09-20 三菱電機株式会社 文書自動分割装置
WO2003061270A1 (en) * 2001-12-24 2003-07-24 Mmf Systems, Inc. System for digital users to manage received analog information
JP3914167B2 (ja) 2003-03-31 2007-05-16 京セラミタ株式会社 画像形成装置
JP4136994B2 (ja) * 2004-04-16 2008-08-20 キヤノン株式会社 文書処理装置及びその制御方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
US8838591B2 (en) * 2005-08-23 2014-09-16 Ricoh Co., Ltd. Embedding hot spots in electronic documents
JP4899880B2 (ja) 2007-01-18 2012-03-21 富士ゼロックス株式会社 画像処理装置、画像処理システム及び画像処理プログラム
US8305632B2 (en) * 2007-06-13 2012-11-06 International Business Machines Corporation Automated batch processing of document in a multifunction printer system
US20090045249A1 (en) * 2007-08-19 2009-02-19 Kohji Miyasake Modifying processing of scanned sheets based on scanned control sheets
US8731297B1 (en) * 2007-09-28 2014-05-20 Amazon Technologies, Inc. Processing a digital image of content to remove border artifacts
US20090290883A1 (en) * 2008-05-23 2009-11-26 Kabushiki Kaisha Toshiba Apparatus and method for adjusting toner consumption
JP5058904B2 (ja) * 2008-07-15 2012-10-24 キヤノン株式会社 画像処理装置、画像処理方法、及びそのプログラム
JP2010198257A (ja) 2009-02-25 2010-09-09 Konica Minolta Business Technologies Inc 画像処理装置、プログラムおよびファイル作成方法
JP5264574B2 (ja) * 2009-03-11 2013-08-14 キヤノン株式会社 画像処理装置、システム及び画像処理方法
US8520966B2 (en) * 2009-03-30 2013-08-27 The Neat Company Image background enhancement for color images
US8290205B2 (en) * 2009-06-25 2012-10-16 Eastman Kodak Company Dating images from scanned watermarks
JP2011066820A (ja) 2009-09-18 2011-03-31 Riso Kagaku Corp 画像処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006072484A (ja) * 2004-08-31 2006-03-16 Fuji Xerox Co Ltd 画像処理装置、プログラムおよび記録媒体
JP2009169675A (ja) * 2008-01-16 2009-07-30 Konica Minolta Business Technologies Inc 文書処理装置、文書処理方法および文書処理プログラム

Also Published As

Publication number Publication date
JP2013093777A (ja) 2013-05-16
US20140293353A1 (en) 2014-10-02
US9858513B2 (en) 2018-01-02
JP5583103B2 (ja) 2014-09-03
CN103907339B (zh) 2016-12-21
CN103907339A (zh) 2014-07-02

Similar Documents

Publication Publication Date Title
US8438478B2 (en) Displaying an overlapped print preview for multiple pages with different finishing options
US8125683B2 (en) Image preview processing apparatus, image preview processing method, and image preview computer product
US10432820B2 (en) Image processing apparatus, image processing system, control method for image processing apparatus, and non-transitory computer readable medium
US9641705B2 (en) Image forming apparatus for reading indicia on a sheet and inserting images on a subsequent printed sheet at a location corresponding to the location of the read indicia
JP5583103B2 (ja) 文書ファイル出力装置、文書ファイル出力方法、及びコンピュータプログラム
CN105320933A (zh) 电子文档生成***以及电子文档生成装置
JP2019080146A (ja) 画像処理装置及び画像処理プログラム
US20220189187A1 (en) Information processing apparatus, information processing method, and storage medium
US20110075932A1 (en) Image processing method and image processing apparatus for extracting heading region from image of document
US11368607B2 (en) Information processing apparatus and non-transitory computer readable medium storing program for image color conversion
US8867050B2 (en) Image processing apparatus, non-transitory computer readable medium storing program and image processing method for restoring a single table from a plurality of pages
US9338310B2 (en) Image processing apparatus and computer-readable medium for determining pixel value of a target area and converting the pixel value to a specified value of a target image data
US11436733B2 (en) Image processing apparatus, image processing method and storage medium
US9277074B2 (en) Image processing apparatus, method, and medium determining whether image data of a page to be processed is blank and contains a foreground object and transmitting the foreground object obtained by removing a background object
US20180091671A1 (en) Image Reading Apparatus and Image Reading Method That Simply Detect Document Direction in Reading of Book Document, and Recording Medium Therefor
JP2012198597A (ja) 制御装置及びコンピュータプログラム
US20160219187A1 (en) Image processing apparatus
JP2010154244A (ja) 画像処理装置、画像処理方法及びプログラム
JP2001222717A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JP6973267B2 (ja) 画像処理装置および画像処理プログラム
JP7009750B2 (ja) 画像形成装置、同装置による地紋領域判定方法及び地紋領域判定プログラム
US20210281696A1 (en) Information processing apparatus and non-transitory computer readable medium
JP4998421B2 (ja) 画像形成装置、画像形成プログラム
JP6248451B2 (ja) 画像読取装置、画像読取方法および画像読取プログラム
WO2012091180A1 (ja) 文字検出装置、文字検出方法、および記録媒体

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12843530

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 14353819

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12843530

Country of ref document: EP

Kind code of ref document: A1