JP2007133763A - Device and program for comparing element information - Google Patents

Device and program for comparing element information Download PDF

Info

Publication number
JP2007133763A
JP2007133763A JP2005327715A JP2005327715A JP2007133763A JP 2007133763 A JP2007133763 A JP 2007133763A JP 2005327715 A JP2005327715 A JP 2005327715A JP 2005327715 A JP2005327715 A JP 2005327715A JP 2007133763 A JP2007133763 A JP 2007133763A
Authority
JP
Japan
Prior art keywords
element information
markup language
list
information
predetermined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005327715A
Other languages
Japanese (ja)
Inventor
Daisuke Asai
大介 朝井
Masahiro Watanabe
昌洋 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005327715A priority Critical patent/JP2007133763A/en
Publication of JP2007133763A publication Critical patent/JP2007133763A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a device and program for comparing element information, in which uniformity of element information can be determined for all pages in one site. <P>SOLUTION: The device includes: an element information acquisition means for acquiring element information matched with a predetermined narrowing condition from a plurality of pages in one predetermined site; a statistic analysis means for statistically analyzing the element information acquired by the element information acquisition means; and a list generation means for generating a list of results statistically analyzed by the statistic analysis means. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、同一サイトにおける複数のページに対して、各ページの要素情報を統計処理、比較する要素情報比較装置およびプログラムに関する。
The present invention relates to an element information comparison apparatus and program for statistically processing and comparing element information of each page for a plurality of pages on the same site.

情報通信技術の発達によって、近年、インターネットが広く普及している。これに伴って、インターネットを用いた情報配信が、重要な社会的基幹技術になっている。このために、ウェブページには、高齢者や視覚障害者等、様々な特徴を持つユーザにもアクセスできること(ウェブのアクセシビリティ)が望まれる。このような状況下で、ウェブのアクセシビリティ・ガイドラインが重要視されている。   With the development of information and communication technology, the Internet has become widespread in recent years. Along with this, information distribution using the Internet has become an important social core technology. For this reason, it is desired that the web page can be accessed by users having various characteristics such as the elderly and visually impaired persons (web accessibility). Under these circumstances, web accessibility guidelines are emphasized.

世界的に見れば。W3C(World Wide Web Consortium)によるアクセシビリティ・ガイドライン(以下、「W3C」という)が制定され、国内でも、JIS X 8341−3「高齢者・障害者等配慮設計指針―情報通信における機器、ソフトウェア、及びサービス」(以下、「JIS」という)が制定されている。   If you look globally. Accessibility guidelines (hereinafter referred to as “W3C”) have been established by the World Wide Web Consortium (W3C). "Service" (hereinafter referred to as "JIS") has been established.

所定のウェブページがアクセシビリティ・ガイドラインに準拠しているかどうかを調べる場合、そのページを構成するHTML(Hyper Text Markup Language)規格によって記述されているソースファイル、CSSと呼ばれるスタイルシート等のファイルに対して、各ガイドライン項目を適用して、チェックすればよい。   When checking whether or not a given web page complies with accessibility guidelines, the source file described by the HTML (Hyper Text Markup Language) standard that constitutes the page, a style sheet called CSS, etc. Apply and check each guideline item.

しかし、一般的に、HTML、CSS文書は、専門知識を必要とするので、チェックすることが容易ではなく、また、チェックしなければならないガイドライン項目が非常に多い。   However, in general, since HTML and CSS documents require specialized knowledge, it is not easy to check, and there are very many guideline items that must be checked.

そこで、総務省のウェブヘルパー(非特許文献1参照)等のウェブ・アクセシビリティ・チェックツール(以下、「チェックツール」という)と呼ばれるアプリケーションを、ウェブページ製作者が利用する。このチェックツールは、HTMLソースファイルを解析し、アクセシビリティ・ガイドライン項目のうちで、機械的に処理することができる項目に対してのみ、自動的にチェックする支援ソフトである。
http://www2.nict.go.jp/ts/barrierfree/accessibility/helper/what_webhelper.html
Therefore, a web page creator uses an application called a web accessibility check tool (hereinafter referred to as “check tool”) such as a web helper (see Non-Patent Document 1) of the Ministry of Internal Affairs and Communications. This check tool is support software that analyzes an HTML source file and automatically checks only items that can be mechanically processed among accessibility guideline items.
http://www2.nict.go.jp/ts/barrierfree/accessibility/helper/what_webhelper.html

W3C、JIS等のアクセシビリティ・ガイドラインの項目では、同一サイトにおける全ページにおいて、ある要素情報について、表記を統一させることが望ましいと解釈できる項目と、表記が重複しないようにすることが望ましいと解釈できる項目とがある。   In the items of accessibility guidelines such as W3C, JIS, etc., it can be interpreted that it is desirable that the notation should be consistent with the items that can be interpreted that it is desirable to unify the notation of certain element information on all pages on the same site. There is an item.

しかし、既存のチェックツールでは、単一ページしかチェックできないので、同一サイトにおける複数ページを関連してチェックすることができない。したがって、同一サイト内のページを全て人手でチェックする必要があるという問題がある。   However, since the existing check tool can check only a single page, a plurality of pages on the same site cannot be checked in relation to each other. Therefore, there is a problem that it is necessary to manually check all pages in the same site.

同一サイト内では、表記を統一すべき要素として、「画像の代替情報」がある。たとえば、JISのガイドライン項目で、画像には、利用者が画像の内容を適確に理解できるように、代替情報を提供しなければならないという項目がある。この項目に対応する場合、画像の代替情報を指定するalt属性値に、画像の説明を設定することを推奨している。なお、上記「alt属性値」は、画像の代替情報を指定する属性値である。   In the same site, there is “image alternative information” as an element whose notation should be unified. For example, in the JIS guideline item, there is an item that the image must provide alternative information so that the user can properly understand the content of the image. In the case of corresponding to this item, it is recommended to set the description of the image in the alt attribute value that specifies the alternative information of the image. The “alt attribute value” is an attribute value that specifies alternative information for an image.

つまり、画像が表示されない場合、その代替として、alt属性値に指定されているテキスト情報を表示すると、理解し易いから、alt属性値に画像の説明を設定する。   That is, when an image is not displayed, as an alternative, it is easy to understand if the text information specified in the alt attribute value is displayed. Therefore, the description of the image is set in the alt attribute value.

また、音声ブラウザを用い、音声によって情報を得ている場合、画像を音声化することができない。そこで、画像を音声化する代わりに、その画像のalt属性値に指定されているテキスト情報を読み上げ、これによって、利用者はその画像の内容を理解することができる。   Further, when information is obtained by voice using a voice browser, the image cannot be voiced. Therefore, instead of converting the image into sound, the text information specified in the alt attribute value of the image is read out, so that the user can understand the contents of the image.

したがって、同一サイトで、同じ画像を複数箇所で用いる際、同じ画像ファイルに対して、同じalt属性値を指定することが望ましい。既存の多くのチェックツール(所定のウェブページがアクセシビリティ・ガイドラインに準拠しているかどうかを調べるチェックツール)では、チェック対象を単一ページに限定し、同一サイトを構成する全てのページを連係してチェックできないので、同一サイトのalt属性値の統一性をチェックすることができない。   Therefore, when the same image is used at a plurality of locations on the same site, it is desirable to specify the same alt attribute value for the same image file. Many existing check tools (check tools that check whether a given web page complies with accessibility guidelines) limit the check target to a single page and link all the pages that make up the same site. Since it cannot be checked, it is not possible to check the uniformity of the alt attribute value of the same site.

また、一部のチェックツールでは、同一サイト内のalt属性値の一覧を示し、修正する機能を持っているが、全てのalt属性値を羅列するので、特にalt属性値が多い場合には、一覧性が悪く、人手で、全てをチェックする必要がある。たとえば、数百ページから参照されている画像であれば、そのalt属性値が、全て列挙されるので、どの部分の属性値を修正すべきであるのかを見つけるために、多大なコストを必要とする。   In addition, some check tools have a list of alt attribute values in the same site and a function to correct them, but since all alt attribute values are listed, especially when there are many alt attribute values, Listability is poor and it is necessary to check everything manually. For example, in the case of an image that is referenced from several hundred pages, all the alt attribute values are enumerated, so it takes a great deal of cost to find out which part of the attribute value should be corrected. To do.

また、同一サイトにおける複数のページに同じ内容の画像を用いる場合、そのサーバのデータ容量を節約するために、それぞれに同じ画像ファイルを用意するのではなく、1つの画像ファイルに、それぞれのページから参照することが望ましく、多く用いられている方法である。   Also, when using images with the same content for multiple pages on the same site, instead of preparing the same image file for each server to save the data capacity of the server, one image file is added to each page. It is desirable to refer to this method and it is a widely used method.

複数のページで、alt属性値(つまり、画像の説明)が同一であるが、その参照先の画像ファイルが異なる場合、alt属性値に基づいて、それらの画像は、同一の内容であることが推測されるので、参照先を1つの画像ファイルにすることによって、データ容量を節約することができ、画像の管理も容易になる。既存のチェックツールでは、同一alt属性値の画像ファイルヘのパスのリストを作成することはできないので、同一alt属性値の画像ファイルヘのパスのリストをチェックすることもできない。   If multiple pages have the same alt attribute value (that is, the description of the image) but the image files to be referenced are different, the images may have the same contents based on the alt attribute value. Therefore, by making the reference destination one image file, the data capacity can be saved and the management of the image becomes easy. An existing check tool cannot create a list of paths to image files having the same alt attribute value, and therefore cannot check a list of paths to image files having the same alt attribute value.

また、同一サイト内では、表記を統一すべき要素として、その他に、リンク情報がある。JISのガイドライン項目で、ハイパーリンクに十分な情報を含めて識別できるようにすることという項目がある。ここで言う「ハイパーリンクに十分な情報を含める」とは、リンクテキストを適切に記述することを意味する。リンクテキストに基づいて、ユーザは、移動するページの予測を行い、移動するか否かを判断するので、移動先の画像情報を固有に識別できるリンクテキストにすべきである。つまり、同一サイト内において、同一リンク先を示すリンクテキストであれば、統一されることが望ましい。既存チェックツールでは、同一サイト内のリンクテキストの統一性をチェックすることができない。   In addition, there is link information as another element whose notation should be unified within the same site. There is a JIS guideline item that allows hyperlinks to contain sufficient information for identification. Here, “include sufficient information in the hyperlink” means to appropriately describe the link text. Since the user predicts the page to be moved based on the link text and determines whether or not to move, the user should make the link text that can uniquely identify the destination image information. In other words, it is desirable to unify link texts indicating the same link destination in the same site. The existing check tool cannot check the uniformity of link text in the same site.

一方、同一サイト内で表記が重複しないように、表記を互いに異ならせる表記として、ページタイトルがある。JISのガイドライン項目の中に、「ページのタイトルとして、利用者がページの内容を識別できる名称を付けなければならない」という項目がある。つまり、同一サイトに設けられている複数のページにおける各ページをそれぞれ識別できる固有タイトルを付けなければ、同一サイトのページであっても、ユーザがどのページを閲覧しているのかを区別できないので、利用者がページの内容を識別できる名称を、ページのタイトルに付ける。   On the other hand, there is a page title as a notation that makes the notation different from each other so that the notation is not duplicated in the same site. Among the JIS guideline items, there is an item “A name that allows the user to identify the contents of the page must be given as the title of the page”. In other words, if you do not add a unique title that can identify each page in multiple pages on the same site, you can not distinguish which page the user is browsing even if it is a page on the same site. Give the title of the page a name that allows the user to identify the contents of the page.

しかし、既存のチェックツールでは、各ページを固有にチェックするので、各ページにタイトルが設定されているか否かしかチェックできず、そのタイトルが固有であるかどうかをチェックすることができない。   However, since the existing check tool checks each page uniquely, it can only check whether a title is set for each page, and cannot check whether the title is unique.

すなわち、上記従来例では、同一サイトにおける全ページについて、要素情報が統一されているかどうかを判断することができないという問題がある。つまり、要素情報の統一性を判断することができないという問題がある。   That is, the conventional example has a problem that it cannot be determined whether or not the element information is unified for all pages in the same site. That is, there is a problem that the uniformity of element information cannot be determined.

本発明は、同一サイトにおける全ページについて、要素情報の統一性を判断することができる要素情報比較装置およびプログラムを提供することを目的とする。
It is an object of the present invention to provide an element information comparison apparatus and program that can determine the uniformity of element information for all pages in the same site.

本発明は、所定の同一サイトにおける複数のページから、所定の絞り込み条件に合致する要素情報を取得する要素情報取得手段と、上記要素情報取得手段が取得した要素情報を統計分析する統計分析手段と、上記統計分析手段が統計分析した結果のリストを生成するリスト生成手段とを有することを特徴とする要素情報比較装置である。
The present invention provides element information acquisition means for acquiring element information that matches a predetermined narrowing-down condition from a plurality of pages on a predetermined same site, and statistical analysis means for statistically analyzing element information acquired by the element information acquisition means, An element information comparison apparatus comprising: a list generation unit that generates a list of results of statistical analysis performed by the statistical analysis unit.

本発明によれば、同一サイトにおける全ページについて、要素情報の統一性を判断することができるという効果を奏する。
According to the present invention, it is possible to determine the uniformity of element information for all pages in the same site.

発明を実施するための最良の形態は、以下の実施例である。   The best mode for carrying out the invention is the following examples.

図1は、本発明の実施例1である要素情報比較装置100と、ウェブサーバWSと、ネットワークNWと、ローカルディスクLDとを示すブロック図である。   FIG. 1 is a block diagram showing an element information comparison apparatus 100, a web server WS, a network NW, and a local disk LD that are Embodiment 1 of the present invention.

要素情報比較装置100は、制御部11と、ファイル情報取得部12と、ファイル情報蓄積部13と、要素情報取得部14と、要素情報蓄積部15と、要素情報処理部16と、出力情報生成部17と、情報入力部18と、情報出力部19とを有する。   The element information comparison apparatus 100 includes a control unit 11, a file information acquisition unit 12, a file information storage unit 13, an element information acquisition unit 14, an element information storage unit 15, an element information processing unit 16, and output information generation. Unit 17, information input unit 18, and information output unit 19.

要素情報比較装置100をパーソナルコンピュータ(PC)で実現する場合、ファイル情報取得部12、ファイル情報蓄積部13、要素情報取得部14、要素情報蓄積部15、要素情報処理部16、出力情報生成部17、制御部11は、PC本体に対応し、情報入力部18は、キーボード、マウス等の入力装置に対応し、情報出力部19は、モニタ等の出力装置に対応する。   When the element information comparison apparatus 100 is realized by a personal computer (PC), a file information acquisition unit 12, a file information storage unit 13, an element information acquisition unit 14, an element information storage unit 15, an element information processing unit 16, and an output information generation unit 17, the control unit 11 corresponds to a PC main body, the information input unit 18 corresponds to an input device such as a keyboard and a mouse, and the information output unit 19 corresponds to an output device such as a monitor.

要素情報比較装置100は、同一フォルダ内にある複数のHTMLファイルから、IMG要素(「<」と「>」とによって囲まれている部分)の属性情報を抽出し、同一画像について異なるalt属性値を用いている画像とalt属性値との組み合わせのみのリストを生成する装置である。これによって、ユーザは、画像とalt属性値との組み合わせのうちで、修正の必要がある組み合わせにおけるalt属性値を、容易に一覧することができる。   The element information comparison apparatus 100 extracts attribute information of IMG elements (parts surrounded by “<” and “>”) from a plurality of HTML files in the same folder, and different alt attribute values for the same image Is a device that generates a list of only combinations of images and alt attribute values. Thus, the user can easily list the alt attribute values in combinations that need to be corrected among the combinations of images and alt attribute values.

なお、上記「alt属性値」は、画像の代替情報、または、画像の説明文である。   Note that the “alt attribute value” is image alternative information or a description of the image.

まず、HTMLファイル内におけるIMG要素の書式について説明する。   First, the format of the IMG element in the HTML file will be described.

IMG要素の書式は、一般に、以下のような形式をとる。   The format of the IMG element generally takes the following form.

<IMG src=“image/fuji.jpg”width=“100”height=“80”alt=“富士山”>
HTML規格によると、以下のように定義されている。
<IMG src = “image / fuji.jpg” width = “100” height = “80” alt = “Mt. Fuji”>
According to the HTML standard, it is defined as follows.

「属性」は、IMG要素内に含まれ、「=」で結ばれている「src=“image/fuji.jpg”」、「width=“100”」等である。   The “attribute” is included in the IMG element, and “src =“ image / fuji. jpg "", "width =" 100 "", and the like.

また、「src属性」は、属性のうちで、「src=」を含む属性であり、「width属性」は、属性のうちで、「width=」を含む属性である。「属性名」は、属性のうちで、「=」の前に記述されている「src」、「width」等である。「属性値」は、属性のうちで、「=」の後に続く「“image/fuji.jpg”」、「“100”」等である。   The “src attribute” is an attribute including “src =” among the attributes, and the “width attribute” is an attribute including “width =” among the attributes. “Attribute name” is “src” or “width” described before “=” among the attributes. The “attribute value” is an attribute ““ image / fuji. jpg "", "100" ", and the like.

次に、各属性の機能について説明する。   Next, the function of each attribute will be described.

「src=“image/fuji.jpg”」、すなわちsrc属性は、参照する画像ファイルを参照していることを示し、この例では、「image」フォルダ内の「fuji.jpg」ファイルを参照していることを意味する。   “Src =“ image / fuji. “jpg” ”, that is, the src attribute indicates that the image file to be referred to is referred to. In this example, the“ fuji.jpg ”file in the“ image ”folder is referred to.

「alt=“富士山”」、すなわち、alt属性値は、画像の概要説明である。画像が表示されていない場合でも、利用者は、上記alt属性値が示す画像の概要説明を見ることによって、その画像を推測することができる。また、このalt属性値は、音声ブラウザでも、画像の代替情報として、読み上げられ、その内容を推測することができる。   “Alt =“ Mt. Fuji ””, that is, the alt attribute value is an outline description of the image. Even when the image is not displayed, the user can guess the image by looking at the outline description of the image indicated by the alt attribute value. The alt attribute value is also read out as substitute information for an image even in a voice browser, and the contents can be estimated.

さて、参照する画像が互いに同じであるものについて、alt属性値のリストを作り、alt属性値を比較し、alt属性値が互いに同じであれば、alt属性値が適切なものであることが分かる。   Now, for images that refer to the same image, create a list of alt attribute values, compare the alt attribute values, and find that the alt attribute values are appropriate if the alt attribute values are the same. .

次に、実施例1において、alt属性値リストを作成する動作について説明する。   Next, an operation for creating an alt attribute value list in the first embodiment will be described.

図2は、実施例1において、alt属性値リストを作成する動作を示すフローチャートである。   FIG. 2 is a flowchart illustrating an operation of creating an alt attribute value list in the first embodiment.

まず、S1では、情報入力部18を介して、チェック対象とするフォルダ、そのフォルダ内に含まれているファイルから取得する要素情報と、得られた要素情報を処理する処理手段と、出力形式とを指定する。たとえば、以下のようなコマンドを、情報入力部18のキーボードを介して入力する。   First, in S1, via the information input unit 18, a folder to be checked, element information acquired from a file included in the folder, processing means for processing the obtained element information, output format, Is specified. For example, the following command is input via the keyboard of the information input unit 18.

なお、上記「要素情報」は、マークアップ言語で記述されている文書を構成する情報である。   The “element information” is information constituting a document described in a markup language.

PATH(“C:¥sample¥;test”)、
GET(W=“<IMG>src”,X=“<IMG>alt”)、
PROCESS(SORT((Wm==Wn)&&(Xm!=Xn)))、
OUTPUT(CSV)
上記要素情報等を指定する手段を用いる代わりに、たとえば、テキストファイルに上記要素情報等を予め記入し、読み込ませる等の手段を使用するようにしてもよい。また、記述形式も上記以外の記述形式でもよい。
PATH ("C: \ sample \; test"),
GET (W = “<IMG> src”, X = “<IMG> alt”),
PROCESS (SORT ((Wm == Wn) && (Xm! = Xn))),
OUTPUT (CSV)
Instead of using the means for designating the element information or the like, for example, a means for pre-filling and reading the element information or the like in a text file may be used. The description format may also be a description format other than the above.

次に、S2では、S1で指定されたローカルディスクLD内のフォルダ(“C:¥sample¥test”)に含まれている全てのHTMLファイルデータを取得し、ファイル情報蓄積部13に蓄積する。ここで、フォルダ内に、フォルダ(子フォルダ)を持っている場合、子フォルダの中のファイルも取得する。この操作を再帰的に行うことによって、フォルダ内の全てのHTMLファイルを取得する。   Next, in S 2, all the HTML file data included in the folder (“C: \ sample \ test”) in the local disk LD designated in S 1 is acquired and stored in the file information storage unit 13. If the folder has a folder (child folder), the files in the child folder are also acquired. By performing this operation recursively, all the HTML files in the folder are acquired.

S3では、ファイル情報蓄積部13が蓄積しているファイルデータを対象に、S1で指定した取得方法(GET(W=“<IMG>src”,X=“<IMG>alt”))で指定された要素情報を取得し、要素情報蓄積部15に蓄積する。   In S3, the file data stored in the file information storage unit 13 is specified by the acquisition method specified in S1 (GET (W = “<IMG> src”, X = “<IMG> alt”)). Element information is acquired and stored in the element information storage unit 15.

つまり、W=“<IMG>src”は、IMG要素のsrc属性値をW列に蓄積する手順であり、X=“<IMG>alt”は、IMG要素のalt属性値をX列に蓄積する手順である。   That is, W = “<IMG> src” is a procedure for storing the src attribute value of the IMG element in the W column, and X = “<IMG> alt” stores the alt attribute value of the IMG element in the X column. It is a procedure.

併せて、ソース内でのそのIMG要素の位置を特定できるように、チェックしたファイル名、ソース内での行番号を取得し、要素情報蓄積部15に、図3に示すように、一覧リストとして蓄積する。   In addition, the checked file name and the line number in the source are acquired so that the position of the IMG element in the source can be specified, and the element information storage unit 15 stores the list as shown in FIG. accumulate.

図3は、実施例1において、要素情報蓄積部15に蓄積されている要素情報の一覧リストを示す図である。   FIG. 3 is a diagram illustrating a list of element information stored in the element information storage unit 15 according to the first embodiment.

次に、実施例1において、詳細な要素情報の取得動作について説明する。   Next, in the first embodiment, detailed element information acquisition operation will be described.

図4は、実施例1において、ファイル情報蓄積部13に蓄積されている所定の複数のHTMLファイルから、要素情報を取得する動作を示すフローチャートである。   FIG. 4 is a flowchart illustrating an operation of acquiring element information from a plurality of predetermined HTML files stored in the file information storage unit 13 in the first embodiment.

まず、S11では、ファイル情報蓄積部13に蓄積されている1番目のHTMLファイルを取得する。S12では、取得したファイルの1行目のテキストを読み出し、S13では、そのテキスト内に対象要素(処理対象である要素情報)があるかどうかをチェックする(ここでは、IMG要素があるかどうかをチェックする)。   First, in S11, the first HTML file stored in the file information storage unit 13 is acquired. In S12, the text of the first line of the acquired file is read, and in S13, it is checked whether or not there is a target element (element information to be processed) in the text (in this case, whether or not there is an IMG element). To check).

対象要素があれば、S14で、対象要素の情報(ここでは、IMG要素のsrc属性値、alt属性値)を取得し、また、ファイル名と、ファイル内での位置(ここでは、行番号)とを取得し、要素情報蓄積部15に蓄積する。ファイル内での位置を示す指標は、HTMLファイルの行番号(その対象が存在する行番号)である。ファイル内の位置を示す指標として、行番号の代わりに、対象の文字番号(その対象が何文字目にあるかを示す指標)等、他の指標を用いるようにしてもよい。   If there is a target element, in S14, information on the target element (here, the src attribute value and alt attribute value of the IMG element) is obtained, and the file name and position in the file (here, the line number) Are stored in the element information storage unit 15. The index indicating the position in the file is the line number of the HTML file (the line number where the target exists). As an index indicating the position in the file, another index such as a target character number (an index indicating what character the target is in) may be used instead of the line number.

上記S13、S14の操作を、全ての行について実行する。その後に、S17で、ファイル情報蓄積部13に、次のファイルがあれば、そのファイルを対象にして、S12、S13の処理を実行する。   The operations of S13 and S14 are executed for all rows. After that, if there is a next file in the file information storage unit 13 in S17, the processing of S12 and S13 is executed for that file.

S14では、S11で情報入力部18を介して指定された処理手段、PROCESS(SORT((Wm==Wn)&&(Xm!=Xn)))に従って、処理する。ここで、「SORT((Wm==Wn)&&(Xm!=Xn))」は、W列のm行目の値とW列のn行目の値とが等しく、かつ、X列目のm行目の値とX列のn行目の値が異なる場合(つまり、同一画像を参照しているが、その画像の概要説明が異なる場合)にのみ、その画像への参照数が多い順に、並び替えて、要素情報蓄積部15に蓄積されている要素情報の一覧リストを更新する。   In S14, processing is performed according to the processing means, PROCESS (SORT ((Wm == Wn) && (Xm! = Xn))), which is designated via the information input unit 18 in S11. Here, “SORT ((Wm == Wn) && (Xm! = Xn))” is equal to the value of the mth row of the W column and the value of the nth row of the W column, and Only when the value of the m-th row is different from the value of the n-th row of the X column (that is, when the same image is referenced but the outline description of the image is different), the number of references to the image is in descending order. The list of element information stored in the element information storage unit 15 is updated by rearranging.

図5は、実施例1を示す図であって、図3に示す一覧リストにおいて、W列(src属性値)を分類したリストを示す図である。   FIG. 5 is a diagram illustrating the first embodiment and is a diagram illustrating a list in which W columns (src attribute values) are classified in the list illustrated in FIG. 3.

つまり、図5に示すリストは、統計処理(S11〜S18の処理)後に、要素情報蓄積部15に蓄積されたリストである。   That is, the list shown in FIG. 5 is a list accumulated in the element information accumulation unit 15 after the statistical process (the processes of S11 to S18).

S5では、要素情報蓄積部15に蓄積されているリストを、情報入力部18を介して指定された出力手段であるOUTPUT(csv)に従って、出力する。この場合の出力形式は、csv(Comma Separated Vlues)形式で出力する。つまり、各値を“,”(カンマ)区切りで出力する。   In S <b> 5, the list stored in the element information storage unit 15 is output according to OUTPUT (csv) that is an output means designated via the information input unit 18. The output format in this case is csv (Comma Separated Blues) format. That is, each value is output separated by “,” (comma).

このように出力されたcsvファイルを、表計算ソフト等で表示すれば、alt属性値が統一されていないIMG要素のみが一覧表示される。つまり、アクセシビリティ・ガイドラインに適していないIMG要素のみが一覧表示される。図5に示すリストでは、同じ画像ファイル「/image/fuji.jpg」に対応するalt属性値に、1つ目で「富士山」、2つ目で「富士」、3つ目で「富士山」というalt属性値が付いている。   If the csv file output in this way is displayed by spreadsheet software or the like, only IMG elements whose alt attribute values are not unified are displayed in a list. That is, only IMG elements that are not suitable for accessibility guidelines are listed. In the list shown in FIG. 5, the alt attribute value corresponding to the same image file “/image/fuji.jpg” is “Mt. Fuji” at the first, “Fuji” at the second, “Mt. Fuji” at the third. It has an alt attribute value.

ユーザが2つ目を修正しようと思えば、2つ目のHTMLファイル名、行番号を見て、HTMLファイルを修正することができる。これによって、効率的にalt値を修正することができる。つまり、同一サイトにおける全ページにおいて、要素情報を統一することができ、したがって、チェック時間を短縮することができ、コストを削減することができる。   If the user wants to modify the second, the HTML file can be modified by looking at the second HTML file name and line number. As a result, the alt value can be corrected efficiently. That is, the element information can be unified for all pages in the same site, so that the check time can be shortened and the cost can be reduced.

つまり、実施例1によれば、同一サイトにおける全ページにおいて、要素情報の統一性を容易に判断することができる。
That is, according to the first embodiment, it is possible to easily determine the uniformity of element information in all pages on the same site.

本発明の実施例2は、同一フォルダ内にある複数ページのHTMLファイルから、IMG要素の属性情報を抽出し、同一alt属性値であるが、異なる画像ファイルを参照している場合に、その数(alt属性値と画像ファイルとの組み合わせの数)を示すリストを生成し、HTMLファイルとして出力する実施例である。   In the second embodiment of the present invention, attribute information of IMG elements is extracted from an HTML file of a plurality of pages in the same folder, and the number of the same alt attribute values when different image files are referenced. In this embodiment, a list indicating (the number of combinations of alt attribute values and image files) is generated and output as an HTML file.

実施例2によれば、ユーザは、表示されている数(alt属性値と画像ファイルとの組み合わせの数)を参考にして、ファイルを容易に修正することができ、また、要素情報の統一性を確認することができる。   According to the second embodiment, the user can easily modify the file with reference to the displayed number (the number of combinations of the alt attribute value and the image file), and the uniformity of element information. Can be confirmed.

さて、alt属性値が同じであって、参照する画像が異なるリストを作り、このalt属性値リストのうちで参照するalt属性値同士を比較すれば、参照する画像が適切なものであるかどうかが分かる。   Now, if the alt attribute values are the same and the images to be referenced are made different lists, and the alt attribute values to be referred to in the alt attribute value list are compared, whether or not the images to be referred to are appropriate. I understand.

図6は、実施例2において、alt属性値リストを作成する動作を示すフローチャートである。   FIG. 6 is a flowchart illustrating an operation of creating an alt attribute value list in the second embodiment.

まず、S21では、情報入力部18を介して、チェック対象とするフォルダと、そのフォルダ内に含まれているファイルから取得すべき要素情報と、取得された要素情報の処理手段と、出力形式とを、指定する。たとえば、実施例1と同様に、以下のようにする。   First, in S21, the folder to be checked via the information input unit 18, the element information to be acquired from the files included in the folder, the processing means for the acquired element information, the output format, Is specified. For example, as in the first embodiment, the following is performed.

PATH(“C:¥sample¥;test”)、
GET(W=“<IMG>alt”,X=“<IMG>src”)、
PROCESS(SORT((Wm==Wn)&&(Xm!=Xn)))、
OUTPUT(HTML,with HILIGHT)
S22では、S21で指定されたローカルディスクLD内のフォルダ(“C:¥sample¥test”)に含まれている全てのHTMLファイルデータを取得し、ファイル情報蓄積部13に蓄積する。
PATH ("C: \ sample \; test"),
GET (W = “<IMG> alt”, X = “<IMG> src”),
PROCESS (SORT ((Wm == Wn) && (Xm! = Xn))),
OUTPUT (HTML, with HILIGHT)
In S22, all the HTML file data included in the folder (“C: \ sample \ test”) in the local disk LD designated in S21 is acquired and stored in the file information storage unit 13.

ここで、フォルダ内に、フォルダ(子フォルダ)を持っていれば、子フォルダの中のファイルをも取得する。この操作を再帰的に行うことによって、フォルダ内の全てのHTMLファイルを取得する。   Here, if the folder has a folder (child folder), the files in the child folder are also acquired. By performing this operation recursively, all the HTML files in the folder are acquired.

S23では、ファイル情報蓄積部13に蓄積されているファイルデータを対象に、S21で指定された取得方法(GET(W=“<IMG>alt”,X=“<IMG>src”))で指定された要素情報を取得し、情報蓄積部15に蓄積する。   In S23, the file data stored in the file information storage unit 13 is targeted with the acquisition method specified in S21 (GET (W = “<IMG> alt”, X = “<IMG> src”)). The acquired element information is acquired and stored in the information storage unit 15.

つまり、「W=“<IMG>alt”」は、IMG要素のalt属性値を、W列に蓄積することである。「X=“<IMG>src”」は、IMG要素のsrc属性値を、X列に蓄積することである。また、併せて、ソース内でそのIMG要素の位置を特定できるように、チェックしたファイル名、ソース内での行番号を取得し、要素情報蓄積部15に、図7に示すリストを蓄積する。   That is, “W =“ <IMG> alt ”” is to accumulate the alt attribute value of the IMG element in the W column. “X =“ <IMG> src ”” is to store the src attribute value of the IMG element in the X column. At the same time, the checked file name and the line number in the source are acquired so that the position of the IMG element in the source can be specified, and the list shown in FIG.

図7は、実施例2を示す図であって、図3に示す一覧リストにおいて、W列の記述内容とX列の記述内容とを入れ替え、W列にalt属性値を記述し、X列にsrc属性値を記述したリストを示す図である。   FIG. 7 is a diagram illustrating the second embodiment. In the list shown in FIG. 3, the description content of the W column and the description content of the X column are interchanged, the alt attribute value is described in the W column, and the X column is described. It is a figure which shows the list | wrist which described the src attribute value.

図8は、実施例2を示す図であって、図7に示す一覧リストにおいて、W列に同じalt属性値が複数記述されているalt属性値を分類して記述したリストを示す図である。   FIG. 8 is a diagram illustrating the second embodiment, and is a diagram illustrating a list in which the alt attribute values in which a plurality of the same alt attribute values are described in the W column are classified and described in the list list illustrated in FIG. 7. .

S24では、S21で情報入力部18を介して指定された処理手段、つまり、「PROCESS(SORT((Wm==Wn)&&(Xm!=Xn)),COUNT)に従って、処理する。   In S24, the processing is performed in accordance with the processing means designated through the information input unit 18 in S21, that is, “PROCESS (SORT ((Wm == Wn) && (Xm! = Xn)), COUNT).

「SORT((Wm==Wn)&&(Xm!=Xn))」は、W列のm行目の値と、W列のn行目の値とが等しく、X列目のm行目の値と、X列のn行目の値とが異なる場合(画像の説明が同じである、つまりalt属性値が同じであるが、参照している画像が異なる場合)にのみ、図8に示すように、参照している画像が多い順に並び替える。   “SORT ((Wm == Wn) && (Xm! = Xn))” is equal to the value of the mth row of the W column and the value of the nth row of the W column, FIG. 8 shows only when the value and the value in the nth row of the X column are different (the description of the image is the same, that is, the alt attribute value is the same, but the referenced image is different). In this way, the images are rearranged in the descending order of reference images.

したがって、図7の3つ目と7つ目とに記載されている「/image/yodogawa.jpg」は、画像の説明が同じであり、しかも参照している画像も同じであるので、図8に示すリスト(統計処理後に要素情報蓄積部15に蓄積されているリスト)には現われない。つまり、画像の説明と参照している画像とが同じものは、修正の必要がないので、図8に示すリストに含めない。   Therefore, “/image/yodogawa.jpg” described in the third and seventh items in FIG. 7 has the same image description, and the same image is referred to. (Lists accumulated in the element information accumulating unit 15 after statistical processing). That is, an image having the same description as the image being referred to does not need to be corrected and is not included in the list shown in FIG.

「画像の説明」と「参照している画像」との組み合わせのうちで、「画像の説明」が同じであり、しかも「参照している画像」も同一である組み合わせの数が多いほど、この組み合わせが多い「画像の説明」と「参照している画像」との組み合わせが妥当である可能性は高い。したがって、「画像の説明」と「参照している画像」との組み合わせの数に着目する。   Among the combinations of “Description of image” and “Referenced image”, the more the number of combinations in which “Description of image” is the same and “Referenced image” is also the same, the more There is a high possibility that a combination of “image description” and “referenced image” with many combinations is appropriate. Therefore, attention is focused on the number of combinations of “image description” and “referenced image”.

「画像の説明」と「参照している画像」との組み合わせが複数、存在している場合で、「画像の説明」が同じであるが、「参照している画像」が異なる組み合わせが複数種類、存在している場合、「画像の説明」と所定の「参照している画像」との組み合わせの数が少なければ、この組み合わせの数が少ない組み合わせにおける「参照している画像」を、組み合わせの数が多い組み合わせにおける「参照している画像」に修正すれば、効率よく修正することができる。COUNTは、上記組み合わせの数を付加し、要素情報蓄積部15に蓄積されているリスト(図8に示す)を更新する。つまり、図8に示してあるリストのうちの「同一組み合わせの数」の欄を更新する。   When there are multiple combinations of “Description of image” and “Referenced image”, “Description of image” is the same, but there are multiple types of combinations with different “Referenced image” If there is a small number of combinations of the “image description” and the predetermined “reference image”, the “reference image” in the combination with the small number of combinations is If it is corrected to “referenced image” in a combination having a large number, it can be corrected efficiently. COUNT adds the number of combinations described above and updates the list (shown in FIG. 8) stored in the element information storage unit 15. That is, the column “Number of identical combinations” in the list shown in FIG. 8 is updated.

図9は、実施例2を示す図であって、図8に示すリストに基づく表示例を示す図である。   FIG. 9 is a diagram illustrating the second embodiment and is a diagram illustrating a display example based on the list illustrated in FIG. 8.

つまり、図9に示す表示例は、図8に示すリストを統計処理した結果を、ブラウザで表示した例を示す図である。   That is, the display example shown in FIG. 9 is a diagram showing an example in which the result of statistical processing of the list shown in FIG. 8 is displayed by a browser.

S25では、情報入力部18を介して指定された出力手段、OUTPUT(HTML,whth HILIGHT)に従って、要素情報蓄積部15に蓄積されているリストを、図9に示すように、出力する。この場合の出力形式は、HTML形式であり、whth HILIGHTは、S24で求めた「組み合わせの数が少ない組み合わせにおける「参照している画像」(要素情報)」をハイライトで出力する。これによって、「参照している画像」を修正するように、ユーザに注意を促す。   In S25, the list stored in the element information storage unit 15 is output as shown in FIG. 9, according to the output means OUTPUT (HTML, WHIGHT) specified via the information input unit 18. The output format in this case is the HTML format, and WHHI HILIGHT outputs the “referenced image” (element information) in the combination with a small number of combinations obtained in S24 in highlight. This prompts the user to correct the “referenced image”.

ユーザは、参照する画像のファイル名をクリックすれば、その画像を確認することができ、また、HTMLファイル名をクリックすれば、その画像が使用しているページを確認することができる。したがって、統一性が取れていないIMG要素を容易に発見することができ、容易に修正することができる。
The user can confirm the image by clicking the file name of the image to be referenced, and can confirm the page used by the image by clicking the HTML file name. Therefore, IMG elements that are not uniform can be easily found and can be easily corrected.

本発明の実施例3は、同一サイト内にある複数のHTMLファイルから、A要素の情報を取得し、参照するリンク先毎に、リンクテキストを比較し、ユーザが指定した閾値を基準にして、互いに異なるリンクテキストを自動的に統一し、この修正結果を出力する実施例である。   In the third embodiment of the present invention, information on the A element is acquired from a plurality of HTML files in the same site, the link text is compared for each link destination to be referenced, and the threshold specified by the user is used as a reference. In this embodiment, different link texts are automatically unified and the correction result is output.

なお、上記「A要素」は、HTML規格において、「<A・・・>」と「</A>」とによって囲まれている部分である。   The “A element” is a portion surrounded by “<A ...>” and “</A>” in the HTML standard.

次に、HTMLファイル内でのA要素の書式について説明する。   Next, the format of the A element in the HTML file will be described.

<A>タグの書式は、一般的に以下のような形式をとる。   The format of the <A> tag generally takes the following format.

<A href=“http://www.fujisan−net.jp/”>富士山カメラ</A>
HTML規格によると、以下のように呼ばれる。また、「属性」は、<A・・・>要素内に含まれ、「=」で結ばれている「href=“http://www.fujisan−net.jp/”である。
<A href=“http://www.fujisan-net.jp/”> Mt. Fuji camera </A>
According to the HTML standard, it is called as follows. The “attribute” is included in the <A... Element, and “href =“ http: // www. Fujisan-net. jp / ".

「属性名」は、「=」の前に記述されている「href」である。   The “attribute name” is “href” described before “=”.

「属性値」は、「=」の後に続く「“http://www.fujisan−net.jp/”」である。   The “attribute value” is ““ http: // www. Fujisan-net. jp / "".

「リンクテキスト」は、「<A・・・>」と「</A>」との間に記述されているテキストであり、上記例では、「富士山カメラ」である。   “Link text” is text described between “<A...>” And “</A>”. In the above example, “link text” is “Mt. Fuji camera”.

次に、機能について説明する。   Next, functions will be described.

「href=“http://www.fujisan−net.jp/”」は、リンク先のアドレスを示し、リンクテキスト部分である「富士山カメラ」の文章を、マウスでクリックすると、「http://www.fujisan−net.jp/」のページを閲覧することができる。   “Href =“ http: // www. Fujisan-net. "jp /" "indicates the address of the link destination, and when the sentence of" Mount Fuji Camera "that is the link text part is clicked with the mouse, the page of" http://www.fujisan-net.jp/ "is browsed be able to.

次に、実施例3において、リンクテキストをチェックする動作について説明する。   Next, an operation for checking the link text in the third embodiment will be described.

図10は、実施例3において、リンクテキストをチェックする動作を示すフローチャートである。   FIG. 10 is a flowchart illustrating an operation of checking the link text in the third embodiment.

まず、S31では、情報入力部18を介して、チェック対象とするサイトのトップページアドレスと、そのページ以下のページから取得する要素情報と、得られた要素情報の処理方法と、出力形式とを指定する。たとえば、実施例1と同様に、以下のようにする。   First, in S31, through the information input unit 18, the top page address of the site to be checked, the element information acquired from the page below that page, the processing method of the obtained element information, and the output format are displayed. specify. For example, as in the first embodiment, the following is performed.

PATH(“http://WWW.sample.net”)、
GET(W=“<A>href”,X=“<A>TEXT</A>”)、
PROCESS(EDIT(((Wm==Wn)&&(Xm!=Xn)),3))、
OUTPUT(“html”)
S32では、ウェブサーバWS上にあり、S31で指定されたトップページアドレス(“http://WWW.sample.net”)以下の全ページのHTMLファイルデータを、ネットワークNWを介して取得し、ファイル情報蓄積部13に蓄積する。
PATH (“http://WWW.sample.net”),
GET (W = “<A> href”, X = “<A> TEXT </A>”),
PROCESS (EDIT ((((Wm == Wn) && (Xm! = Xn)), 3)),
OUTPUT (“html”)
In S32, the HTML file data of all pages below the top page address (“http://WWW.sample.net”) specified in S31 on the web server WS is acquired via the network NW. The information is stored in the information storage unit 13.

次に、実施例3において、ネットワーク経由で、同一サイトの全ページを取得する動作について説明する。   Next, an operation for acquiring all pages of the same site via the network in the third embodiment will be described.

図11は、本発明の実施例3において、ネットワークNWを経由して、同一サイトの全ページを取得する動作を示すフローチャートである。   FIG. 11 is a flowchart showing an operation of acquiring all pages of the same site via the network NW in the third embodiment of the present invention.

まず、S41では、取得するサイトのトップページアドレスを、取得リストに追加する。S42では、取得リストの1番目(つまり、トップページ)のアドレスのHTMLファイルを取得する。S43では、そのファイルの1行目を読み出す。   First, in S41, the top page address of the site to be acquired is added to the acquisition list. In S42, the HTML file of the first address (that is, the top page) in the acquisition list is acquired. In S43, the first line of the file is read.

S44では、A要素が含まれているかどうかをチェックし、A要素が含まれていれば、S45で、そのhref属性値(つまり、リンク先アドレス)を取得し、そのアドレスに基づいて、同一サイトであるかどうかを判定する。   In S44, it is checked whether or not the A element is included. If the A element is included, the href attribute value (that is, the link destination address) is acquired in S45, and the same site is acquired based on the address. It is determined whether or not.

S46では、そのアドレスが取得リストに含まれているかどうかをチェックし、そのアドレスが取得リストに含まれていなければ、S47で、取得リストに追加する。このS44〜S47の操作を、全ての行について実行する。   In S46, it is checked whether the address is included in the acquisition list. If the address is not included in the acquisition list, it is added to the acquisition list in S47. The operations of S44 to S47 are executed for all rows.

S49では、取得リストに、次のアドレスが含まれていれば、そのアドレスのHTMLファイルを取得し、S43〜S48の操作を行う。この操作を繰り返し実行することによって、サイト内に含まれている全てのページのHTMLファイルを取得できる。   In S49, if the next address is included in the acquisition list, the HTML file of that address is acquired, and the operations in S43 to S48 are performed. By repeatedly executing this operation, HTML files of all pages included in the site can be acquired.

S33で、ファイル情報蓄積部13のファイルデータを対象に、S31のGETコマンド以下で指定された要素情報を取得し、情報蓄積部15に蓄積する。つまり、「W=“<A>href”」は、A要素のsrc属性値をW列に蓄積し、「X=“<A>”」は、<A>と</A>とに挟まれているテキスト(つまり、リンクテキスト)をX列に蓄積する。   In S33, element information designated by the GET command or less in S31 is acquired for the file data in the file information storage unit 13 and stored in the information storage unit 15. That is, “W =“ <A> href ”” stores the src attribute value of the A element in the W column, and “X =“ <A> ”” is sandwiched between <A> and </A>. Stored text (that is, link text) is stored in the X column.

図12は、実施例3を示す図であって、要素情報蓄積部15に蓄積されている要素情報の一覧リストを示す図である。   FIG. 12 is a diagram illustrating the third embodiment, and is a diagram illustrating a list of element information stored in the element information storage unit 15.

また、ソース内の位置を特定できるように、チェックしたファイル名、ソース内での行数を取得し、図12に示すように、要素情報蓄積部15にリスト化して蓄積する。   Further, the checked file name and the number of lines in the source are acquired so that the position in the source can be specified, and the list is stored in the element information storage unit 15 as shown in FIG.

S34では、情報入力部18で指定された処理手段、PROCESS(EDIT(((Wm==Wn)&&(Xm!=Xn)),3))に従って、処理する(統計処理する)。   In S34, processing (statistical processing) is performed according to the processing means designated by the information input unit 18, PROCESS (EDIT (((Wm == Wn) && (Xm! = Xn)), 3)).

上記「EDIT(((Wm==Wn)&&(Xm!=Xn)),3)」は、W列のm行目の値と、W列のn行目とが等しく、かつ、X列目のm行目の値と、X列のn行目の値とが異なる場合にのみ、その数を計算する。つまり、同一リンク先であるが、そのリンクテキストが異なる場合にのみ、その数を計算する。さらに、同一リンク先で、多数派でないリンクテキストの数と、多数派のリンクテキストの数との比が、ユーザが指定した閾値(この場合は、3倍)以上であれば、多数派のリンクテキストに、自動的に統一することを意味する。   The above “EDIT (((Wm == Wn) && (Xm! = Xn)), 3)” indicates that the value of the mth row of the W column is equal to the nth row of the W column, and the Xth column. The number is calculated only when the value of the m-th row is different from the value of the n-th row of the X column. That is, the number is calculated only when the link destination is the same, but the link text is different. Furthermore, if the ratio of the number of non-majority link text to the majority link text at the same link destination is greater than or equal to the user-specified threshold (in this case, three times), the majority link. This means that text is automatically unified.

図13は、実施例3を示す図であって、図12に示す一覧リストにおいて、W列に同じリンク先が複数記述されているリストを示す図である。   FIG. 13 is a diagram illustrating the third embodiment, and is a diagram illustrating a list in which a plurality of the same link destinations are described in the W column in the list list illustrated in FIG. 12.

つまり、同一リンク先であるが、そのリンクテキストが異なる場合にのみ、そのリンクテキストの数を付加し、さらに、同一リンクに対する多数派(「同一リンク先」とその「リンクテキスト」との組み合わせの数が多い組み合わせ)の数と、同一リンクに対する少数派(「同一リンク先」とその「リンクテキスト」との組み合わせの数が少ない組み合わせ)の数とを比較し、3倍以上であれば、目印を付ける統計処理を実行する。そして、この統計処理をした後に、図13に示すリストを、要素情報蓄積部15に蓄積する。   In other words, only when the link destination is the same, but the link text is different, the number of the link text is added, and the majority for the same link (the combination of “the same link destination” and the “link text” Compare the number of combinations with a large number) with the number of minorities (combinations with a small number of combinations of “same link destination” and “link text”) for the same link. Execute statistical processing with. Then, after performing this statistical processing, the list shown in FIG. 13 is stored in the element information storage unit 15.

S35では、情報入力部18を介して指定された出力手段、OUTPUT(“HTML”)に従って、要素情報蓄積部15に記憶されているリストを出力する。   In S35, the list stored in the element information storage unit 15 is output in accordance with the output means OUTPUT (“HTML”) designated via the information input unit 18.

なお、図13に記載されている修正候補における「0」は、修正候補ではないこと(修正の必要がないこと)を示し、「1」は、修正候補であること(修正の必要があること)を示している。   Note that “0” in the correction candidates described in FIG. 13 indicates that the correction candidate is not a correction candidate (no correction is necessary), and “1” is a correction candidate (needs correction) ).

図14は、実施例3を示す図であって、図13に示すリストに基づく表示例を示す図である。   FIG. 14 is a diagram illustrating the third embodiment and is a diagram illustrating a display example based on the list illustrated in FIG. 13.

つまり、図14は、統計処理後の結果をブラウザで表示した例を示す図である。   That is, FIG. 14 is a diagram illustrating an example in which the result after statistical processing is displayed on the browser.

この場合、図14に示すように、HTML形式のリストで出力する。ここで、修正されたリンクテキストについて、修正されたことが明示されている。すなわち、図13に示す例では、4つ目のリンクテキスト「富士」が、「富士山」に修正されている。   In this case, as shown in FIG. 14, an HTML list is output. Here, it is clearly indicated that the corrected link text has been corrected. That is, in the example shown in FIG. 13, the fourth link text “Fuji” is corrected to “Mt. Fuji”.

実施例3は、サイトが多数である場合等、リンクテキストを確認することが従来は困難であっても、上記のように、リンクテキストを自動的に修正し、統一するので、チェック・修正に要する時間を短縮することができる。
The third embodiment automatically checks and corrects the link text as described above even when it is difficult to confirm the link text in the case where there are a large number of sites. The time required can be shortened.

本発明の実施例4は、チェック対象のページアドレスリストを記述したファイルを読み込み、この読み込んだアドレスリストのHTMLファイルについて、TITLE要素で指定されたページタイトルを取得し、この取得したページタイトルをリストに追加し、同一タイトルテキストがある場合、タイトルテキストを変更することを、ユーザに促す実施例である。   The fourth embodiment of the present invention reads a file describing a page address list to be checked, acquires the page title specified by the TITLE element for the HTML file of the read address list, and lists the acquired page title. This is an embodiment in which the user is prompted to change the title text when there is the same title text.

まず、実施例4において、ページタイトルの役割について説明する。   First, the role of the page title in Example 4 will be described.

「ページタイトル」は、たとえば、ウェブブラウザのブックマークを登録するときに、ブックマーク名になるので、ページの内容を表わす固有の名称でなければならない。また、多くの音声ブラウザでは、最初にページタイトル情報を読み上げるが、同一サイト内の複数のページに同一のページタイトルが付与されていると、どのページを閲覧しているかを、本文を聞くまで判定することができない。したがって、各ページに固有のページタイトルを付ける必要がある。各ページに固有のページタイトルを付けることは、JISの項目でも指定されている。   The “page title” becomes a bookmark name when registering a bookmark of a web browser, for example, and must be a unique name representing the contents of the page. Many voice browsers read the page title information first, but if the same page title is assigned to multiple pages in the same site, it is determined which page is being viewed until the text is heard. Can not do it. Therefore, it is necessary to give a unique page title to each page. Giving a unique page title to each page is also specified in the JIS item.

次に、実施例4において、HTMLファイル内でのTITLE要素の書式について説明する。   Next, in the fourth embodiment, the format of the TITLE element in the HTML file will be described.

TITLE要素書式は、一般的に以下の形式をとる。   The TITLE element format generally takes the following form.

<TITLE>富士山観光案内</TITLE>
上記のように、「TITLE要素」は、「<TITLE・・・>」と「</TITLE>」とを含み、「<TITLE・・・>」と「</TITLE>」とによって囲まれた部分によって構成されている。なお、「ページタイトル」は、「<TITLE・・・>」と「</TITLE>」とを含まず、「<TITLE・・・>」と「</TITLE>」との間に記述されている内容、たとえば「富士山観光案内」である。
<TITLE> Sightseeing in Mt. Fuji </ TITLE>
As described above, the “TITLE element” includes “<TITLE ...>” and “</ TITLE>” and is surrounded by “<TITLE ...>” and “</ TITLE>”. It is composed of parts. The “page title” does not include “<TITLE ...>” and “</ TITLE>”, and is described between “<TITLE ...>” and “</ TITLE>”. For example, “Mt. Fuji Tourist Information”.

次に、実施例4において、ページタイトルリストを作成する動作について説明する。   Next, an operation for creating a page title list in the fourth embodiment will be described.

図15は、本発明の実施例4を示す図であって、要素情報比較装置100の動作を示すフローチャートである。   FIG. 15 is a flowchart illustrating the operation of the element information comparison apparatus 100 according to the fourth embodiment of the present invention.

つまり、図15は、ページタイトルリストを作成する動作を示すフローチャートである。   That is, FIG. 15 is a flowchart showing an operation of creating a page title list.

まず、S61では、情報入力部18を介して、チェック対象リストを記述したファイルへのパスと、そのページ以下のページから取得する要素情報と、得られた要素情報の処理方法と、出力形式とを、指定する。たとえば、実施例1と同様に、以下のように指定する。   First, in S61, the path to the file describing the check target list via the information input unit 18, the element information acquired from the page below that page, the processing method of the obtained element information, the output format, Is specified. For example, as in the first embodiment, the following designation is made.

INPUT(“checklist.txt”)、
GET(W=“<TITLE>TEXT</TITLE>”)、
PROCESS(Wm==Wn)、
OUTPUT(“html”)
S62では、S61で指定されたチェック対象のアドレスリストが記述されたファイル「checklist.txt」を読み込み、この読み込んだ全ページのHTMLファイルデータを取得し、この取得した全ページのHTMLファイルデータを、ファイル情報蓄積部13に蓄積する。
INPUT (“checklist.txt”),
GET (W = “<TITLE> TEXT </ TITLE>”),
PROCESS (Wm == Wn),
OUTPUT (“html”)
In S62, the file “checklist.txt” in which the address list to be checked designated in S61 is described is read, the HTML file data of all the read pages is acquired, and the HTML file data of all the acquired pages is acquired. It is stored in the file information storage unit 13.

S63では、ファイル情報蓄積部13に蓄積されているHTMLファイルデータから、S61のGETコマンド以下で指定された要素情報を取得し、情報蓄積部15に蓄積する。W=“<TITLE>TEXT</TITLE>”において、<TITLE>と</TITLE>との間に挟まれているテキスト(つまり、ページタイトル)を、W列に蓄積する。   In S 63, element information specified by the GET command or less in S 61 is acquired from the HTML file data stored in the file information storage unit 13 and stored in the information storage unit 15. In W = “<TITLE> TEXT </ TITLE>”, the text sandwiched between <TITLE> and </ TITLE> (that is, the page title) is stored in the W column.

図16は、実施例4を示す図であって、要素情報蓄積部15に蓄積されている要素情報の一覧リストを示す図である。   FIG. 16 is a diagram illustrating the fourth embodiment, and is a diagram illustrating a list of element information stored in the element information storage unit 15.

また、ソース内の位置を特定できるように、チェックしたファイル名、ソース内での行番号を取得し、図16に示すように、リスト化し、このリストを情報蓄積部15に蓄積する。   Further, the checked file name and the line number in the source are acquired so that the position in the source can be specified, and the list is stored as shown in FIG. 16, and this list is stored in the information storage unit 15.

S64では、情報入力部18を介して指定された統計処理手段、PROCESS(Wm==Wn)に従って、処理する。上記「(Wm==Wn)」は、W列のm行目の値と、W列のn行目の値とが等しい場合にのみ、出力する処理である。つまり、異なるHTMLファイルについて同一ページタイトルを用いている場合にのみ、出力する処理である。   In S64, processing is performed in accordance with the statistical processing means, PROCESS (Wm == Wn) designated via the information input unit 18. The “(Wm == Wn)” is a process of outputting only when the value of the mth row of the W column is equal to the value of the nth row of the W column. That is, it is a process of outputting only when the same page title is used for different HTML files.

図17は、実施例4を示す図であって、図16に示す一覧リストにおいて、W列(ページタイトル)を分類したリストを示す図である。   FIG. 17 is a diagram illustrating the fourth embodiment, and is a diagram illustrating a list in which W columns (page titles) are classified in the list illustrated in FIG. 16.

つまり、図17に示すように、異なるページに、同一のページタイトルが付与されている場合のみを、要素情報蓄積部15に蓄積する。   That is, as shown in FIG. 17, only when the same page title is assigned to different pages, the element information storage unit 15 stores the same page title.

S65では、情報入力部18を介して指定された出力手段、OUTPUT(“HTML”)に従って、要素情報蓄積部15に蓄積されているリストを出力する。   In S65, the list stored in the element information storage unit 15 is output in accordance with the output means OUTPUT (“HTML”) designated via the information input unit 18.

図18は、実施例4を示す図であって、図17に示すリストに基づく表示例である。   FIG. 18 is a diagram illustrating the fourth embodiment, and is a display example based on the list illustrated in FIG. 17.

つまり、図18は、実施例4において、統計処理結果をブラウザで表示した例を示す図である。   That is, FIG. 18 is a diagram illustrating an example in which the statistical processing result is displayed by the browser in the fourth embodiment.

この場合、図18に示すように、「同一タイトルですので、変更してください。」と要求を出しているHTMLファイルを出力する(S65)。   In this case, as shown in FIG. 18, the HTML file which has issued the request “Same title, please change” is output (S65).

すなわち、上記実施例は、所定の同一サイトにおける複数のページから、所定の絞り込み条件に合致する要素情報を取得する要素情報取得手段と、上記要素情報取得手段が取得した要素情報を統計分析する統計分析手段と、上記統計分析手段が統計分析した結果のリストを生成するリスト生成手段とを有する要素情報比較装置の例である。   That is, in the above embodiment, element information acquisition means for acquiring element information that matches a predetermined narrowing-down condition from a plurality of pages on a predetermined same site, and statistics for statistical analysis of element information acquired by the element information acquisition means It is an example of the element information comparison apparatus which has an analysis means and a list production | generation means which produces | generates the list | wrist of the result analyzed by the said statistical analysis means.

この場合、上記絞込み条件は、少なくとも1つの要素情報である。   In this case, the narrowing-down condition is at least one element information.

また、上記所定の絞り込み条件に合致する要素情報は、マークアップ言語で記述された文書名と、画像ファイル名と、画像の説明情報と、マークアップ言語で記述された文書内の位置を表わす情報とである。この場合、マークアップ言語で記述された文書名は、図3におけるY列のHTMLファイル名であり、画像ファイル名は、図3におけるW列のsrc属性値であり、画像の説明情報は、図3におけるX列のalt属性値である、マークアップ言語で記述された文書内の位置を表わす情報は、図3におけるZ列の行番号である。   The element information that matches the predetermined narrowing-down condition includes document name described in a markup language, image file name, image description information, and information representing a position in the document described in the markup language. It is. In this case, the document name described in the markup language is the HTML file name in the Y column in FIG. 3, the image file name is the src attribute value in the W column in FIG. 3, and the image description information is The information representing the position in the document described in the markup language, which is the alt attribute value of the X column in 3, is the row number of the Z column in FIG.

さらに、上記所定の絞り込み条件に合致する要素情報は、マークアップ言語で記述された文書名と、リンク先と、リンク先の説明情報と、マークアップ言語で記述された文書内の位置を表わす情報とである。この場合、マークアップ言語で記述された文書名は、図12におけるY列の対象ファイルへの絶対パスであり、リンク先は、図12におけるW列のリンク先であり、リンク先の説明情報は、図12におけるX列のリンクテキストであり、マークアップ言語で記述された文書内の位置を表わす情報は、図12におけるZ列の行番号である。   Further, the element information that matches the predetermined narrowing-down condition includes document name described in markup language, link destination, link destination explanation information, and information indicating a position in the document described in markup language. It is. In this case, the document name described in the markup language is the absolute path to the target file in the Y column in FIG. 12, the link destination is the link destination in the W column in FIG. 12, and the description information of the link destination is 12 is the link text of the X column in FIG. 12, and the information indicating the position in the document described in the markup language is the row number of the Z column in FIG.

そして、上記所定の絞り込み条件に合致する要素情報は、マークアップ言語で記述された文書名と、ページタイトルと、マークアップ言語で記述された文書内の位置を表わす情報とである。この場合、マークアップ言語で記述された文書名は、図16におけるY列のHTMLファイル名であり、ページタイトルは、図16におけるW列のページタイトルであり、マークアップ言語で記述された文書内の位置を表わす情報は、図16におけるZ列の行番号である。   The element information that matches the predetermined narrowing condition is a document name described in a markup language, a page title, and information indicating a position in the document described in the markup language. In this case, the document name described in the markup language is the HTML file name in the Y column in FIG. 16, the page title is the page title in the W column in FIG. 16, and the document title is described in the markup language. The information indicating the position of is the row number of the Z column in FIG.

さらに、上記統計分析手段は、マークアップ言語で記述されている文書における複数の要素情報群のうちの所定の要素情報を基準にして、マークアップ言語で記述されている文書における複数の要素情報を並べ替える手段である。   Further, the statistical analysis means is configured to extract a plurality of element information in the document described in the markup language with reference to predetermined element information among a plurality of element information groups in the document described in the markup language. It is a means of rearranging.

また、上記統計分析手段は、マークアップ言語で記述されている文書における複数の要素情報のうちの所定の要素情報を基準にし、マークアップ言語で記述されている文書における複数の要素情報を分類する手段である。   The statistical analysis means classifies the plurality of element information in the document described in the markup language with reference to predetermined element information among the plurality of element information in the document described in the markup language. Means.

さらに、上記統計分析手段は、マークアップ言語で記述されている文書における複数の要素情報のうちの所定の要素情報を基準にして、マークアップ言語で記述されている文書における複数の要素情報を分類し、この分類毎に、要素情報の個数を比較し、個数が少ない要素情報に、印を付与する手段である。   Further, the statistical analysis means classifies the plurality of element information in the document described in the markup language with reference to predetermined element information among the plurality of element information in the document described in the markup language. In this classification, the number of element information is compared, and a mark is given to element information with a small number.

そして、上記統計分析手段は、マークアップ言語で記述された文書における複数の要素情報のうちの所定の要素情報を基準にして、マークアップ言語で記述されている文書における複数の要素情報を分類し、この分類毎に、要素情報の個数を比較し、表記を修正すべき要素情報に印を付与する手段である。   The statistical analysis means classifies the plurality of element information in the document described in the markup language with reference to predetermined element information among the plurality of element information in the document described in the markup language. This is a means for comparing the number of element information for each classification and adding a mark to the element information whose notation is to be corrected.

また、上記リスト生成手段は、マークアップ言語で記述されている文書における複数の要素情報のうちの所定の要素情報を基準にして、マークアップ言語で記述されている文書における複数の要素情報を分類し、この分類毎に、要素情報の個数を表示する手段である。   The list generation means classifies the plurality of element information in the document described in the markup language with reference to predetermined element information among the plurality of element information in the document described in the markup language. In addition, it is means for displaying the number of element information for each classification.

上記実施例をプログラムの発明として把握することができる。つまり、上記実施例は、所定の同一サイトにおける複数のページから、所定の絞り込み条件に合致する要素情報を取得し、記憶装置に記憶する要素情報取得手順と、上記要素情報取得手順で取得した要素情報を統計分析し、記憶装置に記憶する統計分析手順と、上記統計分析手順で統計分析した結果のリストを生成し、記憶装置に記憶するリスト生成手順とをコンピュータに実行させるプログラムの例である。   The above embodiment can be grasped as a program invention. That is, in the above embodiment, element information that matches a predetermined narrowing condition is acquired from a plurality of pages in a predetermined same site and stored in a storage device, and the elements acquired by the element information acquisition procedure It is an example of a program for causing a computer to execute a statistical analysis procedure for statistically analyzing information and storing it in a storage device, and a list generation procedure for generating a list of the results of statistical analysis performed by the statistical analysis procedure and storing the list in the storage device .

上記実施例によれば、同一サイトにおける全ページに渡って、要素情報の統一性を判断することができる。   According to the above embodiment, it is possible to determine the uniformity of the element information over all pages in the same site.

上記実施例によれば、同一サイトにおける全ページの画像に渡って、同じ画像についてalt属性値の表記(画像の説明)が統一されるので、音声ブラウザで情報を得る際にも、同じ画像に同じalt属性値が確実に付けられ、画像を連想し易くなる。   According to the above-described embodiment, the alt attribute value notation (description of the image) is unified for the same image over the images of all pages on the same site. The same alt attribute value is reliably assigned, and it is easy to associate an image.

上記実施例によれば、同一サイトにおける全ページの画像に渡って、リンクテキストの表記が統一されるので、リンク先に移動する前に、リンク先を特定することができ、したがって、不用意に、同じリンク先に何度も移動することがなくなる。   According to the above-mentioned embodiment, since the notation of the link text is unified over the images of all pages in the same site, the link destination can be specified before moving to the link destination. , You will not move to the same link many times.

また、上記実施例によれば、同一サイト内で、同じ画像について、互いに異なるページタイトルを設定できるので、ページタイトルのみを聞く、または、見るだけで、ページを特定することができ、したがって、効率的に目的ページを閲覧することができる。
Further, according to the above-described embodiment, different page titles can be set for the same image in the same site. Therefore, it is possible to specify a page only by listening to or viewing the page title. The target page can be browsed.

本発明の実施例1である要素情報比較装置100と、ウェブサーバWSと、ネットワークNWと、ローカルディスクLDとを示すブロック図である。1 is a block diagram illustrating an element information comparison device 100, a web server WS, a network NW, and a local disk LD that are Embodiment 1 of the present invention. 実施例1において、alt属性値リストを作成する動作を示すフローチャートである。10 is a flowchart illustrating an operation of creating an alt attribute value list in the first embodiment. 実施例1において、要素情報蓄積部15に蓄積されている要素情報の一覧リストを示す図である。In Example 1, it is a figure which shows the list list of the element information accumulate | stored in the element information storage part 15. FIG. 実施例1において、ファイル情報蓄積部13に蓄積されている所定の複数のHTMLファイルから、要素情報を取得する動作を示すフローチャートである。6 is a flowchart illustrating an operation of acquiring element information from a plurality of predetermined HTML files stored in a file information storage unit 13 in the first embodiment. 実施例1を示す図であって、図3に示す一覧リストにおいて、W列(src属性値)を分類したリストを示す図である。FIG. 6 is a diagram illustrating the first embodiment and is a diagram illustrating a list in which W columns (src attribute values) are classified in the list list illustrated in FIG. 3. 実施例2において、alt属性値リストを作成する動作を示すフローチャートである。10 is a flowchart illustrating an operation of creating an alt attribute value list in the second embodiment. 実施例2を示す図であって、図3に示す一覧リストにおいて、W列の記述内容とX列の記述内容とを入れ替え、W列にalt属性値を記述し、X列にsrc属性値を記述したリストを示す図である。FIG. 10 is a diagram illustrating the second embodiment, in which the description content of the W column and the description content of the X column are interchanged, the alt attribute value is described in the W column, and the src attribute value is described in the X column in the list shown in FIG. It is a figure which shows the described list. 実施例2を示す図であって、図7に示す一覧リストにおいて、W列に同じalt属性値が複数記述されているalt属性値を分類して記述したリストを示す図である。FIG. 10 is a diagram illustrating the second embodiment, and is a diagram illustrating a list in which the alt attribute values in which a plurality of the same alt attribute values are described in the W column are classified and described in the list list illustrated in FIG. 7. 実施例2を示す図であって、図8に示すリストに基づく表示例を示す図である。It is a figure which shows Example 2, Comprising: It is a figure which shows the example of a display based on the list | wrist shown in FIG. 実施例3において、リンクテキストをチェックする動作を示すフローチャートである。In Example 3, it is a flowchart which shows the operation | movement which checks a link text. 本発明の実施例3において、ネットワークNWを経由して、同一サイトの全ページを取得する動作を示すフローチャートである。In Example 3 of this invention, it is a flowchart which shows the operation | movement which acquires all the pages of the same site via the network NW. 実施例3を示す図であって、要素情報蓄積部15に蓄積されている要素情報の一覧リストを示す図である。FIG. 10 is a diagram illustrating a third embodiment and is a diagram illustrating a list of element information accumulated in an element information accumulation unit 15. 実施例3を示す図であって、図12に示す一覧リストにおいて、W列に同じリンク先が複数記述されているリストを示す図である。FIG. 13 is a diagram illustrating the third embodiment and is a diagram illustrating a list in which a plurality of the same link destinations are described in the W column in the list list illustrated in FIG. 12. 実施例3を示す図であって、図13に示すリストに基づく表示例を示す図である。FIG. 14 is a diagram illustrating the third embodiment and is a diagram illustrating a display example based on the list illustrated in FIG. 13. 本発明の実施例4を示す図であって、要素情報比較装置100の動作を示すフローチャートである。FIG. 10 is a flowchart illustrating an operation of the element information comparison apparatus 100 according to the fourth embodiment of the present invention. 実施例4を示す図であって、要素情報蓄積部15に蓄積されている要素情報の一覧リストを示す図である。FIG. 10 is a diagram illustrating a fourth embodiment and is a diagram illustrating a list of element information stored in the element information storage unit 15. 実施例4を示す図であって、図16に示す一覧リストにおいて、W列(ページタイトル)を分類したリストを示す図である。FIG. 17 is a diagram illustrating the fourth embodiment and is a diagram illustrating a list in which W columns (page titles) are classified in the list list illustrated in FIG. 16. 実施例4を示す図であって、図17に示すリストに基づく表示例である。FIG. 19 is a diagram illustrating a fourth embodiment, and is a display example based on the list illustrated in FIG. 17.

符号の説明Explanation of symbols

100…要素情報比較装置、
11…制御部、
12…ファイル情報取得部、
13…ファイル情報蓄積部、
14…要素情報取得部、
15…要素情報蓄積部、
16…要素情報処理部、
17…出力情報生成部、
18…情報入力部、
19…情報出力部。
100: Element information comparison device,
11 ... control unit,
12 ... File information acquisition unit,
13: File information storage unit,
14: Element information acquisition unit,
15 ... Element information storage unit,
16: Element information processing unit,
17 ... output information generation part,
18 ... Information input part,
19: Information output unit.

Claims (10)

所定の同一サイトにおける複数のページから、所定の絞り込み条件に合致する要素情報を取得する要素情報取得手段と;
上記要素情報取得手段が取得した要素情報を統計分析する統計分析手段と;
上記統計分析手段が統計分析した結果のリストを生成するリスト生成手段と;
を有することを特徴とする要素情報比較装置。
Element information acquisition means for acquiring element information that matches a predetermined narrowing-down condition from a plurality of pages in a predetermined same site;
Statistical analysis means for statistically analyzing the element information acquired by the element information acquisition means;
List generating means for generating a list of results of statistical analysis by the statistical analysis means;
The element information comparison apparatus characterized by having.
請求項1において、
上記所定の絞り込み条件に合致する要素情報は、マークアップ言語で記述された文書名と、画像ファイル名と、画像の説明情報と、マークアップ言語で記述された文書内の位置を表わす情報とであることを特徴とする要素情報比較装置。
In claim 1,
The element information that matches the predetermined narrowing-down conditions includes a document name described in a markup language, an image file name, image description information, and information indicating a position in the document described in the markup language. An element information comparison device characterized by being.
請求項1において、
上記所定の絞り込み条件に合致する要素情報は、マークアップ言語で記述された文書名と、リンク先と、リンク先の説明情報と、マークアップ言語で記述された文書内の位置を表わす情報とであることを特徴とする要素情報比較装置。
In claim 1,
The element information that matches the predetermined narrowing-down conditions includes a document name described in a markup language, a link destination, link destination explanation information, and information indicating a position in the document described in the markup language. An element information comparison device characterized by being.
請求項1において、
上記所定の絞り込み条件に合致する要素情報は、マークアップ言語で記述された文書名と、ページタイトルと、マークアップ言語で記述された文書内の位置を表わす情報とであることを特徴とする要素情報比較装置。
In claim 1,
The element information that matches the predetermined narrowing condition is a document name described in a markup language, a page title, and information indicating a position in the document described in the markup language. Information comparison device.
請求項1において、
上記統計分析手段は、マークアップ言語で記述されている文書における複数の要素情報のうちの所定の要素情報を基準にして、マークアップ言語で記述されている文書における複数の要素情報を並べ替える手段であることを特徴とする要素情報比較装置。
In claim 1,
The statistical analysis means is a means for rearranging a plurality of element information in a document described in a markup language based on predetermined element information among a plurality of element information in the document described in a markup language. The element information comparison apparatus characterized by being.
請求項1において、
上記統計分析手段は、マークアップ言語で記述されている文書における複数の要素情報のうちの所定の要素情報を基準にし、マークアップ言語で記述されている文書における複数の要素情報を分類する手段であることを特徴とする要素情報比較装置。
In claim 1,
The statistical analysis means is a means for classifying a plurality of element information in a document described in a markup language on the basis of predetermined element information among a plurality of element information in a document described in a markup language. An element information comparison device characterized by being.
請求項1において、
上記統計分析手段は、マークアップ言語で記述されている文書における複数の要素情報のうちの所定の要素情報を基準にして、マークアップ言語で記述されている文書における複数の要素情報を分類し、この分類毎に、要素情報の個数を比較し、個数が少ない要素情報に、印を付与する手段であることを特徴とする要素情報比較装置。
In claim 1,
The statistical analysis means classifies the plurality of element information in the document described in the markup language with reference to predetermined element information among the plurality of element information in the document described in the markup language, An element information comparison apparatus, comprising means for comparing the number of element information for each classification, and adding a mark to element information with a small number.
請求項1において、
上記統計分析手段は、マークアップ言語で記述された文書における複数の要素情報のうちの所定の要素情報を基準にして、マークアップ言語で記述されている文書における複数の要素情報を分類し、この分類毎に、要素情報の個数を比較し、表記を修正すべき要素情報に印を付与する手段であることを特徴とする要素情報比較装置。
In claim 1,
The statistical analysis means classifies the plurality of element information in the document described in the markup language with reference to predetermined element information among the plurality of element information in the document described in the markup language. An element information comparison apparatus, comprising means for comparing the number of element information for each classification and adding a mark to element information whose notation is to be corrected.
請求項1において、
上記リスト生成手段は、マークアップ言語で記述されている文書における複数の要素情報のうちの所定の要素情報を基準にして、マークアップ言語で記述されている文書における複数の要素情報を分類し、この分類毎に、要素情報の個数を表示する手段であることを特徴とする要素情報比較装置。
In claim 1,
The list generating means, based on the predetermined element information of a plurality of element information in the document that is written in a markup language, classifies a plurality of element information in the document that is written in a markup language, An element information comparison apparatus, which is a means for displaying the number of element information for each classification.
所定の同一サイトにおける複数のページから、所定の絞り込み条件に合致する要素情報を取得し、記憶装置に記憶する要素情報取得手順と;
上記要素情報取得手順で取得した要素情報を統計分析し、記憶装置に記憶する統計分析手順と;
上記統計分析手順で統計分析した結果のリストを生成し、記憶装置に記憶するリスト生成手順と;
をコンピュータに実行させるプログラム。
An element information acquisition procedure for acquiring element information matching a predetermined narrowing-down condition from a plurality of pages in a predetermined same site and storing the element information in a storage device;
A statistical analysis procedure for statistically analyzing the element information acquired in the element information acquisition procedure and storing it in a storage device;
A list generation procedure for generating a list of results of statistical analysis in the statistical analysis procedure and storing the list in a storage device;
A program that causes a computer to execute.
JP2005327715A 2005-11-11 2005-11-11 Device and program for comparing element information Pending JP2007133763A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005327715A JP2007133763A (en) 2005-11-11 2005-11-11 Device and program for comparing element information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005327715A JP2007133763A (en) 2005-11-11 2005-11-11 Device and program for comparing element information

Publications (1)

Publication Number Publication Date
JP2007133763A true JP2007133763A (en) 2007-05-31

Family

ID=38155352

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005327715A Pending JP2007133763A (en) 2005-11-11 2005-11-11 Device and program for comparing element information

Country Status (1)

Country Link
JP (1) JP2007133763A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011008622A (en) * 2009-06-26 2011-01-13 Fujitsu Ltd Display test device, display test program, and display test method
JP2011180916A (en) * 2010-03-02 2011-09-15 Nippon Telegr & Teleph Corp <Ntt> Web page diagnosis efficiency-improving system, web page diagnosis efficiency-improving method, and program
JP2012253673A (en) * 2011-06-06 2012-12-20 Avix Inc Automatic production of short animation work based on html document
JP2016014982A (en) * 2014-07-01 2016-01-28 株式会社リクルートテクノロジーズ Web evaluation device, web evaluation method, and web evaluation program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000072190A1 (en) * 1999-05-19 2000-11-30 Fujitsu Limited Method for supporting development of internet contents, recorded medium on which program for implementing the same is recorded, and system for implementing the same
JP2004139304A (en) * 2002-10-17 2004-05-13 Nec Corp Hyper text inspection device, its method, and program
JP2005157817A (en) * 2003-11-27 2005-06-16 Nec Corp Hypertext correcting system and method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000072190A1 (en) * 1999-05-19 2000-11-30 Fujitsu Limited Method for supporting development of internet contents, recorded medium on which program for implementing the same is recorded, and system for implementing the same
JP2004139304A (en) * 2002-10-17 2004-05-13 Nec Corp Hyper text inspection device, its method, and program
JP2005157817A (en) * 2003-11-27 2005-06-16 Nec Corp Hypertext correcting system and method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011008622A (en) * 2009-06-26 2011-01-13 Fujitsu Ltd Display test device, display test program, and display test method
JP2011180916A (en) * 2010-03-02 2011-09-15 Nippon Telegr & Teleph Corp <Ntt> Web page diagnosis efficiency-improving system, web page diagnosis efficiency-improving method, and program
JP2012253673A (en) * 2011-06-06 2012-12-20 Avix Inc Automatic production of short animation work based on html document
JP2016014982A (en) * 2014-07-01 2016-01-28 株式会社リクルートテクノロジーズ Web evaluation device, web evaluation method, and web evaluation program

Similar Documents

Publication Publication Date Title
US20210326536A1 (en) Real-time in-context smart summarizer
US9767082B2 (en) Method and system of retrieving ajax web page content
JP4124261B2 (en) Document analysis system, document analysis method, and program thereof
JP6165913B1 (en) Information processing apparatus, information processing method, and program
US20150067476A1 (en) Title and body extraction from web page
US20070094232A1 (en) System and method for automatically extracting by-line information
JP2008204453A (en) System and method for annotating document
US20030065645A1 (en) System and method for transcoding digital content
US9170988B2 (en) Method for causing computer to display page view on display area by converting HTML page into new HTML pages, and non-transitory computer readable media recording program
JP2006268638A (en) Document difference detector
US7519579B2 (en) Method and system for updating a summary page of a document
JP2020098596A (en) Method, device and storage medium for extracting information from web page
JP2009020865A (en) Character input assist method, character input assist system, character input assist program, user terminal, character conversion method and character conversion program
JP2007140603A (en) Early adapter extraction method and device and program and topic word prediction method and device and program
JP2007133763A (en) Device and program for comparing element information
JP5056133B2 (en) Information extraction system, information extraction method, and information extraction program
JP4539438B2 (en) COLLECTING METHOD AND DEVICE FOR TRACKBACK SOURCE COMMENT / TRACKBACK, PROGRAM, AND COMPUTER-READABLE STORAGE MEDIUM CONTAINING THE PROGRAM
JP2007188427A (en) Subject image selecting method, device, and program
US20220342955A1 (en) Information processing apparatus, information processing method, and program
JP2009104392A (en) File management system, file management method and file management program
Leporini Google news: how user-friendly is it for the blind?
JP3237619B2 (en) Document display device, document display method, and recording medium recording document display program
JP2005339580A (en) Document data management device and program
JP2007052693A (en) Webpage information display apparatus, processing method and program
JP4119413B2 (en) Knowledge information collection system, knowledge search system, and knowledge information collection method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100702

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100709

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101126