JP5510912B2 - 引用判定支援装置および引用判定支援プログラム - Google Patents
引用判定支援装置および引用判定支援プログラム Download PDFInfo
- Publication number
- JP5510912B2 JP5510912B2 JP2009019477A JP2009019477A JP5510912B2 JP 5510912 B2 JP5510912 B2 JP 5510912B2 JP 2009019477 A JP2009019477 A JP 2009019477A JP 2009019477 A JP2009019477 A JP 2009019477A JP 5510912 B2 JP5510912 B2 JP 5510912B2
- Authority
- JP
- Japan
- Prior art keywords
- determination
- citation
- range
- data
- target data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004364 calculation method Methods 0.000 claims description 109
- 238000003860 storage Methods 0.000 claims description 64
- 238000013500 data storage Methods 0.000 claims description 49
- 238000006243 chemical reaction Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 8
- 238000000034 method Methods 0.000 description 173
- 238000012545 processing Methods 0.000 description 81
- 238000010586 diagram Methods 0.000 description 33
- 230000000694 effects Effects 0.000 description 24
- 238000012986 modification Methods 0.000 description 17
- 230000004048 modification Effects 0.000 description 17
- 238000011161 development Methods 0.000 description 14
- 230000018109 developmental process Effects 0.000 description 14
- 238000004519 manufacturing process Methods 0.000 description 14
- 239000000470 constituent Substances 0.000 description 9
- 238000012916 structural analysis Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 238000012790 confirmation Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000012447 hatching Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000002845 discoloration Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000020509 sex determination Effects 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Machine Translation (AREA)
Description
前記文献引用判定手段は、前記類似度が前記入力手段を介して入力された所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定することを特徴とする。
また、請求項21に記載の引用判定支援プログラムは、判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援プログラムであって、コンピュータを、前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、して機能させる引用判定支援プログラムであり、前記類似度算出手段は、前記判定範囲を解析して所定数以上出現する単語を検索キーとして、前記単語ごとに前記比較範囲特定手段にて特定された前記比較範囲の中から複数回検索し、複数回の検索結果の中で出現頻度が所定の値より大きい検索結果を、前記判定範囲の記述内容との相互の類似度を算出する前記比較範囲の対象とすることを特徴とする。
また、引用が著作権法で規定する適法な引用か否かを容易に判断することができ、判定の適法性を容易に判別することができる。
また、他人の文献データを引用している可能性の高い文献データを自動的に比較範囲に設定することができ、開発工程および製造コストの増大を防止しつつ判定の精度をより向上させることができるという効果を奏する。
また、出現頻度の高い検索結果を自動的に特定し、この検索結果を、類似度算出に用いる比較範囲として自動的に設定するので、判定範囲にマッチする比較範囲を自動的に抽出して引用判定を行なうことができ、引用判定の精度を一層向上させることができる。
また、引用が著作権法で規定する適法な引用か否かを容易に判断することができ、判定の適法性を容易に判別することができる。
また、請求項21に記載の引用判定支援プログラムによれば、判定範囲と比較範囲を自動的に限定した上で類似度の判定を行なうので、汎用的な判定アルゴリズムを利用して開発工程および製造コストの増大を防止しつつ、判定の精度を向上させることができるという効果を奏する。また、出現頻度の高い検索結果を自動的に特定し、この検索結果を、類似度算出に用いる比較範囲として自動的に設定するので、判定範囲にマッチする比較範囲を自動的に抽出して引用判定を行なうことができ、引用判定の精度を一層向上させることができる。
まず実施の形態1について説明する。この形態は、論文データのうち、第三者の文献を引用する可能性が高い構成部分を自動的に選定して判定範囲とする形態である。
引用判定支援装置100は、図1に示すように、記憶部101及び制御部102をバスにて接続して構成されると共に、入力装置103及び表示装置104とを備えている。
次に、以上のように構成された実施の形態1の引用判定支援装置100で実行される引用判定支援処理について説明する。図2は、実施の形態1の引用判定支援処理の手順を示すフローチャートである。
このように実施の形態1の引用判定支援装置100では、論文データの判定範囲と比較範囲の文献データ等を自動的に限定して類似度判定を行なうので、汎用的な類似算出などの判定アルゴリズムを利用して引用判定を行うことができる。このため、本実施の形態によれば、開発工程および製造コストの増大を防止しつつ判定の精度を向上させることができる。
次に、実施の形態2について説明する。この形態は、過去に不正な引用行為を行った学生や成績が低い学生の論文データを判定対象として選択する形態である。ただし、実施の形態2に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
図9は、実施の形態2に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置900は、記憶部101に履歴データ記憶部101dを備えると共に、制御部102に判定範囲特定部102iを備える点において、実施の形態1に係る引用判定支援装置100と異なる。
次に、以上のように構成された実施の形態2の引用判定支援装置900による引用判定支援処理について説明する。図11は、実施の形態2の引用判定支援処理の手順を示すフローチャートである。
このように実施の形態2の引用判定支援装置900では、履歴データから過去に不正な引用行為が有った旨を示す不正引用の有無の「有」に対応する学籍簿番号、成績は所定値であるC以下の学籍簿番号の学生が作成した論文データを、複数の論文データの中から判定対象として選択しているので、不正な引用を行う確率が高い者の論文データを判定対象とすることができ、判定の精度をより向上させることができると共に、不正引用の確率が高い論文データのみに判定対象を限定することで判定処理負荷を低減して判定効率を高めることができる。
次に、実施の形態3について説明する。この形態は、引用元の文献が単語を修正された上で論文に不正引用された場合の対策として、当該単語を修正前の単語に変換した上で類似度判定を行う形態である。ただし、実施の形態3に係る構成及び処理は、特に説明する場合を除いては実施の形態2に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態2で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
図13は、実施の形態3に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置1300は、記憶部101に辞書記憶部101eを備えると共に、制御部102に判定範囲特定部102j及び単語変換部102kを備えている点において、実施の形態2に係る引用判定支援装置900と異なる。
次に、以上のように構成された実施の形態3の引用判定支援装置1300による引用判定支援処理について説明する。本実施の形態の引用判定の全体処理は、図11で説明した実施の形態2の引用判定支援処理と同様に行われる。本実施の形態では、図11のステップS31における判定対象の特定処理が実施の形態2と異なっている。
このように実施の形態3の引用判定支援装置1300では、論文データに含まれる単語を、専門辞書に登録された用語に変換し、変換が行われた論文データを、判定対象としているので、文献データをそのまま利用せず修正した上で不正に引用した場合でも、引用か否かを判定することができ、判定の精度をより向上させることができる。
次に、実施の形態4について説明する。この形態は、学生の過去の論文データの相互間で、類似度を算出する形態である。ただし、実施の形態4に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
図16は、実施の形態4に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置1600は、制御部102に、比較範囲特定部102l、類似度算出部102m、及び文献引用判定部102nを備える点において、実施の形態1に係る引用判定支援装置100と異なる。
次に、以上のように構成された実施の形態4の引用判定支援装置1600による引用判定支援処理について説明する。本実施の形態の引用判定の全体処理については図2を用いて説明した実施の形態1における引用判定支援処理の手順と同様である。本実施の形態では、図2における比較判定処理(ステップS14)の手順が実施の形態1と異なっている。
このように実施の形態4にかかる引用判定支援装置1600では、相互間で引用している過去の論文データを比較範囲として、判定対象の論文データの引用判定を行うので、引用している可能性の高いものを比較範囲とすることができ、開発工程および製造コストの増大を防止しつつ判定の精度をより向上させることができると共に、不正引用の確率が高い論文データのみに判定対象を限定することで判定処理負荷を低減して判定効率を高めることができる。
次に、実施の形態5について説明する。この形態は、論文の課題文をキーワードとして判定対象を自動的に抽出する形態である。ただし、実施の形態5に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
図18は、実施の形態5に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置1800は、制御部102に課題抽出部102p及び比較範囲特定部102qを備える点において、実施の形態1に係る引用判定支援装置100と異なる。
次に、以上のように構成された実施の形態5の引用判定支援装置1800による引用判定支援処理について説明する。本実施の形態の引用判定の全体処理については図2を用いて説明した実施の形態1における引用判定支援処理の手順と同様である。本実施の形態では、図2における比較判定処理(ステップS14)の手順が実施の形態1と異なっている。
このように実施の形態5の引用判定支援装置1800では、論文データにおける課題文に基づいて引用文献の比較範囲を決定しているので、論文の内容に即して適切な引用文献の比較範囲を定めることができ、開発工程および製造コストの増大を防止しつつ判定の精度をより向上させることができる。
次に、実施の形態6について説明する。この形態は、論文における比較対象の文字数が検索ロジックの文字制限数を超える場合の対応ロジックを含んだ形態である。ただし、実施の形態6に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
図20は、実施の形態6に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置2000は、制御部102に類似度算出部102rを備える点において、実施の形態1に係る引用判定支援装置100と異なる。
次に、以上のように構成された実施の形態6の引用判定支援装置2000による引用判定支援処理について説明する。本実施の形態の引用判定の全体処理については図2を用いて説明した実施の形態1における引用判定支援処理の手順と同様である。本実施の形態では、図2における類似度算出部が行う検索処理(ステップS15)の手順が実施の形態1と異なっている。
このように実施の形態6の引用判定支援装置2000では、検索キーが制限文字数を超えた場合には、判定範囲の中で制限文字数分の文字列で検索キーを指定して、検索キーとしての判定範囲の文字列をずらしながら複数回の検索を行っているので、検索キーの制限文字数にかかわらず、引用判定の精度を向上させることができる。
次に、実施の形態7について説明する。この形態は、適法性判定手段が、判定範囲が所定の引用形式に合致するか否かを判定し、当該判定結果に基づいて、当該判定範囲における比較範囲の引用が適法な引用であるか否かを判定する形態である。ただし、実施の形態7に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
図24は、実施の形態7に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置100は、制御部102に引用形式設定部102sを備えると共に、記憶部101に引用形式データベース(以下、「データベース」を「DB」と略記する)101fを備えている。
次に、以上のように構成された実施の形態7の引用判定支援装置100で実行される引用判定支援処理について説明する。図26は、実施の形態7の引用判定支援処理の手順を示すフローチャートである。なお、ステップSA2及びステップSA9を除くステップSA1からステップSA13までの各処理は、実施の形態1において図2を参照して説明したステップS11からステップS20aまでの各処理と同様であるので、詳細な説明は省略する。
ここで、適法性判定処理について説明する。図29は、適法性判定処理の手順を示すフローチャートである。適法性判定処理が起動されると、適法性判定部102eは、判定対象の論文データの種別を特定する(ステップSC1)。例えば、種別入力画面(図示省略)を表示装置104に出力表示させ、入力装置103を介して判定対象の論文データの種別の入力を受け付けることができる。
このように実施の形態7の引用判定支援装置100では、判定範囲が所定の引用形式に合致するか否かを判定し、当該判定結果に基づいて、当該判定範囲における比較範囲の引用が適法な引用であるか否かを判定するので、予め設定した引用形式に基づき、引用の適法性を容易に判定することができる。
次に、実施の形態8について説明する。この形態は、判定範囲の記述内容の内、比較範囲から引用された記述内容が占める引用割合を算出する形態である。ただし、実施の形態8に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
図30は、実施の形態8に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置100は、制御部102に引用割合算出部102tを備えると共に、記憶部101に引用割合DB101gを備えている。
次に、以上のように構成された実施の形態8の引用判定支援装置100で実行される処理について説明する。実施の形態8の引用判定支援装置100が実行する処理は、引用判定支援処理及びリスト表示処理に大別される。
まず、引用判定支援処理について説明する。図32は、実施の形態8の引用判定支援処理の手順を示すフローチャートである。なお、ステップSD1からステップSD11までの各処理は、実施の形態1において図2を参照して説明したステップS11からステップS20aまでの各処理と同様であるので、詳細な説明は省略する。
次に、リスト表示処理について説明する。このリスト表示処理は、各論文データの引用割合に基づく順序で論文データ情報を出力する処理である。図34は、リスト表示処理の手順を示すフローチャートである。このリスト表示処理の実行タイミングは任意で、例えば、入力装置103を介してリスト表示処理の実行指示が入力された場合に起動される。
このように実施の形態8の引用判定支援装置100では、判定範囲の記述内容の内、比較範囲から引用された記述内容が占める引用割合を算出及び出力するので、引用の適法性の判断材料を提示することができる。
次に、実施の形態9について説明する。この形態は、引用箇所の引用元である文献データを特定する引用元情報が、判定対象データに含まれているか否かを判定する形態である。ただし、実施の形態9に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
図36は、実施の形態9に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置100は、記憶部101に出力態様DB101hを備えている。
次に、以上のように構成された実施の形態9の引用判定支援装置100で実行される引用判定支援処理について説明する。図38は、実施の形態9の引用判定支援処理の手順を示すフローチャートである。なお、ステップSF1、ステップSF5、ステップSF8、ステップSF9、ステップSF12、及びステップSF15からステップSF17は、それぞれ実施の形態1において図2を参照して説明したステップS11、ステップS14、ステップS15、ステップS16、ステップS18、ステップS19からステップS20aの各処理と同様であるので、詳細な説明は省略する。
このように実施の形態9の引用判定支援装置100では、引用箇所の引用元である文献データを特定する引用元情報が論文データに含まれているか否かを判定するので、引用元情報の有無に基づいて引用の適法性を判定する際の判断材料を取得できる。
次に、実施の形態10について説明する。この形態は、文献データを特定する引用元情報が判定対象データに含まれている場合において、当該引用元情報に基づいて特定される文献データが文献データ記憶手段に格納されていると判定した場合、当該文献データを比較範囲として特定する形態である。ただし、実施の形態10に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
本実施の形態10の引用判定支援装置100で実行される引用判定支援処理について説明する。図41は、実施の形態10の引用判定支援処理の手順を示すフローチャートである。なお、ステップSG11を除くステップSG1からステップSG12までの各処理は、実施の形態1において図2を参照して説明したステップS11からステップS20aの各処理と同様であるので、詳細な説明は省略する。
ここで、引用判定支援処理のステップSG4で実行される比較範囲特定処理について説明する。図42は、実施の形態10の比較判定処理の手順を示すフローチャートである。なお、ステップSH5からステップSH7までの各処理は、実施の形態1において図6を参照して説明したステップS21からステップS23までの各処理と同様であるので、詳細な説明は省略する。
このように実施の形態10の引用判定支援装置100では、判定範囲において引用されていると文献引用判定部102dによって判定された文献データを文献データ記憶部101aに記憶させる。また、文献データを特定する引用元情報が論文データに含まれている場合において、当該引用元情報に基づいて特定される文献データが文献データ記憶部101aに格納されていると判定した場合、当該文献データを比較範囲として特定する。これにより、既に文献データ記憶部101aに記憶されている文献データに比較範囲を限定することができ、比較範囲のデータから判定範囲の内容を検索する際の負荷を低減することができる。
以上、本発明に係る各実施の形態について説明したが、本発明の具体的な構成及び手段は、特許請求の範囲に記載した各発明の技術的思想の範囲内において、任意に改変及び改良することができる。以下、このような変形例について説明する。
実施の形態6では、類似度算出部102rにおいて、判定範囲と比較範囲の類似度を算出する際に、検索キーが制限文字数を超えた場合の処理をおこなっていたが、かかる処理を、実施の形態5における比較範囲特定部102qの処理に適用することもできる。
さらに、実施の形態5の比較範囲特定部102qを、上記変形例1で説明したような処理、すなわち、予め検索キーとして指定する文字列が制限文字数を超えないように、課題文を単語に分割して検索キーとして指定して検索を行うように構成してもよい。
上述の実施の形態7では、類似度算出部102cによって算出された類似度が所定の閾値以上と判定された部分について引用の適法性の判定を行っているが、判定対象の論文データ全体について引用の適法性判定を行うように構成してもよい。例えば、判定対象の論文データに、当該論文データの種別に対応する引用形式の記号(例えば「『』」、「””」等)が含まれている場合、当該論文データにおける引用は適法である旨の判定をするように構成してもよい。また、当該判定結果に基づく出力態様で、論文データのファイル名を表示装置104に出力表示させてもよい。例えば、引用が不適法と判定された論文データのファイル名を白黒反転表示させ、適法と判定された論文データのファイル名と識別可能としてもよい。
上記各実施の形態にかかる引用判定支援装置の判定範囲特定部102a、102i、102jに自動参照の機能を組み込み、起動時に自動的に論文データ記憶部101cから、所望の論文データを利用者に選択させて選択された論文データを読み込むように構成してもよい。
また、上記実施の形態にかかる引用判定支援装置の比較範囲特定部102b、102l、102qを、比較範囲となる記憶部やWEBサイト等を一つに限定せず、WEBサイト、図書館検索データベース、ローカルサーバ、これらを任意に組み合わせたものから横断的に比較範囲を特定するように構成してもよい。
101 記憶部
101a 文献データ記憶部
101b 文献リスト記憶部
101c 論文データ記憶部
101d 履歴データ記憶部
101e 辞書記憶部
101f 引用形式DB
101g 引用割合DB
101h 出力態様DB
102 制御部
102a、102i、102j 判定範囲特定部
102b、102l、102q 比較範囲特定部
102c、102m、102r 類似度算出部
102d、102n 文献引用判定部
102e 適法性判定部
102f 参照情報取得部
102g 入力制御部
102h 出力制御部
102k 単語変換部
102p 課題抽出部
102s 引用形式設定部
102t 引用割合算出部
103 入力装置
104 表示装置
105 論文データ表示エリア
106 範囲設定スライダ
106a 上側の範囲設定スライダ
106b 下側の範囲設定スライダ
107 全体ビュー
108 文献データ表示エリア
130 インターネット
131 WEBサイト
133 ファイルサーバ
Claims (21)
- 判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援装置であって、
前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、
前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、
前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、
前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、
前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、
前記文献引用判定手段にて前記判定範囲が前記比較範囲を引用していると判定された場合に、当該判定範囲における当該比較範囲の引用箇所およびその近傍箇所に基づいて、当該引用が適法な引用であるか否かを判定する適法性判定手段と、
を備えたことを特徴とする引用判定支援装置。 - 前記適法性判定手段は、前記引用箇所の引用元である前記文献データを特定する引用元情報が、前記判定対象データに含まれているか否かを判定すること、
を特徴とする請求項1に記載の引用判定支援装置。 - 前記適法性判定手段は、前記判定範囲において前記類似度が所定の閾値以上である場合に、当該判定範囲が所定の引用形式に合致するか否かを判定し、当該判定結果に基づいて、当該判定範囲における前記比較範囲の引用が適法な引用であるか否かを判定すること、
を特徴とする請求項1又は2に記載の引用判定支援装置。 - 前記判定対象データの種別と、前記所定の引用形式とを、相互に関連付けて格納する引用形式格納手段を備え、
前記適法性判定手段は、前記判定対象データの種別を特定し、当該特定した種別に対応する前記引用形式を前記引用形式格納手段から取得し、当該取得した引用形式に前記判定範囲における前記比較範囲の引用が合致するか否かを判定すること、
を特徴とする請求項3に記載の引用判定支援装置。 - 前記文献引用判定手段にて前記判定範囲が前記比較範囲を引用していると判定された場合に、当該比較範囲を含む前記文献データを参照するための参照情報を、当該文献データに基づいて取得する参照情報取得手段を備え、
前記出力手段は、前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲に加えて、前記参照情報取得手段にて取得された前記参照情報を出力すること、
を特徴とする請求項1から4のいずれか一項に記載の引用判定支援装置。 - 前記判定範囲特定手段は、前記判定対象データを構成する構成部分の中から、所定の構成部分を前記判定範囲として特定すること、
を特徴とする請求項1から5のいずれか一項に記載の引用判定支援装置。 - 過去に生成された前記判定対象データの作成者を一意に識別するための作成者識別情報に対して、前記判定対象データにおける不正な引用行為の有無を示す情報、又は前記作成者の成績を対応づけて記憶する履歴記憶手段を備え、
判定対象となり得る前記判定対象データが複数存在する場合において、前記判定範囲特定手段は、前記不正な引用行為が有った旨を示す情報に対応する前記作成者識別情報を前記履歴記憶手段から取得し、又は所定値より低い前記作成者の成績に対応する前記作成者識別情報を前記履歴記憶手段から取得し、当該取得した作成者識別情報にて識別される作成者が作成した前記判定対象データを、前記複数の判定対象データの中から前記判定対象として選択すること、
を特徴とする請求項1から6のいずれか一項に記載の引用判定支援装置。 - 前記文献データに含まれ得る単語に対して、当該単語を修正する際に用いられ得る単語を対応づけて記憶する辞書記憶手段と、
前記判定対象データに含まれる単語を、前記辞書記憶手段にて記憶された単語に変換する単語変換手段とを備え、
前記判定範囲特定手段は、前記単語変換手段による変換が行われた前記判定対象データを、前記判定対象とすること、
を特徴とする請求項1から7のいずれか一項に記載の引用判定支援装置。 - 当該引用判定支援装置に対する操作入力を受け付ける入力手段を備え、
前記判定範囲特定手段は、前記判定対象データの中から、前記入力手段を介して指定された範囲を前記判定範囲として特定すること、
を特徴とする請求項1から8のいずれか一項に記載の引用判定支援装置。 - 判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援装置であって、
前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、
前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、
前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、
前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、
前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、
過去に生成された複数の判定対象データを記憶する判定対象データ記憶手段とを備え、
前記類似度算出手段は、さらに、前記判定対象データ記憶手段に記憶された前記複数の判定対象データの相互間において、前記類似度を算出し、
前記文献引用判定手段は、さらに、前記類似度算出手段にて算出された前記類似度が所定の第2閾値以上である場合に、前記複数の判定対象データの相互間において引用していると判定し、
前記比較範囲特定手段は、前記複数の判定対象データの相互間において引用ありと判定された複数の判定対象データを前記比較範囲として特定すること、
を特徴とする引用判定支援装置。 - 前記判定対象データの記述内容に基づいて、当該判定対象データの中から、当該判定対象データの課題を示す課題情報を抽出する課題抽出手段を備え、
前記比較範囲特定手段は、前記課題抽出手段にて抽出された前記課題情報を検索キーとして前記文献データを検索し、当該検索された文献データを前記比較対象として特定すること、
を特徴とする請求項1から10のいずれか一項に記載の引用判定支援装置。 - 前記判定範囲において引用されていると前記文献引用判定手段によって判定された前記文献データを記憶する文献データ記憶手段を備え、
前記比較範囲特定手段は、前記判定対象データにおいて引用されている前記文献データを特定する引用元情報が当該判定対象データに含まれているか否かを判定し、当該引用元情報が当該判定対象データに含まれていると判定した場合、当該引用元情報に基づいて特定される前記文献データが前記文献データ記憶手段に格納されているか否かを判定し、当該引用元情報に基づいて特定される前記文献データが前記文献データ記憶手段に格納されていると判定した場合、当該文献データを比較範囲として特定すること、
を特徴とする請求項1から11のいずれか一項に記載の引用判定支援装置。 - 前記類似度算出手段は、前記判定範囲特定手段にて特定された前記判定範囲の記述内容を検索キーとして、前記比較範囲特定手段にて特定された前記比較範囲の中から検索した場合であって、前記検索キーの文字数が、予め定められた制限文字数を超えている場合に、前記検索キーとして前記制限文字数以内の文字を前記判定範囲の中から順次指定して、前記比較範囲の中から複数回検索し、複数回の検索結果の中で出現頻度が所定の値より大きい検索結果を、前記判定範囲の記述内容との相互の類似度を算出する前記比較範囲の対象とすること、
を特徴とする請求項1から12のいずれか一つに記載の引用判定支援装置。 - 判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援装置であって、
前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、
前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、
前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、
前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、
前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段とを備え、
前記類似度算出手段は、前記判定範囲を解析して所定数以上出現する単語を検索キーとして、前記単語ごとに前記比較範囲特定手段にて特定された前記比較範囲の中から複数回検索し、複数回の検索結果の中で出現頻度が所定の値より大きい検索結果を、前記判定範囲の記述内容との相互の類似度を算出する前記比較範囲の対象とすること、
を特徴とする引用判定支援装置。 - 前記所定の閾値の入力を受け付ける入力手段を備え、
前記文献引用判定手段は、前記類似度が前記入力手段を介して入力された所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定すること、
を特徴とする請求項1から14のいずれか一項に記載の引用判定支援装置。 - 前記判定範囲の記述内容の内、前記比較範囲から引用された記述内容が占める引用割合を算出する引用割合算出手段を備え、
前記出力手段は、前記引用割合を出力すること、
を特徴とする請求項1から15のいずれか一項に記載の引用判定支援装置。 - 前記引用割合算出手段は、複数の前記判定対象データについて前記引用割合を算出し、
前記出力手段は、前記複数の判定対象データを一意に識別する判定対象データ情報を、当該各判定対象データについて前記引用割合算出手段が算出した前記引用割合に基づく順序で出力すること、
を特徴とする請求項16に記載の引用判定支援装置。 - 前記判定範囲の前記類似度と、前記出力手段による出力態様とを、相互に対応付けて格納する出力態様情報格納手段を備え、
前記出力手段は、前記類似度算出手段にて算出された前記類似度に対応する前記出力態様を前記出力態様情報格納手段から取得し、当該取得した出力態様にて前記判定範囲を出力すること、
を特徴とする請求項1から17のいずれか一項に記載の引用判定支援装置。 - 判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援プログラムであって、
コンピュータを、
前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、
前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、
前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、
前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、
前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、
前記文献引用判定手段にて前記判定範囲が前記比較範囲を引用していると判定された場合に、当該判定範囲における当該比較範囲の引用箇所およびその近傍箇所に基づいて、当該引用が適法な引用であるか否かを判定する適法性判定手段と、
して機能させることを特徴とする引用判定支援プログラム。 - 判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援プログラムであって、
コンピュータを、
前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、
前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、
前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、
前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、
前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、して機能させる引用判定支援プログラムであり、
前記類似度算出手段は、過去に生成された複数の判定対象データを記憶する判定対象データ記憶手段に記憶された当該複数の判定対象データの相互間において、前記類似度を算出し、
前記文献引用判定手段は、前記類似度算出手段にて算出された前記類似度が所定の第2閾値以上である場合に、前記複数の判定対象データの相互間において引用していると判定し、
前記比較範囲特定手段は、前記複数の判定対象データの相互間において引用ありと判定された複数の判定対象データを前記比較範囲として特定すること、
を特徴とする引用判定支援プログラム。 - 判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援プログラムであって、
コンピュータを、
前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、
前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、
前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、
前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、
前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、して機能させる引用判定支援プログラムであり、
前記類似度算出手段は、前記判定範囲を解析して所定数以上出現する単語を検索キーとして、前記単語ごとに前記比較範囲特定手段にて特定された前記比較範囲の中から複数回検索し、複数回の検索結果の中で出現頻度が所定の値より大きい検索結果を、前記判定範囲の記述内容との相互の類似度を算出する前記比較範囲の対象とすること、
を特徴とする引用判定支援プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009019477A JP5510912B2 (ja) | 2008-02-01 | 2009-01-30 | 引用判定支援装置および引用判定支援プログラム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008023234 | 2008-02-01 | ||
JP2008023234 | 2008-02-01 | ||
JP2009019477A JP5510912B2 (ja) | 2008-02-01 | 2009-01-30 | 引用判定支援装置および引用判定支援プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014062283A Division JP5737772B2 (ja) | 2008-02-01 | 2014-03-25 | 引用判定支援装置および引用判定支援プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009205674A JP2009205674A (ja) | 2009-09-10 |
JP5510912B2 true JP5510912B2 (ja) | 2014-06-04 |
Family
ID=40912544
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009019477A Active JP5510912B2 (ja) | 2008-02-01 | 2009-01-30 | 引用判定支援装置および引用判定支援プログラム |
JP2014062283A Active JP5737772B2 (ja) | 2008-02-01 | 2014-03-25 | 引用判定支援装置および引用判定支援プログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014062283A Active JP5737772B2 (ja) | 2008-02-01 | 2014-03-25 | 引用判定支援装置および引用判定支援プログラム |
Country Status (2)
Country | Link |
---|---|
JP (2) | JP5510912B2 (ja) |
WO (1) | WO2009096190A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5207402B2 (ja) * | 2009-09-30 | 2013-06-12 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理方法及びプログラム |
KR101033611B1 (ko) * | 2010-07-09 | 2011-05-11 | 한국과학기술정보연구원 | 참고 문헌 적합성 판정 시스템 및 방법 |
US9218344B2 (en) * | 2012-06-29 | 2015-12-22 | Thomson Reuters Global Resources | Systems, methods, and software for processing, presenting, and recommending citations |
JP5459422B2 (ja) * | 2013-02-14 | 2014-04-02 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、制御方法及びプログラム |
JP6052816B2 (ja) | 2014-10-27 | 2016-12-27 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 電子著作物のコンテンツの二次利用を支援する方法、並びに、電子著作物のコンテンツの二次利用を支援する為のサーバ・コンピュータ、及びそのサーバ・コンピュータ用プログラム |
US20170270625A1 (en) * | 2016-03-21 | 2017-09-21 | Facebook, Inc. | Systems and methods for identifying matching content |
WO2018109929A1 (ja) * | 2016-12-16 | 2018-06-21 | 三菱電機株式会社 | 検索システム |
JP6691581B2 (ja) * | 2018-07-26 | 2020-04-28 | 楽天株式会社 | 情報処理装置、情報処理方法、プログラム、記憶媒体 |
JP6695538B1 (ja) * | 2019-07-30 | 2020-05-20 | 株式会社ウェブサークル | 類似文章検索装置およびプログラム |
JP2022072383A (ja) * | 2020-10-29 | 2022-05-17 | 株式会社Ipsign | 侵害情報抽出システム、方法及びプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08263512A (ja) * | 1995-03-24 | 1996-10-11 | Sumitomo Electric Ind Ltd | 文書検索装置 |
JPH09198409A (ja) * | 1996-01-19 | 1997-07-31 | Hitachi Ltd | 酷似文書抽出方法 |
JPH1021239A (ja) * | 1996-06-28 | 1998-01-23 | Toshiba Corp | 機械翻訳装置及び翻訳処理方法 |
JP3625054B2 (ja) * | 2000-11-29 | 2005-03-02 | 松下電器産業株式会社 | 技術文書検索装置 |
JP2006155556A (ja) * | 2004-10-27 | 2006-06-15 | Hitachi Software Eng Co Ltd | テキストマイニング方法及びテキストマイニングサーバ |
US20070294610A1 (en) * | 2006-06-02 | 2007-12-20 | Ching Phillip W | System and method for identifying similar portions in documents |
JP2008015774A (ja) * | 2006-07-05 | 2008-01-24 | Nagaoka Univ Of Technology | 模倣文書検出システム及びプログラム |
-
2009
- 2009-01-30 JP JP2009019477A patent/JP5510912B2/ja active Active
- 2009-01-30 WO PCT/JP2009/000360 patent/WO2009096190A1/ja active Application Filing
-
2014
- 2014-03-25 JP JP2014062283A patent/JP5737772B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009205674A (ja) | 2009-09-10 |
JP5737772B2 (ja) | 2015-06-17 |
JP2014149848A (ja) | 2014-08-21 |
WO2009096190A1 (ja) | 2009-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5737772B2 (ja) | 引用判定支援装置および引用判定支援プログラム | |
JP4767694B2 (ja) | 不正ハイパーリンク検出装置及びその方法 | |
US8024175B2 (en) | Computer program, apparatus, and method for searching translation memory and displaying search result | |
US9361317B2 (en) | Method for entity enrichment of digital content to enable advanced search functionality in content management systems | |
US20180004838A1 (en) | System and method for language sensitive contextual searching | |
Papadakis et al. | Stavies: A system for information extraction from unknown web data sources through automatic web wrapper generation using clustering techniques | |
EP3077918A1 (en) | Systems and methods for in-memory database search | |
JP2007141090A (ja) | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム | |
JP2005122295A (ja) | 関係図作成プログラム、関係図作成方法、および関係図作成装置 | |
JP2008152522A (ja) | データマイニングシステム、データマイニング方法及びデータ検索システム | |
JP2009116867A (ja) | マルチリンガル・テキスト・リソースのアクセスを制御するための方法および装置 | |
Manaf et al. | Comparison of carp rabin algorithm and Jaro-Winkler distance to determine the equality of Sunda languages | |
JP2007065745A (ja) | 文書検索方法および文書検索装置、プログラム | |
JP2006323517A (ja) | テキスト分類装置およびプログラム | |
JP5447368B2 (ja) | 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム | |
Ehsan et al. | A Pairwise Document Analysis Approach for Monolingual Plagiarism Detection. | |
Williams et al. | Classifying and ranking search engine results as potential sources of plagiarism | |
JP6305671B1 (ja) | テンプレート生成装置、テンプレート生成プログラム及びテンプレート生成方法 | |
JP2009157620A (ja) | 情報検索支援装置 | |
JP2006085234A (ja) | 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム | |
JP2009169761A (ja) | 電子辞書システム、電子辞書の表示制御方法、コンピュータプログラムおよびデータ記憶媒体 | |
JP2004220226A (ja) | 検索文書のための文書分類方法及び装置 | |
JP2773667B2 (ja) | 関連情報検索装置 | |
JP2020113048A (ja) | 情報処理装置及びプログラム | |
Suchomel et al. | Source retrieval for plagiarism detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131028 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140311 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140318 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5510912 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |