JP6675806B2 - Illegal content detection device, illegal content detection method and program - Google Patents

Illegal content detection device, illegal content detection method and program Download PDF

Info

Publication number
JP6675806B2
JP6675806B2 JP2018005905A JP2018005905A JP6675806B2 JP 6675806 B2 JP6675806 B2 JP 6675806B2 JP 2018005905 A JP2018005905 A JP 2018005905A JP 2018005905 A JP2018005905 A JP 2018005905A JP 6675806 B2 JP6675806 B2 JP 6675806B2
Authority
JP
Japan
Prior art keywords
content
frequency band
khz
illegal
illegal content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018005905A
Other languages
Japanese (ja)
Other versions
JP2019124846A (en
Inventor
川西 隆仁
隆仁 川西
柏野 邦夫
邦夫 柏野
薫 平松
薫 平松
康智 大石
康智 大石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2018005905A priority Critical patent/JP6675806B2/en
Publication of JP2019124846A publication Critical patent/JP2019124846A/en
Application granted granted Critical
Publication of JP6675806B2 publication Critical patent/JP6675806B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、正規コンテンツに対して編集が施された違法コンテンツを検知する違法コンテンツ検知装置、違法コンテンツ検知方法およびプログラムに関する。   The present invention relates to an illegal content detection device, an illegal content detection method, and a program for detecting illegal content in which legitimate content has been edited.

通信ネットワーク技術の発展、および、スマートフォン、PC(Personal Computer)などの通信端末装置の進歩に伴い、動画などのコンテンツをアップロードおよびダウンロード可能なコンテンツ配信サイトが多数、開設されている。ユーザはこの種のコンテンツ配信サイトにコンテンツを手軽にアップロードできるため、コンテンツ配信サイトにアップロードされるコンテンツ数が年々増加している。このようなコンテンツ配信サイトにおいては、コンテンツの権利を有さない非権利者によりコンテンツが違法にアップロードされることが問題となっている。そのため、非権利者により違法にアップロードされた違法コンテンツを検知する技術が求められている。   With the development of communication network technology and the progress of communication terminal devices such as smartphones and PCs (Personal Computers), many content distribution sites capable of uploading and downloading contents such as moving images have been opened. Since users can easily upload content to this type of content distribution site, the number of contents uploaded to the content distribution site is increasing year by year. In such a content distribution site, there is a problem that content is illegally uploaded by a non-rights holder who does not have the right to the content. Therefore, there is a need for a technology for detecting illegal content uploaded illegally by non-rights holders.

非特許文献1には、目的信号の音声・映像信号の特徴を抽出し、蓄積信号の中から、目的信号と特徴が一致する信号(コンテンツ)を探索する技術が開示されている。この技術によれば、例えば、コンテンツ配信サイトにアップロードされているコンテンツの中から、正規コンテンツを複製するなどして作製された違法コンテンツを探索(自動検知)することができる。   Non-Patent Literature 1 discloses a technique of extracting features of audio / video signals of a target signal and searching a stored signal for a signal (content) having the same feature as the target signal. According to this technology, it is possible to search (automatically detect) illegal contents created by, for example, copying legitimate contents from contents uploaded to a content distribution site.

川西 隆仁、外5名、「音楽や映像を特定するメディア指紋技術とその応用」、日本応用数理学会誌「応用数理」、Vol.21,No.4,2011年12月Takahito Kawanishi, et al., "Media Fingerprinting Technology for Identifying Music and Video and Its Applications", Journal of the Japan Society of Applied Mathematics "Applied Mathematics", Vol. 21, No. 4, December 2011

近年、上述した正規コンテンツとの特徴の一致による違法コンテンツの自動検知を回避するために、音響信号に種々の加工(編集)が施された違法コンテンツが増加している。   In recent years, in order to avoid automatic detection of illegal contents due to the coincidence of characteristics with regular contents described above, illegal contents in which various processes (edits) are performed on audio signals are increasing.

自動検知を回避するための加工の1つとして、正規コンテンツの音響信号の特定帯域を抑制したり、ノイズを重畳したりする加工がある。また、別の加工として、正規コンテンツの時間を伸縮させる加工がある。このような加工が施されると、違法コンテンツの音響信号の特徴が、正規コンテンツの音響信号と異なるものとなる。そのため、正規コンテンツとの特徴の一致による違法コンテンツの自動検知が困難になる。   As one of the processes for avoiding the automatic detection, there is a process for suppressing a specific band of an audio signal of regular content or superimposing noise. Further, as another process, there is a process of expanding and contracting the time of the regular content. When such processing is performed, the characteristics of the audio signal of the illegal content are different from those of the regular content. Therefore, it becomes difficult to automatically detect illegal content based on the matching of features with regular content.

上記のような問題点に鑑みてなされた本発明の目的は、違法コンテンツの検知精度の向上を図ることができる違法コンテンツ検知装置、違法コンテンツ検知方法およびプログラムを提供することにある。   An object of the present invention, which has been made in view of the above problems, is to provide an illegal content detection device, an illegal content detection method, and a program that can improve the detection accuracy of illegal content.

上記課題を解決するため、本発明に係る違法コンテンツ検知装置は、正規コンテンツに対して編集が施された違法コンテンツを検知する違法コンテンツ検知装置であって、判定対象のコンテンツの音響信号の周波数スペクトルを算出する算出部と、前記算出部により算出された周波数スペクトルにおける特定の周波数帯域の特性値に基づき、前記判定対象のコンテンツが前記違法コンテンツであるか否かを判定する判定部と、を備える。   In order to solve the above-mentioned problem, an illegal content detection device according to the present invention is an illegal content detection device that detects an illegal content obtained by editing legitimate content, and comprises a frequency spectrum of an audio signal of the content to be determined. And a determination unit that determines whether the content to be determined is the illegal content based on a characteristic value of a specific frequency band in the frequency spectrum calculated by the calculation unit. .

また、上記課題を解決するため、本発明に係る違法コンテンツ検知方法は、正規コンテンツに対して編集が施された違法コンテンツを検知する違法コンテンツ検知装置が実行する違法コンテンツ検知方法であって、判定対象のコンテンツの音響信号の周波数スペクトルを算出するステップと、前記算出した周波数スペクトルにおける特定の周波数帯域の特性値に基づき、前記判定対象のコンテンツが前記違法コンテンツであるか否かを判定するステップと、を含む。   Further, in order to solve the above problem, an illegal content detection method according to the present invention is an illegal content detection method executed by an illegal content detection device that detects an illegal content in which legitimate content has been edited. Calculating the frequency spectrum of the audio signal of the target content, and determining whether the determination target content is the illegal content based on a characteristic value of a specific frequency band in the calculated frequency spectrum. ,including.

また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを、上記の違法コンテンツ検知装置として機能させる。   Further, in order to solve the above problem, a program according to the present invention causes a computer to function as the above illegal content detection device.

本発明に係る違法コンテンツ検知装置、違法コンテンツ検知方法およびプログラムによれば、違法コンテンツの検知精度の向上を図ることができる。   ADVANTAGE OF THE INVENTION According to the illegal content detection apparatus, the illegal content detection method, and the program which concern on this invention, the improvement of the detection accuracy of an illegal content can be aimed at.

本発明の一実施形態に係る違法コンテンツ検知装置の構成例を示す図である。It is a figure showing the example of composition of the illegal content detection device concerning one embodiment of the present invention. 正規コンテンツの周波数スペクトルの一例を示す図である。FIG. 4 is a diagram illustrating an example of a frequency spectrum of regular content. 正規コンテンツの周波数スペクトルの他の一例を示す図である。It is a figure which shows another example of the frequency spectrum of regular content. 違法コンテンツの周波数スペクトルの一例を示す図である。It is a figure showing an example of a frequency spectrum of illegal contents. 図1に示す違法コンテンツ検知装置が実行する違法コンテンツ検知方法の一例を示すフローチャートである。3 is a flowchart illustrating an example of an illegal content detection method executed by the illegal content detection device illustrated in FIG. 1. 違法コンテンツの周波数スペクトルの他の一例を示す図である。It is a figure showing another example of the frequency spectrum of illegal content.

以下、本発明を実施するための形態について、図面を参照しながら説明する。   Hereinafter, embodiments for carrying out the present invention will be described with reference to the drawings.

図1は、本発明の一実施形態に係る違法コンテンツ検知装置10の構成例を示す図である。本実施形態にかかる違法コンテンツ検知装置10は、例えば、コンテンツ配信サイトにアップロード(投稿)されたコンテンツが、自動検知を回避するための編集が施され、コンテンツの権利を有さない非権利者によりアップロードされた違法コンテンツであるか否かを検知する。   FIG. 1 is a diagram illustrating a configuration example of an illegal content detection device 10 according to an embodiment of the present invention. In the illegal content detection device 10 according to the present embodiment, for example, a content uploaded (posted) to a content distribution site is edited to avoid automatic detection, and is edited by a non-rights holder who does not have the right to the content. Detects whether the uploaded content is illegal.

図1に示す違法コンテンツ検知装置10は、算出部11と、判定部12とを備える。   The illegal content detection device 10 illustrated in FIG. 1 includes a calculation unit 11 and a determination unit 12.

算出部11は、違法コンテンツであるか否かの判定対象のコンテンツを取得し、取得した判定対象のコンテンツの音響信号の周波数スペクトル(パワースペクトル(フーリエ係数の絶対値の2乗))を算出して、判定部12に出力する。   The calculation unit 11 acquires the content to be determined as to whether or not the content is illegal, and calculates the frequency spectrum (power spectrum (square of the absolute value of the Fourier coefficient)) of the audio signal of the acquired content to be determined. And outputs it to the determination unit 12.

判定部12は、算出部11から出力された周波数スペクトルにおける特定の周波数帯域の特性値に基づき、判定対象のコンテンツが違法コンテンツであるか否かを判定し、判定結果を出力する。特性値としては、例えば、算出部11が算出したパワースペクトルにおける特定の周波数帯域のパワーがある。以下では、特性値として、特定の周波数帯域のパワーを用いる例について説明するが、本発明はこれに限られるものではない。特性値としては、例えば、振幅スペクトル(フーリエ係数の絶対値)における特定の周波数帯域の値(振幅値)を用いてもよい。パワースペクトルと振幅スペクトルとは、単位/次元が異なるだけなので、同様の効果を得ることができる。また、周波数スペクトルあるいは振幅スペクトルの算出には、フーリエ変換ではなく、例えば、ウェーブレット変換などの類似の変換を用いてもよい。   The determination unit 12 determines whether the content to be determined is illegal content based on the characteristic value of a specific frequency band in the frequency spectrum output from the calculation unit 11, and outputs a determination result. As the characteristic value, for example, there is the power of a specific frequency band in the power spectrum calculated by the calculation unit 11. Hereinafter, an example in which power of a specific frequency band is used as the characteristic value will be described, but the present invention is not limited to this. As the characteristic value, for example, a value (amplitude value) of a specific frequency band in an amplitude spectrum (absolute value of Fourier coefficient) may be used. Since the power spectrum and the amplitude spectrum differ only in the unit / dimension, the same effect can be obtained. Further, a similar transform such as a wavelet transform may be used for calculating the frequency spectrum or the amplitude spectrum instead of the Fourier transform.

図2Aおよび図2Bは、テレビ放送、特に、地上デジタル放送で正規に放送される放送コンテンツ(正規コンテンツ)の周波数スペクトルの一例を示す図である。   FIG. 2A and FIG. 2B are diagrams illustrating an example of a frequency spectrum of broadcast content (regular content) that is regularly broadcast in television broadcasting, particularly digital terrestrial broadcasting.

図2Aおよび図2Bに示すように、放送コンテンツにおいては、15kHz〜18kHz付近にカットオフ周波数を有することが多い。15kHz〜18kHz付近に放送コンテンツのカットオフ周波数が設けられる理由としては、これよりも高周波帯域の音声を人が認識することが困難であること、地上デジタル放送では、主に人の可聴域に信号が割り当てられることなどがある。   As shown in FIGS. 2A and 2B, broadcast contents often have a cutoff frequency around 15 kHz to 18 kHz. The reason why the cut-off frequency of the broadcast content is provided in the vicinity of 15 kHz to 18 kHz is that it is difficult for a person to recognize a sound in a higher frequency band than this, and in terrestrial digital broadcasting, a signal is mainly placed in a human audible range. May be assigned.

図2Cは、放送コンテンツに自動検知を回避するための編集が施された違法コンテンツの周波数スペクトルの一例を示す図である。   FIG. 2C is a diagram illustrating an example of a frequency spectrum of an illegal content in which broadcast content has been edited to avoid automatic detection.

違法コンテンツでは、図2Cに示すように、10kHz付近にカットオフ周波数を有することが多い。10kHz付近に違法コンテンツのカットオフ周波数が設けられる理由としては、人の音声の周波数帯域が4〜8kHz程度であり、コンテンツの内容などの把握のためには、その周波数帯域の音声を把握できれば十分であること、高周波数帯域の音響信号をカットオフした方が、自動検知されにくくなることなどがある。   Illegal content often has a cutoff frequency around 10 kHz, as shown in FIG. 2C. The reason why the cut-off frequency of the illegal content is provided around 10 kHz is that the frequency band of the human voice is about 4 to 8 kHz, and it is sufficient to grasp the voice of the frequency band in order to grasp the content of the content. That is, when the acoustic signal in the high frequency band is cut off, automatic detection becomes difficult.

このように、自動検知を回避するための加工が施された違法コンテンツの音響信号には、正規コンテンツには無い編集の痕跡が残ることが多い。なお、図2A〜図2Cにおいては、放送コンテンツを例に説明したが、これに限られるものではない。例えば、DVD(Digital Versatile Disc),Blu−ray(登録商標) Diskなどの記憶媒体に記憶された正規コンテンツに対して、自動検知を回避するための編集が施された違法コンテンツにおいても、正規コンテンツには無い編集の痕跡が残ることが多い。判定部12は、算出部11が算出した周波数スペクトルにおける特定の周波数帯域の特性値に基づき、上述したような編集の痕跡を検知することで、判定対象のコンテンツが違法コンテンツであるか否かを判定することができる。   As described above, in many cases, the audio signal of the illegal content processed to avoid the automatic detection has a trace of editing that does not exist in the regular content. 2A to 2C, the broadcast content has been described as an example, but the present invention is not limited to this. For example, even if illegal content edited to avoid automatic detection is applied to regular content stored on a storage medium such as a DVD (Digital Versatile Disc) or Blu-ray (registered trademark) Disc, Often, there are traces of editing that are not found in. The determination unit 12 detects whether or not the content to be determined is illegal content by detecting the above-described trace of editing based on the characteristic value of the specific frequency band in the frequency spectrum calculated by the calculation unit 11. Can be determined.

次に、本実施形態に係る違法コンテンツ検知装置10の動作について説明する。   Next, the operation of the illegal content detection device 10 according to the present embodiment will be described.

図3は、本実施形態に係る違法コンテンツ検知装置10が実行する違法コンテンツ検知方法の一例を示すフローチャートである。なお、図3においては、判定対象のコンテンツが、放送コンテンツ(正規コンテンツ)に対して編集が施された違法コンテンツであるか否かを判定する例を用いて説明する。   FIG. 3 is a flowchart illustrating an example of an illegal content detection method executed by the illegal content detection device 10 according to the present embodiment. In FIG. 3, an example will be described in which it is determined whether or not the content to be determined is illegal content obtained by editing broadcast content (regular content).

算出部11は、判定対象のコンテンツを取得してデコードし、音響信号を取得する(ステップS11)。なお、コンテンツの取得の方式としては、ストリーミング型と、ダウンロード型とがある。ストリーミング型の場合、算出部11は、コンテンツ配信サイトなどからコンテンツの一部のデータを取得するごとに、取得した部分から順次デコードして、音響信号を取得する。また、ダウンロード型の場合、算出部11は、コンテンツ全体のデータを取得した後にデコードして、音響信号を取得する。   The calculation unit 11 acquires and decodes the content to be determined, and acquires an audio signal (step S11). Note that there are a streaming type and a download type as a method of acquiring contents. In the case of the streaming type, every time data of a part of the content is obtained from a content distribution site or the like, the calculation unit 11 sequentially decodes the obtained part to obtain an audio signal. In the case of the download type, the calculation unit 11 acquires data of the entire content, decodes the data, and acquires an audio signal.

次に、算出部11は、取得した音響信号について、時間領域において所定の時間窓のサンプル値に窓関数を適用して離散フーリエ変換を行い、振幅スペクトルを取得する。そして、算出部11は、振幅スペクトルの絶対値を二乗することで、時間窓での周波数毎のパワー(音響パワー周波数スペクトル)を算出する(ステップS12)。   Next, the calculation unit 11 performs a discrete Fourier transform on the acquired acoustic signal by applying a window function to a sample value of a predetermined time window in a time domain, and acquires an amplitude spectrum. Then, the calculation unit 11 calculates the power (sound power frequency spectrum) for each frequency in the time window by squaring the absolute value of the amplitude spectrum (step S12).

次に、算出部11は、音響パワー周波数スペクトルを統計的に解析して、時間平均対数スペクトル(周波数スペクトル)を算出する(ステップS13)。   Next, the calculation unit 11 statistically analyzes the sound power frequency spectrum and calculates a time average logarithmic spectrum (frequency spectrum) (step S13).

次に、判定部12は、算出部11により算出された周波数スペクトルに基づき、判定対象のコンテンツが放送コンテンツであるか否かを判定する(ステップS14)。具体的には、判定部12は、周波数スペクトルにおいて、14kHz〜15kHz付近の周波数帯域(第2の周波数帯域)のパワー(例えば、その周波数帯域の平均パワー)が、19kHz〜20kHz付近の周波数帯域(第3の周波数帯域)のパワーよりも大きいか否かを判定する。   Next, the determination unit 12 determines whether the content to be determined is a broadcast content based on the frequency spectrum calculated by the calculation unit 11 (step S14). Specifically, the determination unit 12 determines that the power (for example, the average power of the frequency band) of a frequency band around 14 kHz to 15 kHz (the second frequency band) in the frequency spectrum is about 19 kHz to 20 kHz. It is determined whether the power is greater than the power of the third frequency band).

図2Aおよび図2Bを参照して説明したように、放送コンテンツは、15kHzから18kHz付近にカットオフ周波数を有する。したがって、コンテンツの音響信号から得られた周波数スペクトルにおいて、14kHz〜15kHz付近の周波数帯域のパワーが、19kHz〜20kHz付近の周波数帯域のパワーよりも大きい場合、そのコンテンツは正規の放送コンテンツであると推定することができる。一方、コンテンツの音響信号から得られた周波数スペクトルにおいて、14kHz〜15kHz付近の周波数帯域のパワーが、19kHz〜20kHz付近の周波数帯域のパワーよりも大きくない場合、そのコンテンツは正規の放送コンテンツではないと推定することができる。   As described with reference to FIGS. 2A and 2B, the broadcast content has a cutoff frequency around 15 kHz to 18 kHz. Therefore, if the power in the frequency band around 14 kHz to 15 kHz is greater than the power in the frequency band around 19 kHz to 20 kHz in the frequency spectrum obtained from the audio signal of the content, the content is estimated to be legitimate broadcast content. can do. On the other hand, if the power in the frequency band around 14 kHz to 15 kHz is not greater than the power in the frequency band around 19 kHz to 20 kHz in the frequency spectrum obtained from the audio signal of the content, the content is not legitimate broadcast content. Can be estimated.

なお、判定部12は、14kHz〜15kHz付近の周波数帯域のパワーと、19kHz〜20kHz付近の周波数帯域のパワーとに応じた指標値に基づき、判定対象のコンテンツが正規の放送コンテンツであるか否かを判定してもよい。このような指標値としては、14kHz〜15kHz付近の周波数帯域のパワーと19kHz〜20kHz付近の周波数帯域のパワーとの差、14kHz〜15kHz付近の周波数帯域のパワーの19kHz〜20kHz付近の周波数帯域のパワーに対する比などがある。これらの指標値が所定の閾値以上である場合には、14kHz〜15kHz付近の周波数帯域のパワーが、19kHz〜20kHz付近の周波数帯域のパワーに比べて十分に大きいため、判定部12は、判定対象のコンテンツが放送コンテンツであると判定してもよい。   The determining unit 12 determines whether the content to be determined is a legitimate broadcast content based on an index value corresponding to the power of the frequency band around 14 kHz to 15 kHz and the power of the frequency band around 19 kHz to 20 kHz. May be determined. As such an index value, the difference between the power in the frequency band around 14 kHz to 15 kHz and the power in the frequency band around 19 kHz to 20 kHz, and the power in the frequency band around 19 kHz to 20 kHz of the power in the frequency band around 14 kHz to 15 kHz There is a ratio to. If these index values are equal to or greater than a predetermined threshold, the power of the frequency band around 14 kHz to 15 kHz is sufficiently larger than the power of the frequency band around 19 kHz to 20 kHz. May be determined to be broadcast content.

14kHz〜15kHz付近の周波数帯域のパワーが、19kHz〜20kHz付近の周波数帯域のパワーよりも大きくなく、正規の放送コンテンツではないと判定した場合(ステップS14:No)、判定部12は、判定対象のコンテンツに対して、違法コンテンツに施されていることが多い編集(違法編集)が施されているか否かを判定する(ステップS15)。具体的には、判定部12は、9kHz〜10kHz付近の周波数帯域(第1の周波数帯域)のパワーが、14kHz〜15kHz付近の周波数帯域(第2の周波数帯域)のパワーよりも大きいか否かを判定する。   When it is determined that the power in the frequency band around 14 kHz to 15 kHz is not greater than the power in the frequency band around 19 kHz to 20 kHz and is not legitimate broadcast content (step S14: No), the determination unit 12 determines It is determined whether the content has been edited (illegal editing), which is often performed on illegal content (step S15). Specifically, the determination unit 12 determines whether the power in the frequency band around 9 kHz to 10 kHz (first frequency band) is greater than the power in the frequency band around 14 kHz to 15 kHz (second frequency band). Is determined.

図2A〜2Cを参照して説明したように、正規の放送コンテンツは、15kHzから18kHz付近にカットオフ周波数を有する。一方、違法コンテンツは、10kHz付近にカットオフされる編集が行われることが多い。したがって、コンテンツの音響信号から得られた周波数スペクトルにおいて、9kHz〜10kHz付近の周波数帯域のパワーが、14kHz〜15kHz付近の周波数帯域のパワーよりも大きい場合、そのコンテンツは違法編集が施された違法コンテンツであると推定することができる。一方、コンテンツの音響信号から得られた周波数スペクトルにおいて、9kHz〜10kHz付近の周波数帯域のパワーが、14kHz〜15kHz付近の周波数帯域のパワーよりも大きくない場合、そのコンテンツには違法編集が施されていないと推定することができる。   As described with reference to FIGS. 2A to 2C, regular broadcast content has a cutoff frequency around 15 kHz to 18 kHz. On the other hand, illegal content is often edited to be cut off at around 10 kHz. Therefore, if the power in the frequency band around 9 kHz to 10 kHz is greater than the power in the frequency band around 14 kHz to 15 kHz in the frequency spectrum obtained from the audio signal of the content, the content is illegally edited and illegally edited. It can be estimated that On the other hand, if the power in the frequency band around 9 kHz to 10 kHz is not higher than the power in the frequency band around 14 kHz to 15 kHz in the frequency spectrum obtained from the audio signal of the content, the content has been edited illegally. It can be estimated that there is no.

なお、判定部12は、9kHz〜10kHz付近の周波数帯域のパワーと、14kHz〜15kHz付近の周波数帯域のパワーとに応じた指標値に基づき、判定対象のコンテンツが違法コンテンツであるか否かを判定してもよい。このような指標値としては、9kHz〜10kHz付近の周波数帯域のパワーと14kHz〜15kHz付近の周波数帯域のパワーとの差、9kHz〜10kHz付近の周波数帯域のパワーの14kHz〜15kHz付近の周波数帯域のパワーに対する比などがある。これらの指標値が所定の閾値以上である場合には、9kHz〜10kHz付近の周波数帯域のパワーが、14kHz〜15kHz付近の周波数帯域のパワーに比べて十分に大きいため、判定部12は、判定対象のコンテンツが違法コンテンツであると判定してもよい。   The determining unit 12 determines whether the content to be determined is an illegal content based on an index value corresponding to the power in the frequency band around 9 kHz to 10 kHz and the power in the frequency band around 14 kHz to 15 kHz. May be. As such an index value, the difference between the power in the frequency band around 9 kHz to 10 kHz and the power in the frequency band around 14 kHz to 15 kHz, and the power in the frequency band around 14 kHz to 15 kHz of the power in the frequency band around 9 kHz to 10 kHz There is a ratio to. If these index values are equal to or greater than a predetermined threshold, the power of the frequency band around 9 kHz to 10 kHz is sufficiently larger than the power of the frequency band around 14 kHz to 15 kHz. May be determined to be illegal content.

9kHz〜10kHz付近の周波数帯域のパワーが、14kHz〜15kHz付近の周波数帯域のパワーよりも大きいと判定した場合(ステップS15:Yes)、判定部12は、判定対象のコンテンツには違法編集の痕跡がある(判定対象のコンテンツは違法コンテンツである)との判定結果を出力する(ステップS16)。   When it is determined that the power in the frequency band around 9 kHz to 10 kHz is greater than the power in the frequency band around 14 kHz to 15 kHz (step S15: Yes), the determination unit 12 has no trace of illegal editing in the content to be determined. The result of the determination that the content is present (the content to be determined is illegal content) is output (step S16).

このように、判定部12は、判定対象のコンテンツの音響信号から得られた周波数スペクトルにおいて、14kHz〜15kHz付近の周波数帯域(第2の周波数帯域)のパワーが、それよりも高い19kHz〜20kHz付近の周波数帯域(第3の周波数帯域)のパワーよりも大きくなく、かつ、9kHz〜10kHz付近の周波数帯域(第1の周波数帯域)のパワーが、それよりも高い14kHz〜15kHz付近の周波数帯域(第2の周波数帯域)のパワーよりも大きい場合、判定対象のコンテンツは違法コンテンツであると判定する。こうすることで、特に放送コンテンツの違法コンテンツを高精度に検知することができる。   As described above, the determination unit 12 determines that the power in the frequency band (the second frequency band) around 14 kHz to 15 kHz is higher than that in the frequency spectrum obtained from the audio signal of the content to be determined, which is higher than 19 kHz to 20 kHz. Is not greater than the power in the frequency band (third frequency band), and the power in the frequency band (first frequency band) near 9 kHz to 10 kHz is higher than the power in the frequency band around 14 kHz to 15 kHz (first frequency band). If the power is larger than the power of the second frequency band, the content to be determined is determined to be illegal content. This makes it possible to detect particularly illegal contents of broadcast contents with high accuracy.

14kHz〜15kHz付近の周波数帯域のパワーが、19kHz〜20kHz付近の周波数帯域のパワーよりも大きいと判定した場合(ステップS14:Yes)、および、9kHz〜10kHz付近の周波数帯域のパワーが、14kHz〜15kHz付近の周波数帯域のパワーよりも大きくないと判定した場合(ステップS15:No)、判定部12は、判定対象のコンテンツに違法編集が施された痕跡がないとの判定結果を出力する(ステップS17)。   When it is determined that the power in the frequency band around 14 kHz to 15 kHz is greater than the power in the frequency band around 19 kHz to 20 kHz (step S14: Yes), and when the power in the frequency band around 9 kHz to 10 kHz is 14 kHz to 15 kHz When it is determined that the power is not greater than the power of the nearby frequency band (step S15: No), the determination unit 12 outputs a determination result indicating that there is no trace of illegally edited content to be determined (step S17). ).

判定部12は、ステップS16あるいはステップS17の判定結果を出力して、処理を終了する。   The determination unit 12 outputs the determination result of step S16 or step S17, and ends the processing.

テレビからキャプチャした1600分の正規コンテンツおよびインターネット上からダウンロードした4216分の違法コンテンツを用いて、本実施形態に係る違法コンテンツの検知方法の性能評価を行った結果、テレビからキャプチャした1600分の正規コンテンツのうち99.1%の正規コンテンツが正しく、正規コンテンツであると判定された。また、インターネット上からダウンロードした4216分の違法コンテンツのうち99.3%の違法コンテンツに、違法編集が施された痕跡があると判定された。なお、残りの0.7%の違法コンテンツは無音であったために、判定することができなかった。この結果から、高精度に違法コンテンツの検知が行われていることが分かる。   The performance of the method for detecting illegal content according to the present embodiment was evaluated using 1600 minutes of legitimate content captured from a TV and 4216 minutes of illegal content downloaded from the Internet. 99.1% of the regular contents among the contents were judged to be correct and regular contents. In addition, it was determined that 99.3% of the illegal contents of 4216 downloaded from the Internet had a trace of illegal editing. Note that the remaining 0.7% of the illegal contents were silent, and could not be determined. From this result, it can be seen that illegal content detection is performed with high accuracy.

なお、図3においては、ステップS14において、判定対象のコンテンツが放送コンテンツであるか否かの判定を行い、ステップS15において、判定対象のコンテンツに違法編集が施されているか否かの判定を行う例を用いて説明したが、これに限られるものではない。ステップS14の処理を省略し、ステップS15の処理を行うだけでも、判定対象のコンテンツが違法コンテンツであるか否かを高精度に検知することができる。   In FIG. 3, it is determined in step S14 whether or not the content to be determined is a broadcast content, and in step S15, it is determined whether or not the content to be determined has been illegally edited. Although described using an example, the present invention is not limited to this. By omitting the process of step S14 and performing only the process of step S15, it is possible to detect with high accuracy whether or not the content to be determined is illegal content.

また、図4に示すように、違法コンテンツでは、全周波数帯域に亘ってノイズが重畳されることがある。そこで、判定部12は、判定対象のコンテンツの音響信号から得られた周波数スペクトルにおいて、所定の周波数(正規コンテンツのカットオフ周波数)よりも高周波帯域(図2Cの例では、例えば、18kHzよりも高周波帯域)のパワーが、所定の閾値以上である場合、判定対象のコンテンツが違法コンテンツであると判定してもよい。   Also, as shown in FIG. 4, in the illegal content, noise may be superimposed over the entire frequency band. Therefore, the determination unit 12 determines that the frequency spectrum obtained from the audio signal of the content to be determined has a higher frequency band than the predetermined frequency (the cutoff frequency of the regular content) (for example, higher than 18 kHz in the example of FIG. 2C). If the power of the band is equal to or greater than a predetermined threshold, the content to be determined may be determined to be illegal content.

このように本実施形態においては、違法コンテンツ検知装置10は、判定対象のコンテンツの音響信号の周波数スペクトルを算出する算出部11と、算出部11により算出された周波数スペクトルにおける特定の周波数帯域のパワーに基づき、判定対象のコンテンツが違法コンテンツであるか否かを判定する判定部12とを備える。   As described above, in the present embodiment, the illegal content detection device 10 calculates the frequency spectrum of the audio signal of the content to be determined, and the power of a specific frequency band in the frequency spectrum calculated by the calculation unit 11. And a determination unit 12 that determines whether the content to be determined is illegal content based on the content.

違法コンテンツの音響信号には、違法編集が施されていることが多い。そのような編集が行われると、コンテンツの音響信号の周波数スペクトルに編集による痕跡が残ることが多い。そのため、判定対象のコンテンツの音響信号の周波数スペクトルを算出し、その周波数スペクトルのパワーに基づき違法コンテンツを検知することで、違法コンテンツの検知精度の向上を図ることができる。   Often, audio signals of illegal content are illegally edited. When such editing is performed, traces of the editing often remain in the frequency spectrum of the audio signal of the content. Therefore, by calculating the frequency spectrum of the audio signal of the content to be determined and detecting the illegal content based on the power of the frequency spectrum, the detection accuracy of the illegal content can be improved.

実施形態では特に触れていないが、違法コンテンツ検知装置10として機能するコンピュータが行う各処理を実行するためのプログラムが提供されてもよい。また、プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD−ROMあるいはDVD−ROMなどの記録媒体であってもよい。   Although not specifically mentioned in the embodiment, a program for executing each process performed by a computer functioning as the illegal content detection device 10 may be provided. Further, the program may be recorded on a computer-readable medium. If a computer-readable medium is used, it can be installed in a computer. Here, the computer-readable medium on which the program is recorded may be a non-transitory recording medium. The non-transitory recording medium is not particularly limited, but may be, for example, a recording medium such as a CD-ROM or a DVD-ROM.

上述の実施形態は代表的な例として説明したが、本発明の趣旨および範囲内で、多くの変更および置換が可能であることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形および変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。   Although the above embodiments have been described as representative examples, it will be apparent to those skilled in the art that many modifications and substitutions are possible within the spirit and scope of the present invention. Therefore, the present invention should not be construed as limited by the above-described embodiments, and various modifications and changes can be made without departing from the scope of the claims. For example, a plurality of configuration blocks described in the configuration diagram of the embodiment can be combined into one, or one configuration block can be divided.

10 違法コンテンツ検知装置
11 算出部
12 判定部
10 illegal content detection device 11 calculation unit 12 judgment unit

Claims (7)

正規コンテンツに対して編集が施された違法コンテンツを検知する違法コンテンツ検知装置であって、
判定対象のコンテンツの音響信号の周波数スペクトルを算出する算出部と、
前記算出部により算出された周波数スペクトルにおける特定の周波数帯域の特性値に基づき、前記判定対象のコンテンツが前記違法コンテンツであるか否かを判定する判定部と、を備えることを特徴とする違法コンテンツ検知装置。
An illegal content detection device that detects illegal content edited for legitimate content,
A calculating unit that calculates the frequency spectrum of the audio signal of the content to be determined,
A determining unit that determines whether the content to be determined is the illegal content based on a characteristic value of a specific frequency band in the frequency spectrum calculated by the calculating unit. Detection device.
請求項1に記載の違法コンテンツ検知装置において、
前記特定の周波数帯域の特性値は、前記算出部により算出された周波数スペクトルにおける特定の周波数帯域のパワーであり、
前記判定部は、前記周波数スペクトルにおいて、第1の周波数帯域のパワーが、前記第1の周波数帯域よりも高い第2の周波数帯域のパワーよりも大きい場合、前記判定対象のコンテンツは前記違法コンテンツであると判定することを特徴とする違法コンテンツ検知装置。
The illegal content detection device according to claim 1,
The characteristic value of the specific frequency band is a power of a specific frequency band in the frequency spectrum calculated by the calculation unit,
When the power of the first frequency band is higher than the power of the second frequency band higher than the first frequency band in the frequency spectrum, the determination unit determines that the content to be determined is the illegal content. An illegal content detection device, which determines that there is an illegal content.
請求項2に記載の違法コンテンツ検知装置において、
前記判定部は、前記周波数スペクトルにおいて、前記第2の周波数帯域のパワーが、前記第2の周波数帯域よりも高い第3の周波数帯域のパワーより大きくない場合、前記判定対象のコンテンツは前記違法コンテンツであると判定することを特徴とする違法コンテンツ検知装置。
The illegal content detection device according to claim 2,
When the power of the second frequency band is not higher than the power of a third frequency band higher than the second frequency band in the frequency spectrum, the determination unit determines that the content to be determined is the illegal content. An illegal content detection device characterized by determining that the content is illegal.
請求項3に記載の違法コンテンツ検知装置において、
前記第1の周波数帯域は、9kHz〜10kHz付近の周波数帯域であり、前記第2の周波数帯域は、14kHz〜15kHz付近の周波数帯域であり、前記第3の周波数帯域は、19kHz〜20kHz付近の周波数帯域であることを特徴とする違法コンテンツ検知装置。
The illegal content detection device according to claim 3,
The first frequency band is a frequency band around 9 kHz to 10 kHz, the second frequency band is a frequency band around 14 kHz to 15 kHz, and the third frequency band is a frequency band around 19 kHz to 20 kHz. An illegal content detection device characterized by being a band.
請求項1に記載の違法コンテンツ検知装置において、
前記特定の周波数帯域の特性値は、前記算出部により算出された周波数スペクトルにおける特定の周波数帯域のパワーであり、
前記判定部は、所定の周波数よりも高周波帯域のパワーが所定の閾値以上である場合、前記判定対象のコンテンツは前記違法コンテンツであると判定することを特徴とする違法コンテンツ検知装置。
The illegal content detection device according to claim 1,
The characteristic value of the specific frequency band is a power of a specific frequency band in the frequency spectrum calculated by the calculation unit,
The illegal content detection device, wherein the determination unit determines that the content to be determined is the illegal content when power in a higher frequency band than a predetermined frequency is equal to or greater than a predetermined threshold.
正規コンテンツに対して編集が施された違法コンテンツを検知する違法コンテンツ検知装置が実行する違法コンテンツ検知方法であって、
判定対象のコンテンツの音響信号の周波数スペクトルを算出するステップと、
前記算出した周波数スペクトルにおける特定の周波数帯域の特性値に基づき、前記判定対象のコンテンツが前記違法コンテンツであるか否かを判定するステップと、を含むことを特徴とする違法コンテンツ検知方法。
An illegal content detection method executed by an illegal content detection device that detects illegal content edited for legitimate content,
Calculating the frequency spectrum of the audio signal of the content to be determined;
Determining whether the content to be determined is the illegal content based on the characteristic value of the specific frequency band in the calculated frequency spectrum.
コンピュータを、請求項1から5のいずれか一項に記載の違法コンテンツ検知装置として機能させるためのプログラム。   A program for causing a computer to function as the illegal content detection device according to any one of claims 1 to 5.
JP2018005905A 2018-01-17 2018-01-17 Illegal content detection device, illegal content detection method and program Active JP6675806B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018005905A JP6675806B2 (en) 2018-01-17 2018-01-17 Illegal content detection device, illegal content detection method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018005905A JP6675806B2 (en) 2018-01-17 2018-01-17 Illegal content detection device, illegal content detection method and program

Publications (2)

Publication Number Publication Date
JP2019124846A JP2019124846A (en) 2019-07-25
JP6675806B2 true JP6675806B2 (en) 2020-04-08

Family

ID=67398818

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018005905A Active JP6675806B2 (en) 2018-01-17 2018-01-17 Illegal content detection device, illegal content detection method and program

Country Status (1)

Country Link
JP (1) JP6675806B2 (en)

Also Published As

Publication number Publication date
JP2019124846A (en) 2019-07-25

Similar Documents

Publication Publication Date Title
US10210884B2 (en) Systems and methods facilitating selective removal of content from a mixed audio recording
US7062442B2 (en) Method and arrangement for search and recording of media signals
US6604072B2 (en) Feature-based audio content identification
US7031921B2 (en) System for monitoring audio content available over a network
JP6576934B2 (en) Signal quality based enhancement and compensation of compressed audio signals
JP2015531084A5 (en)
CN108091352B (en) Audio file processing method and device, storage medium and terminal equipment
EP1497935B1 (en) Feature-based audio content identification
JP6675806B2 (en) Illegal content detection device, illegal content detection method and program
JP6666725B2 (en) Noise reduction device and noise reduction method
JP5879075B2 (en) Digital watermark detection apparatus and digital watermark detection method
CN114268831B (en) Video editing method and device
JP2004334160A (en) Characteristic amount extraction device
EP2905775A1 (en) Method and Apparatus for watermarking successive sections of an audio signal
US9552829B2 (en) System and method for low-loss removal of stationary and non-stationary short-time interferences
TW201346888A (en) Electronic device and method for detecting pornographic audio
Kim et al. Robust audio fingerprinting method using prominent peak pair based on modulated complex lapped transform
US10109295B2 (en) Audio processing apparatus and audio processing method
WO2018129854A1 (en) Voice processing method and device
Czyżewski et al. Online sound restoration for digital library applications
WO2018132834A1 (en) Comparative balancing
EP1417583B1 (en) Method for receiving a media signal
JP4056057B2 (en) Method and apparatus for retrieving and recording media signal
JP2008262000A (en) Audio signal feature detection device and feature detection method
KR101608849B1 (en) Audio signal processing system and method for searching sound source used broadcast contents

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190510

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200310

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200310

R150 Certificate of patent or registration of utility model

Ref document number: 6675806

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150