RU2807194C1 - Method for speech extraction by analysing amplitude values of interference and signal in two-channel speech signal processing system - Google Patents

Method for speech extraction by analysing amplitude values of interference and signal in two-channel speech signal processing system Download PDF

Info

Publication number
RU2807194C1
RU2807194C1 RU2022129413A RU2022129413A RU2807194C1 RU 2807194 C1 RU2807194 C1 RU 2807194C1 RU 2022129413 A RU2022129413 A RU 2022129413A RU 2022129413 A RU2022129413 A RU 2022129413A RU 2807194 C1 RU2807194 C1 RU 2807194C1
Authority
RU
Russia
Prior art keywords
interference
channel
signal
amplitude
speech
Prior art date
Application number
RU2022129413A
Other languages
Russian (ru)
Inventor
Владимир Алексеевич Золотарев
Данил Сергеевич Карманов
Original Assignee
Акционерное общество "Созвездие"
Filing date
Publication date
Application filed by Акционерное общество "Созвездие" filed Critical Акционерное общество "Созвездие"
Application granted granted Critical
Publication of RU2807194C1 publication Critical patent/RU2807194C1/en

Links

Abstract

FIELD: communications.
SUBSTANCE: means for exchanging voice messages. Signal processing is carried out in two channels, the main (first) and the additional (second). Preliminarily, in both channels in the absence of interference, samples of the speech signal are taken, in the interval that does not contain a speech signal, interference samples are taken in each channel. The average values of the amplitudes of the signal and interference are calculated, then the coefficient of change in the amplitude of the interference and the change in the signal in the second channel relative to the first channel is calculated. After appearance of the speech signal, the amplitudes of the mixture of interference and signal are measured and the value of the signal amplitude is calculated using the amplitudes of the mixture of interference and signal in each channel, as well as the values of the coefficient of change in the amplitude of the speech signal in the second channel relative to the first channel and the value of the coefficient of change in the amplitude of the interference in the second channel relative to the first channel. In pauses between transmissions of voice messages, which, among other things, are organized when the quality of received speech information deteriorates, interference samples are taken in each channel, the value of the interference amplitude change coefficient in the second channel relative to the first channel is specified.
EFFECT: ensuring selection of a speech signal from acoustic noise.
1 cl, 2 dwg

Description

Изобретение относится к области техники передачи и трансляции речевой информации и может найти применение в устройствах связи и в устройствах громкоговорящей связи.The invention relates to the field of technology for transmitting and broadcasting speech information and can find application in communication devices and public address devices.

Известно устройство для выделения акустических сигналов в каналах связи, описанное в патенте RU 2171549 H04Q 1/46. Изобретение относится к электросвязи, в частности к автоматическим средствам приема сигналов тональной сигнализации в системах многоканальной связи, и может использоваться, например, для обнаружения акустических сигналов (АС) в телефонных каналах. Функционирование основано на вычислении ряда решающих статистик, которые являются отличительными признаками при распознавании информационного АС от канальных шумов и паразитных речевых сигналов. В качестве решающих статистик используются оценка мощности сигнала в информационной полосе частот, распределение энергии входного сигнала по частотному диапазону и величина неравномерности, огибающей отфильтрованного в полосовом фильтре входного сигнала. Для принятия окончательного решения о присутствии в канале связи АС используется вторичная обработка, которая основана на применении мажоритарного правила для последовательной серии первичных решений.A device for isolating acoustic signals in communication channels is known, described in patent RU 2171549 H04Q 1/46. The invention relates to telecommunications, in particular to automatic means for receiving tone signals in multi-channel communication systems, and can be used, for example, to detect acoustic signals (AS) in telephone channels. The operation is based on the calculation of a number of decisive statistics, which are distinctive features in recognizing the information speaker from channel noise and spurious speech signals. The decisive statistics are used to estimate the signal power in the information frequency band, the distribution of the energy of the input signal over the frequency range, and the amount of unevenness in the envelope of the input signal filtered in a bandpass filter. To make the final decision on the presence of a speaker in the communication channel, secondary processing is used, which is based on the application of a majority rule for a sequential series of primary decisions.

Недостатком известного устройства является его невысокая эффективность при решении задачи выделения речи из смеси речевого сигнала и акустических помех.The disadvantage of the known device is its low efficiency in solving the problem of extracting speech from a mixture of speech signal and acoustic interference.

Известно устройство для выделения тональных сигналов в каналах связи по патенту RU 2214051 H04B 3/46, H04Q 1/457, H04M 1/50. Изобретение относится к области электросвязи, в частности к автоматическим средствам приема сигналов канальной сигнализации в системах многоканальной связи, и может использоваться для обнаружения акустических сигналов в телефонных каналах.A device for isolating tones in communication channels is known according to patent RU 2214051 H04B 3/46, H04Q 1/457, H04M 1/50. The invention relates to the field of telecommunications, in particular to automatic means for receiving channel signaling signals in multi-channel communication systems, and can be used to detect acoustic signals in telephone channels.

Известное техническое решение обладает недостаточно высокой эффективностью при решении задачи выделения речи из смеси речевого сигнала и акустических помех.The known technical solution is not highly efficient in solving the problem of extracting speech from a mixture of speech signal and acoustic interference.

Известен способ разделения речи и пауз путем сравнительного анализа значений мощностей помехи и смеси сигнала и помехи, описанный в патенте RU 2668407 H04Q 1/46, у которого недостаточно высокая эффективность выделения речи из смеси речевого сигнала и акустических помех.There is a known method for separating speech and pauses by comparative analysis of the values of the interference powers and the mixture of signal and interference, described in patent RU 2668407 H04Q 1/46, which does not have a high enough efficiency for separating speech from a mixture of speech signal and acoustic interference.

Наиболее близким аналогом по технической сущности к предлагаемому является способ разделения речи и пауз, описанный в книге «Цифровая обработка речевых сигналов. // Л.Р. Рабинер, Р.В. Шафер. Перевод с английского под редакцией М.В. Назарова и Ю.Н. Прохорова. Москва, «Радио и связь», 1981», стр. 123 - 126, принятый за прототип.The closest analogue in technical essence to the proposed one is the method of separating speech and pauses, described in the book “Digital processing of speech signals. // L.R. Rabiner, R.V. Best man. Translation from English edited by M.V. Nazarov and Yu.N. Prokhorova. Moscow, “Radio and Communications”, 1981”, pp. 123 - 126, adopted as a prototype.

Способ-прототип заключается в следующем.The prototype method is as follows.

Сигнал, поступающий в систему, дискретизируют в течение интервала времени, установленного для его анализа, и заносят в память для последующей обработки. Обрабатываемый сигнал состоит из интервала, который содержит только помеху, длительность данного интервала составляет около 100 мс, и интервала, который содержит аддитивную смесь речевого сигнала и помехи (в дальнейшем - смесь сигнала и помехи).The signal entering the system is sampled during the time interval set for its analysis and stored in memory for subsequent processing. The processed signal consists of an interval that contains only interference, the duration of this interval is about 100 ms, and an interval that contains an additive mixture of the speech signal and interference (hereinafter referred to as a mixture of signal and interference).

В качестве основных параметров используется число переходов через ноль в течение 10 мс и функция среднего значения, вычисленная с использованием окна длительностью 10 мс. По этим отсчетам вычисляются средние значения и дисперсии взвешенной суммы абсолютных значений амплитуд отсчетов и среднего числа переходов через ноль (статистические характеристики акустической помехи).The main parameters are the number of zero crossings within 10 ms and the average value function calculated using a 10 ms window. From these samples, the average values and variances of the weighted sum of the absolute values of the amplitudes of the samples and the average number of zero crossings (statistical characteristics of acoustic interference) are calculated.

С учетом значений этих характеристик и максимального среднего значения вычисляются пороги для среднего числа переходов через ноль (СЧПН) и энергии сигнала. Определяется фрагмент колебаний, на котором траектория среднего значения энергии сигнала (СЗЭС) превышает верхний порог. Предполагается, что начало и конец слова лежат вне этого фрагмента.Taking into account the values of these characteristics and the maximum average value, thresholds for the average number of zero crossings (AZTC) and signal energy are calculated. A fragment of oscillations is determined in which the trajectory of the average signal energy value (ASES) exceeds the upper threshold. It is assumed that the beginning and end of the word lie outside this fragment.

Затем, двигаясь в обратном направлении по оси времени от момента, где среднее значение энергии сигнала впервые превысило порог, определяют момент, в котором СЗЭС впервые оказалось меньше нижнего порога (точка N1). Этот момент выбирается в качестве предполагаемого начала. Таким же образом определяется и предполагаемое окончание слова (точка N2) (см. «Цифровая обработка речевых сигналов. // Л.Р. Рабинер, Р.В. Шафер. Перевод с английского под редакцией М.В. Назарова и Ю.Н. Прохорова. Москва, «Радио и связь», 1981», стр. 125, рис. 4.16).Then, moving in the opposite direction along the time axis from the moment where the average value of the signal energy first exceeded the threshold, the moment at which the SES was first found to be less than the lower threshold (point N 1 ) is determined. This moment is chosen as the intended beginning. The expected ending of the word (point N 2 ) is determined in the same way (see “Digital processing of speech signals.” // L.R. Rabiner, R.V. Shafer. Translation from English edited by M.V. Nazarov and Yu.N. Prokhorova, Moscow, Radio and Communications, 1981, p. 125, Fig. 4.16).

Следующий шаг состоит в перемещении влево от точки N1 (вправо от точки N2) и сравнении числа переходов через ноль с порогом, вычисленным по данным начального участка. Если число переходов через ноль превышает порог 3 или более раз, начало слова переносится туда, где кривая числа переходов через ноль впервые превысила порог. В противном случае точка N1 считается началом слова. Аналогичный процесс осуществляется в отношении точки N2.The next step is to move to the left of point N 1 (to the right of point N 2 ) and compare the number of zero crossings with the threshold calculated from the initial section data. If the number of zero crossings exceeds the threshold 3 or more times, the beginning of the word is moved to where the zero crossing curve first exceeded the threshold. Otherwise, point N 1 is considered the beginning of the word. A similar process is carried out in relation to point N 2 .

Недостатком способа-прототипа является невозможность решения задачи выделения речевого сигнала из акустических помех.The disadvantage of the prototype method is the impossibility of solving the problem of isolating a speech signal from acoustic interference.

Задача предлагаемого способа - обеспечение выделения речевого сигнала из акустических помех.The objective of the proposed method is to ensure the separation of the speech signal from acoustic interference.

Для решения поставленной задачи в способе выделения речи путем анализа значений амплитуд помехи и сигнала в двухканальной системе обработки речевого сигнала, заключающемся в том, что на всем интервале анализа, состоящего из интервала, который не содержит речевой сигнал, и интервала, который содержит смесь сигнала и помехи, сигнал, поступающий в систему, дискретизируют, согласно изобретению, обработку акустической помехи или смеси помехи и речевого сигнала осуществляют в двух каналах: первом - основном и втором - дополнительном; предварительно в обоих каналах в условиях отсутствия помехи берут отсчеты речевого сигнала, рассчитывают средние значения амплитуд сигнала и значение коэффициента изменения амплитуды речевого сигнала во втором канале относительно первого канала; в интервале, который не содержит речевой сигнал, берут отсчеты помехи в каждом канале, рассчитывают средние значения амплитуд помехи и рассчитывают коэффициент изменения амплитуды помехи во втором канале относительно первого канала; после появления речевого сигнала измеряют амплитуды смеси помехи и сигнала в каждом канале, и рассчитывают значение амплитуды сигнала путем решения системы двух линейных уравнений, в которых неизвестными являются амплитуды речевого сигнала и акустической помехи; в паузах между передачами речевых сообщений берут отсчеты помехи в каждом канале, рассчитывают средние значения амплитуд помехи и рассчитывают коэффициент изменения амплитуды помехи во втором канале относительно первого канала, после появления речевого сигнала процесс выделения речи из акустической помехи осуществляют с использованием уточненного значения коэффициента изменения амплитуды помехи во втором канале относительно первого канала; при снижении качества принимаемой речевой информации абонент передает соответствующее сообщение абоненту, передающему речевую информацию, в этом случае абонент, передающий речевую информацию, прекращает на небольшой временной интервал передачу, в этом интервале рассчитывают коэффициент изменения амплитуды помехи во втором канале относительно первого канала, после чего возобновляют обмен речевыми сообщениями и процесс выделения речи из акустической помехи, при этом используют уточненное значение коэффициента изменения амплитуды помехи во втором канале относительно первого канала.To solve the problem in the method of speech extraction by analyzing the values of the amplitudes of the interference and signal in a two-channel speech signal processing system, which consists in the fact that over the entire analysis interval, consisting of an interval that does not contain a speech signal, and an interval that contains a mixture of signal and interference, the signal entering the system is sampled, according to the invention, the processing of acoustic interference or a mixture of interference and speech signal is carried out in two channels: the first - main and the second - additional; preliminary, in both channels, in the absence of interference, samples of the speech signal are taken, the average values of the signal amplitudes and the value of the coefficient of change in the amplitude of the speech signal in the second channel relative to the first channel are calculated; in the interval that does not contain a speech signal, interference samples are taken in each channel, the average values of the interference amplitudes are calculated, and the coefficient of change in the interference amplitude in the second channel relative to the first channel is calculated; after the appearance of the speech signal, the amplitudes of the mixture of interference and signal are measured in each channel, and the value of the signal amplitude is calculated by solving a system of two linear equations in which the amplitudes of the speech signal and acoustic interference are unknown; in the pauses between transmissions of speech messages, interference samples are taken in each channel, the average values of the interference amplitudes are calculated and the coefficient of change in the amplitude of the interference in the second channel relative to the first channel is calculated; after the appearance of the speech signal, the process of isolating speech from the acoustic interference is carried out using the specified value of the coefficient of change in the amplitude of the interference in the second channel relative to the first channel; when the quality of the received voice information decreases, the subscriber transmits a corresponding message to the subscriber transmitting voice information, in this case, the subscriber transmitting voice information stops transmission for a short time interval, in this interval the coefficient of change in the amplitude of the interference in the second channel relative to the first channel is calculated, and then resumes exchange of speech messages and the process of extracting speech from acoustic interference, while using a refined value of the coefficient of change in the amplitude of the interference in the second channel relative to the first channel.

Предлагаемый способ заключается в следующем.The proposed method is as follows.

На всем интервале анализа, состоящего из интервала, который не содержит речевой сигнал, и интервала, который содержит смесь речевого сигнала и акустической помехи (шума) (далее по тексту - сигнал), обработку осуществляют в двух каналах, основном и дополнительном.Over the entire analysis interval, consisting of an interval that does not contain a speech signal and an interval that contains a mixture of a speech signal and acoustic interference (noise) (hereinafter referred to as the signal), processing is carried out in two channels, the main and the additional.

Предварительно в каждом канале в условиях отсутствия акустических помех берут отсчеты речевого сигнала, рассчитывают средние значения амплитуд сигнала в каналах и значение коэффициента изменения амплитуды речевого сигнала во втором канале относительно первого канала.First, in each channel, in the absence of acoustic interference, samples of the speech signal are taken, the average values of the signal amplitudes in the channels and the value of the coefficient of change in the amplitude of the speech signal in the second channel relative to the first channel are calculated.

Значение коэффициента изменения амплитуды речевого сигнала во втором канале относительно первого канала рассчитывают по формулеThe value of the coefficient of change in the amplitude of the speech signal in the second channel relative to the first channel is calculated using the formula

где: Uс1i, Uс2i - i-ое значение амплитуды речевого сигнала, измеренное в основном и дополнительном каналах соответственно;where: U с1i , U с2i - i-th value of the amplitude of the speech signal, measured in the main and additional channels, respectively;

N - число отсчетов.N - number of samples.

В интервале, который не содержит речевой сигнал, берут отсчеты помехи в каждом канале, рассчитывают средние значения амплитуд помехи и рассчитывают коэффициент изменения амплитуды помехи во втором канале относительно первого канала.In the interval that does not contain a speech signal, interference samples are taken in each channel, the average values of the interference amplitudes are calculated, and the coefficient of change in the interference amplitude in the second channel relative to the first channel is calculated.

Значение коэффициента изменения амплитуды помехи во втором канале относительно первого канала рассчитывают по формулеThe value of the coefficient of change in the interference amplitude in the second channel relative to the first channel is calculated using the formula

где: Uп1i, Uп2i - i-ое значение амплитуды помехи, измеренное в основном и дополнительном каналах соответственно;where: U p1i , U p2i - i-th value of the interference amplitude, measured in the main and additional channels, respectively;

N - число отсчетов.N - number of samples.

После появления речевого сигнала измеряют амплитуды смеси помехи и сигнала и рассчитывают значение амплитуды сигнала.After the speech signal appears, the amplitudes of the mixture of interference and signal are measured and the signal amplitude value is calculated.

Определение факта появления речевого сигнала может осуществляться, например, за счет использования способа разделения речи и пауз по значениям дисперсий амплитуд спектральных составляющих, описание которого приведено в патенте RU 2723301 H04B 1/10.Determination of the appearance of a speech signal can be carried out, for example, by using the method of separating speech and pauses according to the values of the dispersions of the amplitudes of the spectral components, the description of which is given in patent RU 2723301 H04B 1/10.

Способ заключается в следующем.The method is as follows.

На всем интервале анализа, состоящего из интервала, который содержит помеху или речевой сигнал, или смесь речевого сигнала и помехи, которые поступают в устройство - входной сигнал, сигнал разветвляют на две одинаковые составляющие. Одну из них фильтруют фильтром нижних частот (ФНЧ), вторую составляющую фильтруют полосовым фильтром. Сигналы, поступившие на выходы фильтров дискретизируют и заносят в память для последующей обработки. Формируют «скользящее окно», состоящее из интервалов одинаковой длительности. «Скользящее окно» сдвигают на некоторое, заранее определенное количество отсчетов. «Скользящее окно» формируют так, что оно включает в себя два интервала анализа, каждый из которых состоит из нескольких интервалов одинаковой длительности. Первое положение «скользящего окна» устанавливают так, что в первом интервале анализа присутствует только помеха. Осуществляют спектральный анализ входного сигнала для каждого интервала следующим образом. Каждый результат преобразования входного сигнала, который образуется после умножения входного сигнала на синус и косинус опорных частот, разветвляют на две одинаковые составляющие. Первую составляющую фильтруют ФНЧ, полоса которого согласована с полосой анализируемого сигнала. Одновременно вторую составляющую фильтруют полосовым фильтром, полоса пропускания которого выбирается так, что верхняя частота полосового фильтра соответствует верхней частоте анализируемого сигнала, нижнюю частоту полосового фильтра устанавливают равной некоторому заранее заданному значению. Выбор ФНЧ и полосового фильтра осуществляют с идентичными в максимальной степени фазо-частотными характеристиками и так, что амплитудно-частотная характеристика (АЧХ) полосового фильтра в области частот, близких к нулю, имеет максимально возможную крутизну; в области частот, начиная со значения, для которого разность значений АЧХ ФНЧ и полосового фильтра становится меньше некоторой заранее заданной величины, обеспечивают идентичность их АЧХ в максимальной степени. Сигналы, прошедшие ФНЧ и полосовой фильтр, вычитают один из другого. Результаты вычитания преобразуют в цифровой вид. По данным значениям, соответствующим синусной и косинусной составляющей одной частоты, определяют мгновенную спектральную плотность (МСП) для каждой опорной частоты и запоминают эти значения пропорциональные амплитуде сигналов. Находят среднее значение МСП. Определяют значение порога путем умножения найденного среднего значения МСП на коэффициент, значение которого устанавливают заранее. Полученные значения МСП сравнивают с порогом. По результатам сравнения принимают решение о наличии или об отсутствии сигнала с соответствующей частотой. Находят значения мощности каждого выделенного сигнала путем возведения в квадрат соответствующих значений МСП. Находят для каждой гармоники дисперсию значений мощностей для первого и второго интервалов анализа. Рассчитывают среднее значение дисперсий мощностей первого и второго интервалов. Усреднение осуществляют по числу гармоник. Определяют пороговое значение путем умножения среднего значения дисперсии значений мощностей первого интервала анализа, принадлежащего «скользящему окну», на коэффициент, значение которого определяют заранее. Находят значение разности средних значений дисперсий мощностей, рассчитанных для первого и второго интервалов анализа. Данное значение разности сравнивают с порогом. Считают, что во втором интервале анализа присутствует только помеха, если значение разности средних значений дисперсий мощностей не превышает порог. В противном случае считают, что во втором интервале анализа присутствует сигнал или смесь сигнала и помехи. Сдвигают «скользящее окно» на заданное значение интервалов. Описанную процедуру повторяют. Для последующих шагов пороговое значение для разности средних значений дисперсии значений мощностей интервалов анализа определяют с использованием среднего значения средних значений дисперсии мощностей интервалов анализа, которое рассчитывают, применяя принцип «первый пришел, первый ушел». Процесс продолжают до тех пор, пока не закончится время, отведенное для анализа входного сигнала.Over the entire analysis interval, consisting of an interval that contains interference or a speech signal, or a mixture of a speech signal and interference that enters the device - the input signal, the signal is branched into two identical components. One of them is filtered with a low-pass filter (LPF), the second component is filtered with a band-pass filter. The signals received at the filter outputs are sampled and stored in memory for subsequent processing. A “sliding window” is formed, consisting of intervals of the same duration. The “sliding window” is shifted by a certain predetermined number of samples. The “sliding window” is formed so that it includes two analysis intervals, each of which consists of several intervals of the same duration. The first position of the "sliding window" is set such that only noise is present in the first analysis interval. Spectral analysis of the input signal is carried out for each interval as follows. Each result of converting the input signal, which is formed after multiplying the input signal by the sine and cosine of the reference frequencies, is branched into two identical components. The first component is filtered by a low-pass filter, the band of which is consistent with the band of the analyzed signal. At the same time, the second component is filtered by a bandpass filter, the passband of which is selected so that the upper frequency of the bandpass filter corresponds to the upper frequency of the analyzed signal, the lower frequency of the bandpass filter is set equal to some predetermined value. The choice of a low-pass filter and a band-pass filter is carried out with phase-frequency characteristics that are identical to the maximum extent and so that the amplitude-frequency response (AFC) of the band-pass filter in the frequency range close to zero has the maximum possible slope; in the frequency range, starting from the value for which the difference in the frequency response values of the low-pass filter and the bandpass filter becomes less than a certain predetermined value, their frequency responses are ensured to the maximum extent. The signals that pass through the low-pass filter and the band-pass filter subtract one from the other. The subtraction results are converted into digital form. Using these values corresponding to the sine and cosine components of one frequency, the instantaneous spectral density (ISD) is determined for each reference frequency and these values proportional to the amplitude of the signals are stored. Find the average value of MSP. The threshold value is determined by multiplying the found average MSP value by a coefficient, the value of which is set in advance. The obtained MSP values are compared with the threshold. Based on the comparison results, a decision is made about the presence or absence of a signal with the corresponding frequency. The power values of each selected signal are found by squaring the corresponding MRP values. Find for each harmonic the dispersion of power values for the first and second analysis intervals. The average value of the power dispersions of the first and second intervals is calculated. Averaging is carried out over the number of harmonics. The threshold value is determined by multiplying the average value of the dispersion of the power values of the first analysis interval belonging to the “sliding window” by a coefficient whose value is determined in advance. Find the difference between the average values of the power dispersions calculated for the first and second analysis intervals. This difference value is compared with a threshold. It is considered that only noise is present in the second analysis interval if the difference in the average values of the power dispersions does not exceed the threshold. Otherwise, the second analysis interval is considered to contain a signal or a mixture of signal and noise. Shift the “sliding window” by the specified interval value. The described procedure is repeated. For subsequent steps, the threshold value for the difference in the mean variance of the analysis interval powers is determined using the average of the mean variances of the analysis interval powers, which is calculated using the first-in, first-out principle. The process continues until the time allotted for analyzing the input signal has expired.

Амплитуда смеси сигнала и помехи в основном канале может быть записана в видеThe amplitude of the mixture of signal and noise in the main channel can be written as

где: Uс1, Uп1 - значения амплитуд речевого сигнала и помехи в основном канале соответственно.where: U c1 , U p1 are the amplitude values of the speech signal and interference in the main channel, respectively.

Амплитуда смеси сигнала и помехи в дополнительном канале может быть записана в видеThe amplitude of the mixture of signal and noise in the additional channel can be written as

где: Uс2, Uп2 - значения амплитуд речевого сигнала и помехи в дополнительном канале соответственно.where: U c2 , U p2 are the amplitude values of the speech signal and interference in the additional channel, respectively.

С учетом формул (1), (2) выражение для амплитуды смеси сигнала и помехи в дополнительном канале может быть записано следующим образомTaking into account formulas (1), (2), the expression for the amplitude of the mixture of signal and interference in the additional channel can be written as follows

Выражения (3) и (5) являются системой двух линейных уравнений, где неизвестными являются Uс1 и Uп1, то естьExpressions (3) and (5) are a system of two linear equations, where the unknowns are U c1 and U p1 , that is

Решив систему линейных уравнений (6) относительно Uс1 получимHaving solved the system of linear equations (6) for U с1 we obtain

Рассчитывая значения амплитуд речевого сигнала по формуле (7) получают огибающую речевого сигнала в цифровой форме.By calculating the amplitude values of the speech signal using formula (7), the envelope of the speech signal is obtained in digital form.

Темп взятия отсчетов определяют исходя из необходимой точности воспроизведения огибающей речевого сигнала. Значение частоты взятия отсчетов может быть установлено путем математического моделирования или экспериментальным путем.The sampling rate is determined based on the required accuracy of reproduction of the speech signal envelope. The value of the sampling frequency can be established by mathematical modeling or experimentally.

В паузах между передачами речевых сообщений берут отсчеты помехи в каждом канале. Рассчитывают средние значения амплитуд помехи и рассчитывают коэффициент изменения амплитуды помехи во втором канале относительно первого канала по формуле (2).During pauses between transmissions of voice messages, interference samples are taken in each channel. The average values of the interference amplitudes are calculated and the coefficient of change in the interference amplitude in the second channel relative to the first channel is calculated using formula (2).

После появления речевого сигнала процесс выделения речи из акустической помехи осуществляют с использованием уточненного значения коэффициента изменения амплитуды помехи в дополнительном канале относительно основного канала.After the appearance of the speech signal, the process of isolating speech from acoustic interference is carried out using the specified value of the coefficient of change in the amplitude of the interference in the additional channel relative to the main channel.

При снижении качества принимаемой речевой информации абонент передает соответствующее сообщение абоненту, передающему речевую информацию.When the quality of the received voice information decreases, the subscriber sends a corresponding message to the subscriber transmitting the voice information.

В этом случае абонент, передающий речевую информацию, прекращает на небольшой временной интервал передачу. В этом интервале рассчитывают коэффициент изменения амплитуды помехи во втором канале относительно первого канала. После чего возобновляют обмен речевыми сообщениями и процесс выделения речи из акустической помехи. При этом используют уточненное значение коэффициента изменения амплитуды помехи в дополнительном канале относительно основного канала.In this case, the subscriber transmitting voice information stops transmission for a short time interval. In this interval, the coefficient of change in the interference amplitude in the second channel relative to the first channel is calculated. After which the exchange of voice messages and the process of isolating speech from acoustic interference are resumed. In this case, a refined value of the coefficient of change in the amplitude of the interference in the additional channel relative to the main channel is used.

Технический результат - обеспечение выделения речевого сигнала из акустических помех.The technical result is to ensure the separation of a speech signal from acoustic interference.

Структурная схема устройства, реализующего предлагаемый способ, приведена на фиг. 2, где обозначено:A block diagram of a device that implements the proposed method is shown in Fig. 2, where it is indicated:

1.1, 1.2 - первое и второе электроакустическое устройство (ЭАУ);1.1, 1.2 - first and second electroacoustic device (EAD);

2.1, 2.2 - первый и второй полосовой фильтр (ПФ);2.1, 2.2 - first and second bandpass filter (PF);

3.1, 3.2 - первый и второй усилитель низкой частоты (УНЧ);3.1, 3.2 - first and second low frequency amplifier (ULF);

4.1, 4.2 - первый и второй аналого-цифровые преобразователи (АЦП);4.1, 4.2 - first and second analog-to-digital converters (ADC);

5 - вычислительное устройство (ВУ).5 - computing device (CD).

Устройство состоит из основного (первого) и дополнительного (второго) каналов. Основной канал содержит последовательно соединенные первый ЭАУ 1.1, первый ПФ 2.1, первый УНЧ 3.1, первый АЦП 4.1 и ВУ 5, выход которого является выходом устройства, вход первого ЭАУ 1.1 является первым входом устройства. Дополнительный канал содержит последовательно соединенные второй ЭАУ 1.2, второй ПФ 2.2, второй УНЧ 3.2 и второй АЦП 4.2, выход которого соединен со вторым входом ВУ 5, вход второго ЭАУ 1.2 является вторым входом устройства.The device consists of a main (first) and additional (second) channel. The main channel contains the first EAU 1.1, the first PF 2.1, the first ULF 3.1, the first ADC 4.1 and the VU 5 connected in series, the output of which is the output of the device, the input of the first EAU 1.1 is the first input of the device. The additional channel contains a second EAU 1.2, a second PF 2.2, a second ULF 3.2 and a second ADC 4.2 connected in series, the output of which is connected to the second input of the VU 5, the input of the second EAU 1.2 is the second input of the device.

Устройство работает следующим образом.The device works as follows.

В основном канале сигнал, который поступает с выхода первого ЭАУ 1.1, фильтруют первым ПФ 2.1, полоса которого согласована с полосой речевого сигнала. Затем профильтрованный сигнал усиливают в первом УНЧ 3.1 и преобразуют в цифровой вид в первом АЦП 4.1. Отсчеты с выхода первого АЦП 4.1 подают на первый вход ВУ 5.In the main channel, the signal that comes from the output of the first EAU 1.1 is filtered by the first PF 2.1, the band of which is consistent with the band of the speech signal. Then the filtered signal is amplified in the first ULF 3.1 and converted to digital form in the first ADC 4.1. Readings from the output of the first ADC 4.1 are fed to the first input of the VU 5.

В дополнительном канале сигнал обрабатывают так же как в основном канале. При этом отсчеты с выхода второго АЦП 4.2 подают на второй вход ВУ 5.In the additional channel, the signal is processed in the same way as in the main channel. In this case, samples from the output of the second ADC 4.2 are fed to the second input of the VU 5.

В ВУ 5 поступившие отсчеты помехи или смеси сигнала и помехи обрабатывают по алгоритму, приведенному выше.In VU 5, received samples of interference or a mixture of signal and interference are processed according to the algorithm given above.

В качестве первого 1.1 и второго 1.2 ЭАУ могут использоваться, например, микрофоны или ларингофоны.For example, microphones or laryngophones can be used as the first 1.1 and second 1.2 EAU.

Первый 3.1 и второй 3.2 УНЧ могут быть реализованы, например, на микросхеме OP467GS фирмы Analog Devices.The first 3.1 and second 3.2 ULF can be implemented, for example, on the OP467GS chip from Analog Devices.

Первый 4.1 и второй 4.2 АЦП могут быть реализованы, например, на микросхеме ADS8422 фирмы Texas Instruments.The first 4.1 and second 4.2 ADCs can be implemented, for example, on the ADS8422 chip from Texas Instruments.

Вычислительное устройство 5 может быть выполнено в виде программируемой логической интегральной схемы (ПЛИС), и реализовано, например, на микросхеме XC2V3000-6FG676I фирмы Xilinx.The computing device 5 can be made in the form of a programmable logic integrated circuit (FPGA), and is implemented, for example, on a XC2V3000-6FG676I chip from Xilinx.

Таким образом, за счет использования описанного устройства, может быть реализован предлагаемый способ выделения речи путем анализа значений амплитуд помехи и сигнала в двухканальной системе обработки речевого сигнала.Thus, through the use of the described device, the proposed method for speech extraction can be implemented by analyzing the values of the amplitudes of interference and signal in a two-channel speech signal processing system.

Claims (1)

Способ выделения речи путем анализа значений амплитуд помехи и сигнала в двухканальной системе обработки речевого сигнала, заключающийся в том, что на всем интервале анализа, состоящего из интервала, который не содержит речевой сигнал, и интервала, который содержит смесь сигнала и помехи, сигнал, поступающий в систему, дискретизируют, отличающийся тем , что обработку акустической помехи или смеси помехи и речевого сигнала осуществляют в двух каналах: первом - основном и втором - дополнительном; предварительно в обоих каналах в условиях отсутствия помехи берут отсчеты речевого сигнала, рассчитывают средние значения амплитуд сигнала и значение коэффициента изменения амплитуды речевого сигнала во втором канале относительно первого канала; в интервале, который не содержит речевой сигнал, берут отсчеты помехи в каждом канале, рассчитывают средние значения амплитуд помехи и рассчитывают коэффициент изменения амплитуды помехи во втором канале относительно первого канала; после появления речевого сигнала измеряют амплитуды смеси помехи и сигнала в каждом канале, и рассчитывают значение амплитуды сигнала с использованием значений амплитуд смеси помехи и сигнала в каждом канале, а также значения коэффициента изменения амплитуды речевого сигнала во втором канале относительно первого канала и значения коэффициента изменения амплитуды помехи во втором канале относительно первого канала, в паузах между передачами речевых сообщений берут отсчеты помехи в каждом канале, рассчитывают средние значения амплитуд помехи и рассчитывают коэффициент изменения амплитуды помехи во втором канале относительно первого канала, после появления речевого сигнала процесс выделения речи из акустической помехи осуществляют с использованием уточненного значения коэффициента изменения амплитуды помехи во втором канале относительно первого канала; при снижении качества принимаемой речевой информации абонент передает соответствующее сообщение абоненту, передающему речевую информацию, в этом случае абонент, передающий речевую информацию, прекращает на небольшой временной интервал передачу, в этом интервале рассчитывают коэффициент изменения амплитуды помехи во втором канале относительно первого канала, после чего возобновляют обмен речевыми сообщениями и процесс выделения речи из акустической помехи, при этом используют уточненное значение коэффициента изменения амплитуды помехи во втором канале относительно первого канала.A method for isolating speech by analyzing the amplitude values of interference and signal in a two-channel speech signal processing system, which consists in the fact that over the entire analysis interval, consisting of an interval that does not contain a speech signal and an interval that contains a mixture of signal and interference, the incoming signal into the system, sampled, characterized in that the processing of acoustic interference or a mixture of interference and speech signal is carried out in two channels: the first - main and the second - additional; preliminary, in both channels, in the absence of interference, samples of the speech signal are taken, the average values of the signal amplitudes and the value of the coefficient of change in the amplitude of the speech signal in the second channel relative to the first channel are calculated; in the interval that does not contain a speech signal, interference samples are taken in each channel, the average values of the interference amplitudes are calculated, and the coefficient of change in the interference amplitude in the second channel relative to the first channel is calculated; after the appearance of the speech signal, the amplitudes of the mixture of interference and signal in each channel are measured, and the value of the signal amplitude is calculated using the values of the amplitudes of the mixture of interference and signal in each channel, as well as the value of the coefficient of change in the amplitude of the speech signal in the second channel relative to the first channel and the value of the coefficient of change of amplitude interference in the second channel relative to the first channel, in pauses between transmissions of speech messages, interference samples are taken in each channel, the average values of the interference amplitudes are calculated and the coefficient of change in the interference amplitude in the second channel relative to the first channel is calculated, after the appearance of the speech signal, the process of isolating speech from the acoustic interference is carried out using an updated value of the coefficient of change in the amplitude of the interference in the second channel relative to the first channel; when the quality of the received voice information decreases, the subscriber transmits a corresponding message to the subscriber transmitting voice information, in this case, the subscriber transmitting voice information stops transmission for a short time interval, in this interval the coefficient of change in the amplitude of the interference in the second channel relative to the first channel is calculated, and then resumes exchange of speech messages and the process of isolating speech from acoustic interference, while using a refined value of the coefficient of change in the amplitude of the interference in the second channel relative to the first channel.
RU2022129413A 2022-11-14 Method for speech extraction by analysing amplitude values of interference and signal in two-channel speech signal processing system RU2807194C1 (en)

Publications (1)

Publication Number Publication Date
RU2807194C1 true RU2807194C1 (en) 2023-11-10

Family

ID=

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2171549C1 (en) * 2000-01-26 2001-07-27 Войсковая часть 35533 Device for discriminating acoustic signals in communication channels
RU2214051C2 (en) * 2001-01-22 2003-10-10 Войсковая часть 35533 Device for separating voice-frequency signals in communication channels
US7529660B2 (en) * 2002-05-31 2009-05-05 Voiceage Corporation Method and device for frequency-selective pitch enhancement of synthesized speech
US9064498B2 (en) * 2008-08-05 2015-06-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an audio signal for speech enhancement using a feature extraction
RU2668407C1 (en) * 2017-11-07 2018-09-28 Акционерное общество "Концерн "Созвездие" Method of separation of speech and pause by comparative analysis of interference power values and signal-interference mixture
RU2723301C1 (en) * 2019-11-20 2020-06-09 Акционерное общество "Концерн "Созвездие" Method of dividing speech and pauses by values of dispersions of amplitudes of spectral components

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2171549C1 (en) * 2000-01-26 2001-07-27 Войсковая часть 35533 Device for discriminating acoustic signals in communication channels
RU2214051C2 (en) * 2001-01-22 2003-10-10 Войсковая часть 35533 Device for separating voice-frequency signals in communication channels
US7529660B2 (en) * 2002-05-31 2009-05-05 Voiceage Corporation Method and device for frequency-selective pitch enhancement of synthesized speech
US9064498B2 (en) * 2008-08-05 2015-06-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an audio signal for speech enhancement using a feature extraction
RU2668407C1 (en) * 2017-11-07 2018-09-28 Акционерное общество "Концерн "Созвездие" Method of separation of speech and pause by comparative analysis of interference power values and signal-interference mixture
RU2723301C1 (en) * 2019-11-20 2020-06-09 Акционерное общество "Концерн "Созвездие" Method of dividing speech and pauses by values of dispersions of amplitudes of spectral components

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Л.Р. Рабинер, Р.В. Шафер, "Цифровая обработка речевых сигналов", Москва, "Радио и связь", 1981, с. 123 - 126. *

Similar Documents

Publication Publication Date Title
US8892430B2 (en) Noise detecting device and noise detecting method
RU2691603C1 (en) Method of separating speech and pauses by analyzing values of interference correlation function and signal and interference mixture
US6768441B2 (en) Methods of receiving communications signals including a plurality of digital filters having different bandwidths and related receivers
RU2807194C1 (en) Method for speech extraction by analysing amplitude values of interference and signal in two-channel speech signal processing system
EP0548438A1 (en) A method for detecting dual tone multi-frequency signals and device for implementing said method
CN108605191B (en) Abnormal sound detection method and device
CN105261363A (en) Voice recognition method, device and terminal
RU2700189C1 (en) Method of separating speech and speech-like noise by analyzing values of energy and phases of frequency components of signal and noise
CN105116220A (en) Signal analyzing device used for synchronously separating signals and noise and analyzing method thereof
RU2668407C1 (en) Method of separation of speech and pause by comparative analysis of interference power values and signal-interference mixture
CN111510173B (en) Multichannel radio station received signal separation method and device and analog radio station host
CN104167212A (en) Audio processing method and device of intelligent building system
CN110190920B (en) Reference signal extraction method and system based on minimum mean square error cancellation algorithm
CN111292748B (en) Voice input system adaptable to multiple frequencies
CN110310661B (en) Method for calculating two-path real-time broadcast audio time delay and similarity
KR20120039918A (en) System and method for suppressing noise in voice telecommunication
CN110910899B (en) Real-time audio signal consistency comparison detection method
RU2680735C1 (en) Method of separation of speech and pauses by analysis of the values of phases of frequency components of noise and signal
WO2020171735A1 (en) Method of energy signal detection
CN109788399A (en) A kind of echo cancel method and system of speaker
CN117061039B (en) Broadcast signal monitoring device, method, system, equipment and medium
CN1545257A (en) System and method for frequency range segregation and signal synthesis in broadband signal measurement
Denis et al. Audio Signal Transmission Over Low-Speed Communication Channels for Emergency Broadcast
RU2723301C1 (en) Method of dividing speech and pauses by values of dispersions of amplitudes of spectral components
CN101695004B (en) Separation system of radio signals