WO2017134798A1 - 音声通話装置 - Google Patents

音声通話装置 Download PDF

Info

Publication number
WO2017134798A1
WO2017134798A1 PCT/JP2016/053375 JP2016053375W WO2017134798A1 WO 2017134798 A1 WO2017134798 A1 WO 2017134798A1 JP 2016053375 W JP2016053375 W JP 2016053375W WO 2017134798 A1 WO2017134798 A1 WO 2017134798A1
Authority
WO
WIPO (PCT)
Prior art keywords
learning
elevator
signal
parameter
communication device
Prior art date
Application number
PCT/JP2016/053375
Other languages
English (en)
French (fr)
Inventor
茂明 鈴木
訓 古田
智治 粟野
Original Assignee
三菱電機株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三菱電機株式会社 filed Critical 三菱電機株式会社
Priority to JP2016544644A priority Critical patent/JP6011751B1/ja
Priority to PCT/JP2016/053375 priority patent/WO2017134798A1/ja
Priority to CN201680079879.0A priority patent/CN108495803B/zh
Publication of WO2017134798A1 publication Critical patent/WO2017134798A1/ja

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B66HOISTING; LIFTING; HAULING
    • B66BELEVATORS; ESCALATORS OR MOVING WALKWAYS
    • B66B3/00Applications of devices for indicating or signalling operating conditions of elevators
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B66HOISTING; LIFTING; HAULING
    • B66BELEVATORS; ESCALATORS OR MOVING WALKWAYS
    • B66B5/00Applications of checking, fault-correcting, or safety devices in elevators
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback

Definitions

  • the present invention relates to a voice call device used when making a voice call.
  • An echo canceller for preventing howling and echo is used in a voice call device capable of hands-free calling such as a speakerphone phone.
  • the conditions for echo generation depend on the environment in which the voice communication device is set. Generally, a room surrounded by a narrow and hard wall has a large reverberation, so a large echo is generated. Sometimes small.
  • the echo canceller includes an adaptive filter that sequentially learns the characteristics (e.g., impulse response) of the echo path, and the adaptive filter sequentially learns the characteristics of the echo path that varies depending on the environment and cancels the echo.
  • this sequential learning becomes difficult or takes a long time to learn when the installation environment is greatly different, etc. Therefore, a technique is disclosed in which initial learning is performed and a pre-learned parameter is given before a call. (For example, Patent Document 1).
  • a voice communication device used for an emergency call of an elevator is a device that performs a hands-free call using a microphone and a speaker of an interphone installed in the elevator, and an echo canceller is required. Since the echo environment varies greatly depending on the variation in the microphone and speaker characteristics and the size of the elevator, the introduction of the initial learning shown in the prior art is effective. However, since an elevator passenger who encounters a situation such as confinement in an elevator is used for a voice call device for an emergency call of an elevator, the user may specify the start of initial learning in a confined situation. There are difficulties. Therefore, if the conventional technique is used as it is, there is a problem that it cannot be said that it is suitable as the timing of the initial learning.
  • the present invention has been made to solve the above problems, and an object of the present invention is to provide a voice communication device that can automatically perform initial learning in an appropriate time zone without giving a sense of incongruity to a user.
  • a voice call device is a voice call device for an elevator, a parameter holding unit for holding a parameter depending on a signal echo path, and a signal for processing a voice signal at the time of a voice call using the parameter A processing unit, a learning opportunity determination unit that determines whether or not the parameter can be learned prior to the voice call according to an environment in an elevator in which the device is installed, and the learning opportunity determination unit And a learning signal generator for generating a learning signal for learning the parameter when it is determined that learning is possible.
  • FIG. 1 is a configuration diagram of an elevator emergency call system in which a voice communication device according to Embodiment 1 is used.
  • the internal structure of the voice call device 4 according to the first embodiment. 2 is a diagram showing a hardware configuration of a voice call device 4 according to Embodiment 1.
  • FIG. 4 is a flowchart showing the operation of the voice call device 4 according to the first embodiment. 6 is a flow for determining an initial learning time of the learning opportunity determination unit 41 according to the first embodiment.
  • FIG. 3 is a diagram showing an internal configuration of a signal processing unit 45 according to the first embodiment.
  • FIG. 10 is a flowchart showing the operation of the voice call device 4 according to the fifth embodiment.
  • FIG. 10 is an internal configuration diagram of a signal processing unit 45 according to a sixth embodiment.
  • FIG. 10 is an internal configuration diagram of a signal processing unit 45 according to a sixth embodiment.
  • FIG. 1 is a block diagram of an elevator emergency call system in which a voice communication device according to the present invention is used.
  • 1 is an elevator
  • 2 is an intercom installed in the elevator
  • 3 is an elevator operation control unit that controls the operation of the elevator
  • 4 is a voice communication device
  • 5 is a communication network
  • 6 is a destination of the elevator 1.
  • the monitoring center 7 is a telephone terminal in the monitoring center 6.
  • This system is used, for example, when a call is made by calling an operator of the monitoring center 6 when the elevator 1 fails and a passenger is confined in the elevator 1.
  • the interphone 2 is used for voice input / output of a person confined in the elevator 1, and the voice communication device 4 performs interconversion between the analog voice of the interphone 2 and the digital voice transmitted on the communication network 5, in the elevator 1. Suppresses echoes generated in.
  • the communication network 5 transmits voice data between the voice communication device 4 and the monitoring center 6.
  • the telephone terminal 7 is used for a telephone call by an operator in the monitoring center 6.
  • the elevator operation control unit 3 is installed in the elevator 1 and controls the operation of the elevator 1, that is, controls the raising / lowering and opening / closing of the door, and is not directly related to the voice call, but in this embodiment, the voice call device 4 provides information for determining the time of initial learning.
  • FIG. 2 shows the internal configuration of the voice communication device 4 together with the interphone 2 and the elevator operation control unit 3 connected to the device.
  • 41 is a learning trigger determination unit that determines the trigger of initial learning
  • 42 is a call control unit that controls the start / end of a call
  • 43 is a learning signal generation unit that generates a learning signal
  • 44 is from a communication line.
  • 45 is a signal processing unit having an echo canceller function for suppressing an echo that is a signal obtained by sneaking the sound output from the speaker 21 of the interphone 2 into the microphone of the interphone 2.
  • 46 is a D / A converter that converts a digital signal into an analog signal
  • 47 is an A / D (Analog / Digital) converter that converts an analog signal into a digital signal
  • 48 holds parameters obtained by initial learning.
  • Parameter holding unit 49 is a communication line interface for transmitting / receiving data to / from the communication line
  • 21 is an internal phone 2 internal switch.
  • 22 intercom 2 internal microphones (hereinafter, referred to as microphone), 23 is very call button to be used in very call initiation by intercom 2.
  • FIG. 3 is a diagram showing a hardware configuration of the voice call device 4 according to Embodiment 1 of the present invention.
  • the learning opportunity determination unit 41, the call control unit 42, the learning signal generation unit 43, the switch 44, the signal processing unit 45, and the parameter holding unit 48 are realized by a processor 401 that executes a program stored in the memory 402. This is merely an example, and a hardware configuration using a dedicated processing circuit other than this may be used.
  • the D / A converter 46 and the A / D converter 47 are realized by an A / D, D / A conversion LSI (Large Scale Integration) 403.
  • the processor 401 may be a system LSI integrated with an A / D or D / A conversion LSI 403 or the like.
  • the switch open / close detection LSI 404 electrically converts the button pressing state of the emergency call button 23 so that it can be referred to from a specific port of the processor 401.
  • This is an example, and for example, a system LSI in which the processor 401 is integrated with the switch open / close detection LSI 404 may be used.
  • the elevator operation control unit 3 outputs various information output to the learning opportunity determination unit 41 on a network frame, and the network interface A405 receives the information.
  • the network interface B 406 transmits / receives the input / output data on the communication line side carried in the network frame. That is, the network interface B 406 corresponds to the communication line interface 49 in FIG. This is only an example, and for example, one network interface may receive information from the elevator operation control unit 3 and transmit / receive input / output data on the communication line side.
  • the processing realized by the processor 401 may be realized by a plurality of processors.
  • signal processing such as the signal processing unit 45 and the learning signal generation unit 43 is performed by a digital signal processing processor. 407 is realized.
  • FIG. 5 is a flowchart showing the operation of the voice call device 4.
  • the operation of the voice call device 4 will be described with reference to FIG.
  • the call control unit 42 monitors whether or not the emergency call button 23 has been pressed (ST1), and when a passenger confined in the elevator 1 presses the emergency call button 23, the call control unit 42 is triggered by this. Control signals are transmitted to and received from the monitoring center 6 via the communication line interface 49, and the monitoring center 6 is called to establish communication (ST2).
  • This communication establishment is performed by, for example, SIP (Session Initiation Protocol) defined by RFC (Request for Comments) 3261 of IETF (Internet Engineering Task Force).
  • the call control unit 42 outputs to the learning opportunity determination unit 41 and the signal processing unit 45 whether the communication state, that is, the center call, the call, or any idle state.
  • the signal processing unit 45 inputs the parameters stored in the parameter holding unit 48 (ST3), and a call is started.
  • the switch 44 selects an input signal from the communication line interface 49 and outputs it to the signal processing unit 45, so that the input signal from the communication line interface 49 passes through the signal processing unit 45 to the D / A converter 46. (ST4). Then, it is converted into an analog signal by the D / A converter 46 and output from the speaker 21 in the intercom 2.
  • the voice of the person in the elevator 1 from the microphone 22 in the interphone 2 is converted into a digital signal by the A / D converter 47, and then the echo is eliminated by the signal processing unit 45, via the communication line interface 49. It is output to the communication line (ST5). This operation is continued until the call is finished (ST6).
  • the switch 44 selects as described above when the determination result of whether or not the initial learning performed by the learning opportunity determination unit 41 is possible is not possible.
  • the operation for determining whether or not the initial learning performed by the learning opportunity determination unit 41 is possible will be described later.
  • the learning trigger determination unit 41 determines that initial learning is possible in an environment in which the call control unit 42 determines that the emergency call button 23 has not been pressed (ST1)
  • the learning opportunity determination unit 41 determines that the initial learning is possible (initial learning time) (ST7)
  • the learning process is started.
  • the learning signal generator 43 outputs white noise as a signal for initial parameter learning (ST8). Since the switch 44 selects the input from the learning signal generation unit 43 instead of the communication line interface 49 and outputs it to the signal processing unit 45, the output signal of the learning signal generation unit 43 passes through the signal processing unit 45 to D / The data is output to the A converter 46 (ST9).
  • parameter initial learning signal may be a signal other than white noise as long as the signal processing unit 45 can cancel the echo.
  • the learning opportunity determination unit 41 outputs a determination result as to whether or not initial learning is possible to the switch 44, the signal processing unit 45, and the learning signal generation unit 43.
  • the determination shown in ST7 in the flow of FIG. 5, that is, the operation for determining whether or not the learning opportunity determination unit 41 can perform initial learning will be described.
  • the elevator operation control unit 3 controls the raising / lowering of the elevator 1 and the opening / closing control of the door. Therefore, the elevator operation / stop information indicating whether the elevator 1 is stopped or operating (ascending or descending), It has door opening / closing information indicating whether it is open or closed, and button pressing information indicating whether a destination button or door opening / closing button in the elevator 1 has been pressed, and these information is output to the learning opportunity determination unit 41.
  • the initial learning of the signal processing unit 45 is desirably performed in a state where the elevator 1 is stopped and the door is closed, there is no passenger in the elevator 1 and noise is low.
  • the learning opportunity determination unit 41 receives each information from the elevator operation control unit 3, information from the call control unit 42, and an output signal of the A / D converter 47. Use.
  • the power is turned on at the time of installation of the communication device, but since it is in a state before operation, there is a possibility that it is in a state different from the echo environment at the time of the call, for example, the elevator door is open. There is.
  • this embodiment when initial learning is performed in a state where the door is closed, there are no passengers in the elevator 1 and noise is low, the environment is close to the echo environment at the time of a call. Initial learning can be performed.
  • FIG. 6 is an example of a determination flow for determining whether or not initial learning is possible in the learning opportunity determination unit 41.
  • the process starts from a determination state that the initial learning time is not reached (ST13).
  • the elevator 1 is stopped by the elevator operation / stop information from the elevator operation control unit 3 (ST14), the door is closed by the door opening / closing information from the elevator operation control unit 3 (ST15), and More than a predetermined time has passed since the button in the elevator 1 was last pressed from the button pressing information from the elevator operation control unit 3 (ST16), and the information for the call is determined by the information from the call control unit 42.
  • condition (ST16) that a predetermined time or more has passed since the button in the elevator 1 was last pressed from the button pressing information from the elevator operation control unit 3 is the condition that there is no passenger in the elevator 1. Equivalent to. Therefore, it is also possible to use a configuration for identifying that there is no passenger in the elevator 1 from other conditions. Further, the determination flow shown in FIG. 6 is an example, and other conditions can be used as long as the environment in which the voice communication device 4 is placed is recognized and whether or not initial learning is possible according to the environment is determined. It is also possible to use a decision flow based on settings.
  • 451 is an adaptive filter that estimates an impulse response of an echo path and generates a pseudo echo signal
  • 452 is a subtractor that subtracts the pseudo echo from a transmission signal input from the interphone 2 side
  • 453 is a signal on the transmission side.
  • 454 is a residual echo suppression unit that further suppresses the residual echo after echo suppression by the subtracter 452.
  • the adaptive filter 451 reads the parameter held in the parameter holding unit 48 at the start of the call.
  • the parameter input from the parameter holding unit 48 is an estimated echo response value of the echo path.
  • the adaptive filter 451 starts operation, generates a pseudo echo signal through the adaptive filter 451 from the signal on the reception side (input signal on the communication line side), and outputs the pseudo echo signal.
  • the subtracter 452 transmits the pseudo echo signal to the transmission signal. It is subtracted from the (interphone 2 side input signal) and output to the adaptive operation availability determination unit 453 and the residual echo suppression unit 454 and to the adaptive filter 451.
  • the adaptive filter 451 performs impulse response estimation of the echo path using the signal from the subtractor 452.
  • a LMS (Least Mean Squared) algorithm is used for the impulse response estimation of the echo path.
  • whether or not to perform the impulse response estimation operation of the echo path depends on the determination of the adaptive operation availability determination unit 453.
  • the adaptive operation availability determination unit 453 determines whether the echo path estimation operation in the adaptive filter 451 is possible, and outputs the determination result to the adaptive filter 451.
  • a state in which there is a call signal on the receiving side, there is no call signal on the transmitting side, and there is only an echo signal in which the signal on the receiving side wraps around in the elevator 1, is the most desirable state for the echo path estimation operation.
  • the adaptive operation availability determination unit 453 compares the power of the receiving side signal (communication line side input signal) and the transmitting side signal after subtraction of the pseudo echo by the subtractor 452, and compares the power of the receiving side signal. If it is greater than a certain threshold value than the signal power of the talk side, it is determined that an echo path estimation operation is possible.
  • the output signal of the subtracter 452 is a signal after echo cancellation obtained by subtracting the pseudo echo signal generated by the adaptive filter 451 from the transmission signal, but generally an echo component remains. In order to suppress this, the residual echo suppression unit 454 gives a loss to the output signal of the subtractor 452.
  • the adaptive operation availability determination unit 453 and the operation of the residual echo suppression unit 454 described above are examples, and for example, the adaptive operation availability determination unit 453 uses a determination method in which the transmission side signal before pseudo echo subtraction is used together. Alternatively, the residual echo suppression unit 454 may be omitted.
  • the adaptive filter 451 initializes the echo path impulse response estimated value at the timing of the initial learning start (all “0”), and then performs the same processing as during a call until the learning time is completed. That is, a pseudo echo signal is generated and output from the signal on the receiving side (input signal on the communication line side) through the adaptive filter 451, and the impulse response of the echo path is estimated using the signal from the subtracter 452.
  • the adaptive operation availability determination unit 453 performs the same operation as during a call.
  • the residual echo suppression unit 454 performs the same operation as during a call, but since the call is not in progress, its output is not transmitted to the communication line and is not used.
  • the learning opportunity determination unit 41 recognizes the surrounding environment and determines whether or not initial learning is possible according to the environment. Thus, it is possible to obtain the voice call device 4 that can automatically perform initial learning in an appropriate time zone without giving the user a sense of incongruity.
  • initial learning can be performed in an environment close to the environment where the voice call device 4 is actually used, and the voice call device 4 is actually used. It can be applied to the environment.
  • the voice call device 4 is a voice call device for an elevator, and includes a parameter holding unit 48 that holds parameters depending on a signal echo path, and a voice call using the parameters.
  • a signal processing unit 45 that processes voice signals and a learning opportunity determination unit that determines whether or not the parameter can be learned prior to a voice call according to the environment in the elevator 1 in which the device is installed 41 and a learning signal generation unit 43 that generates a learning signal for learning the parameter when it is determined that the learning opportunity determination unit 41 can perform learning.
  • the voice call device 4 is characterized in that the learning opportunity determination unit 41 determines that the parameter can be learned when there is no person in the elevator 1. With this configuration, the voice communication device 4 can perform initial learning at a timing when there is no person in the elevator 1.
  • the learning opportunity determination unit 41 is in a state where the elevator 1 is stopped and the door of the elevator 1 is closed, and a button in the elevator 1 is pressed.
  • a predetermined time elapses, it is determined that the environment in the elevator 1 is an environment in which the parameter can be learned, and the timing for learning the parameter is determined.
  • the parameters held by the parameter holding unit 48 are learned from the time when the learning signal is transmitted from the voice call device 4 to the time when the voice call device 4 receives the learning signal.
  • FIG. 1 it is determined whether or not it is time for the initial learning to be possible based on the flow shown in FIG. Specifically, the condition that there is no passenger in the elevator 1 is that a predetermined time or more has passed since the button in the elevator 1 was last pressed based on the button pressing information from the elevator operation control unit 3 (ST16). ) To determine the initial learning time. On the other hand, in this Embodiment, the structure which determines with the other means that there is no passenger in the elevator 1 is shown.
  • FIG. 8 shows an initial learning time determination flow. In this flow, instead of the condition that a predetermined time has passed since the button in the elevator 1 was last pressed, the condition that the weight in the elevator 1 is equal to or less than a certain value (ST21) is used for the determination. Otherwise, the flow is the same as in FIG. If the weight in the elevator 1 is not more than a certain value, it can be said that there is no passenger.
  • the learning opportunity determination unit 41 determines that there is no passenger by determining that the weight in the elevator 1 is equal to or less than the predetermined value, and learning. Determine if it is possible time.
  • the learning opportunity determination unit 41 is in a state where the elevator 1 is stopped, the door of the elevator 1 is closed, and the weight in the elevator 1 is a predetermined value.
  • the environment in the elevator 1 is an environment in which the parameter can be learned, and a time zone in which the parameter is learned is determined.
  • Embodiment 3 FIG. In this Embodiment, the structure which determines the conditions that there is no passenger in the elevator 1 with a camera image is shown. Some elevators can perform not only voice communication but also image communication at the same time.
  • FIG. 9 shows a flow in which the learning opportunity determination unit 41 determines the initial learning time.
  • the condition that the camera image is unmanned (ST22) is used for the determination.
  • the other flow is the same as in FIG.
  • the learning opportunity determination unit 41 determines that there is no passenger by determining that the camera image is unmanned, and is initial learning possible? Determine whether or not.
  • the learning opportunity determination unit 41 is in a state where the elevator 1 is stopped, the door of the elevator 1 is closed, and the camera installed in the elevator 1 When the image is unattended, it is determined that the environment in the elevator 1 is an environment in which the parameter can be learned. With this configuration, it is possible to automatically perform initial learning in an appropriate time zone without causing the user to feel uncomfortable.
  • the parameter held in the parameter holding unit 48 by the signal processing unit 45 is the impulse response estimated value of the echo path.
  • the present embodiment a configuration is shown in which not all of the impulse response estimated values are retained, but only the impulse response estimated values within a predetermined delay time are retained.
  • n impulse response estimation values provided in the adaptive filter 451
  • H0, H1 Only the impulse responses H0, H1,... Hm ⁇ 1 (m ⁇ n) are stored.
  • the signal processing unit 45 inputs only m impulse responses from the parameter holding unit 48 at the start of a call, the remaining n ⁇ m impulse responses Hm, Hm + 1,. Starts operation with a zero value.
  • the impulse response expresses the echo path characteristic with a response signal at the time of impulse input, and the impulse response with a short delay time is due to the direct sound that the sound output from the speaker 21 of the interphone 2 is directly transmitted to the microphone 22 of the interphone 2.
  • the impulse response with a long delay time corresponds to an echo due to a reflected sound transmitted from the speaker 21 of the interphone 2 to the microphone 22 of the interphone 2 after the sound output from the speaker 21 of the interphone 2 is reflected by the wall or door of the elevator 1.
  • the reflected sound changes depending on the number and positions of passengers in the elevator 1, but the direct sound does not change. Therefore, at the start of the call, even if the call is started in a state where all the impulse response estimated values Hm, Hm + 1,...
  • Hn ⁇ 1 having a long delay time are all 0, all the impulse response estimated values H0, H1, ...
  • H / W Hardware
  • the impulse response estimated value within a predetermined delay time is held in the parameter holding unit 48, so that the H / W scale can be reduced.
  • the parameters held by the parameter holding unit 48 are learned from the time when the learning signal is transmitted from the voice call device 4 to the time when the voice call device 4 receives the learning signal. This is the value of a part of the impulse response with a short delay time among the impulse response values of the path through which the signal passes.
  • Embodiment 5 FIG. In Embodiments 1 to 4, it is determined that there is no elevator occupant and that initial learning of parameters can be performed while a call is not being made with the center. On the other hand, this embodiment shows a mode in which initial learning is performed immediately before a call is made due to an elevator confinement.
  • a learning signal such as white noise needs to be output from the speaker, but there is a problem that it is difficult to allow an operation in which an harsh learning signal is heard to a user who encounters an emergency in an elevator. Therefore, in the present embodiment, a configuration using a learning signal that does not feel harsh to a user who encounters an emergency situation is shown.
  • FIG. 10 is a flowchart showing the operation of the voice call device 4.
  • the call control unit 42 monitors whether or not the emergency call button 23 is pressed (ST1), and when a passenger confined in the elevator presses the emergency call button 23, the call control unit 42 communicates with this as a trigger.
  • a control signal is transmitted / received to / from the monitoring center 6 via the line interface 49, and a monitoring center call is started (ST23).
  • the learning opportunity determination unit 41 determines the initial learning time (ST24), and starts the initial learning.
  • the learning signal generation unit 43 When the initial learning starts, the learning signal generation unit 43 outputs a chirp signal as a parameter initial learning signal (ST25). The chirp signal will be described later. Since the switch 44 selects the input from the learning signal generation unit 43 instead of the communication line interface 49 and outputs it to the signal processing unit 45, the output signal of the learning signal generation unit 43 passes through the signal processing unit 45 to D / The data is output to the A converter 46 (ST9). Then, it is converted into an analog signal by the D / A converter 46 and output from the speaker 21 in the intercom 2. The voice of the person in the elevator from the microphone 22 in the interphone 2 is converted into a digital signal by the A / D converter 47, and then the echo is eliminated by the signal processing unit 45 (ST10).
  • the learning opportunity determination unit 41 determines that a predetermined time, for example, 10 seconds elapses from the start of initial learning, as the initial learning time (ST20), and continues the learning operation (ST25, ST9, ST10) during that time.
  • a predetermined time for example, 10 seconds elapses from the start of initial learning, as the initial learning time (ST20), and continues the learning operation (ST25, ST9, ST10) during that time.
  • the initial learning time ends, the parameters learned by the signal processing unit 45 along with the echo cancellation operation are stored in the parameter holding unit 48 (ST12).
  • the initial learning operation and the call control unit 42 call to the monitoring center 6 are performed in parallel, and when communication with the monitoring center 6 is established and the call is completed (ST26), the signal processing unit 45 is a parameter holding unit.
  • the parameters stored in 48 are input (ST3), and the call starts.
  • the switch 44 selects an input signal from the communication line interface 49 and outputs it to the signal processing unit 45, so that the input signal from the communication line interface 49 passes through the signal processing unit 45 to the D / A converter 46. (ST4). Then, it is converted into an analog signal by the D / A converter 46 and output from the speaker 21 in the intercom 2.
  • the voice of the person in the elevator from the microphone 22 in the interphone 2 is converted into a digital signal by the A / D converter 47, and then the echo is eliminated by the signal processing unit 45 and communicated via the communication line interface 49. It is output to the line (ST5). This operation is continued until the call is finished (ST6).
  • a ringing tone used in general telephone communication is a signal obtained by amplitude-modulating a 400 Hz tone signal at 16 Hz, but such a narrow frequency band signal is not suitable as a learning signal. Therefore, a chirp signal is intermittently output and used as a ringing tone.
  • a chirp signal is a signal whose frequency increases or decreases with time.
  • the chirp signal at a certain time t (0 ⁇ t ⁇ T) is CH (t) and this signal increases from the frequency F0 to F1 during the time 0 to T, it is expressed as follows: Can do.
  • A is the maximum amplitude of the chirp signal.
  • the chirp signal is not harsh like white noise because it is a sound similar to a chirp of insects and birds. Moreover, since it is naturally felt as a ringing tone by using an intermittent tone, it does not give a feeling of strangeness to the elevator passenger. Furthermore, since it has a wide frequency band, it is suitable for learning of the adaptive filter 451.
  • the learning opportunity determination unit 41 can initially learn whichever is longer between a fixed time from the start of the center call and the time from the start of the call to the establishment of the call. to decide.
  • the learning signal generator 43 generates a ringing tone having a wide frequency band as a learning signal.
  • the center call is started when there is a person in the elevator 1. That is, in the voice call device 4 according to the fifth embodiment, when there is a person in the elevator 1, the learning signal generation unit uses a chirp signal as the learning signal. With this configuration, even when the initial learning is performed in an environment where the user exists immediately before a call is made due to an elevator being confined, the initial learning can be performed while maintaining an environment that is not harsh to the user. As a result, it is possible to realize a favorable call environment without giving a sense of incongruity to the user.
  • the impulse response estimated value of the echo path is a parameter learned by initial learning, whereas in this embodiment, parameters other than the impulse response estimated value of the echo path are learned by initial learning. Indicates the configuration as a parameter.
  • FIG. 11 is an internal configuration diagram of the signal processing unit 45 according to the present embodiment.
  • reference numeral 455 denotes a gain / loss calculation unit that calculates a gain or loss applied to signals before and after the subtractor 452, and reference numerals 456 and 457 denote. It is a gain / loss insertion section that gives a gain or loss to a signal.
  • the operations of the adaptive operation availability determination unit 453 and the residual echo suppression unit 454 are the same as those of the signal processing unit 45 shown in FIG.
  • the operation of the adaptive filter 451 is different from the signal processing unit 45 shown in FIG. 7 only in the operation during the initial learning that the learning opportunity determination unit 41 determines that the initial learning is possible.
  • the adaptive filter 451 initializes the impulse response estimated value of the echo path after a certain time elapses from the learning start timing, for example, 1 second later (all “0”), and then performs the same processing as during a call until the learning time is completed. Do. When the initial learning time is completed, the estimated impulse response value of the echo path estimated during the initial learning time is output to the parameter holding unit 48 and stored at the completion timing.
  • the gain / loss calculation unit 455 performs gain / loss learning from the timing when the learning opportunity determination unit 41 determines that initial learning is possible until the adaptive filter 451 starts learning. During this time, the gain / loss calculation unit 455 calculates the signal level L1 output to the interphone 2 and the signal level L2 input from the interphone 2, and at the timing when the adaptive filter 451 starts learning, the gain / loss insertion unit ⁇ ⁇ L2 / L1 is given as a gain / loss value to be given to 456, L1 / ( ⁇ ⁇ L2) which is the reciprocal number is given to the gain / loss insertion unit 457, and a gain / loss value for the gain / loss insertion unit 456 is given.
  • .Alpha..times.L2 / L1 and L1 / (. Alpha..times.L2), which is the reciprocal and gain / loss value for the gain / loss insertion unit 457, are output to the parameter holding unit 48 and stored.
  • is a safety coefficient, and a fixed value of 1 or less is used.
  • the gain / loss calculation unit 455 knows the timing of the call start from the information from the call control unit 42, and the gain / loss value and gain for the gain / loss insertion unit 456 from the parameter holding unit 48 at the call start timing.
  • the gain / loss value for the / loss insertion unit 457 is extracted and set in the gain / loss insertion unit 456 and the gain / loss insertion unit 457, respectively.
  • the gain / loss insertion unit 456 and the gain / loss insertion unit 457 perform the same operation during a call and during initial learning, and multiply the input signal by the gain / loss value set by the gain / loss calculation unit 455. Output.
  • the gain / loss insertion as described above has the following effects when the adaptive filter 451 is realized by fixed-point arithmetic.
  • the impulse response of the echo path has a large value when the gain of the echo path is large, and conversely has a small value when the gain of the echo path is small. Therefore, if the gain / loss insertion as described above is not performed, if the echo path impulse response estimated values H0, H1,..., Hn-1 in the adaptive filter 451 are fixed-point numbers, the numerical value overflows.
  • the decimal point position is determined in advance according to the maximum echo path gain assumed for prevention. If this method is adopted, when the gain of the echo path is small, the higher-order bits of the fixed-point numbers H0, H1,.
  • the estimation accuracy of the echo path impulse response is lowered.
  • the gain / loss insertion as described above is performed, the gain of the echo path viewed from the adaptive filter 451 is always the same by the gain / loss inserted by the gain / loss insertion unit 456, and H0, H1,. , Hn ⁇ 1 can be prevented from decreasing. Further, the gain / loss insertion unit 457 multiplies the reciprocal of the gain / loss inserted by the gain / loss insertion unit 456, and thus does not affect other processes.
  • the gain / loss calculation unit 455 obtains the gain / loss value corresponding to the gain of the echo path, and obtains the gain / loss value obtained from the input and output signals of the adaptive filter 451 and its inverse. Multiply With this configuration, it is possible to obtain a voice communication device that can maintain high estimation accuracy of the echo path impulse response by the adaptive filter 451.
  • the parameters held by the parameter holding unit 48 are the learning signals from the time when the learning signal is transmitted from the voice call device 4 to the time when the voice call device 4 receives it. It is the gain of the path which passes. With this configuration, it is possible to obtain a voice communication device that can maintain high estimation accuracy of the echo path impulse response by the adaptive filter 451.
  • initial learning means learning that is performed prior to a call. Therefore, the initial learning may be performed only once, or the initial learning may be performed several times.

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Indicating And Signalling Devices For Elevators (AREA)
  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)
  • Telephone Function (AREA)

Abstract

この発明に係る音声通話装置は、エレベータ用の音声通話装置であり、信号のエコーの経路に依存するパラメータを保持するパラメータ保持部と、前記パラメータを用いて音声通話時の音声信号を処理する信号処理部と、自装置が設置されたエレベータ内の環境に応じて、前記音声通話に先立って前記パラメータの学習を行うことが可能か否かを判定する学習契機判定部と、前記学習契機判定部で学習を行うことが可能と判定されたとき、前記パラメータの学習を行う学習信号を発生する学習信号発生部と、を備えたことを特徴とする。この構成によって、ユーザに違和感を与えることなく適切なタイミングで自動的に初期学習を行うことができる。

Description

音声通話装置
 この発明は、音声通話を行う際に用いられる音声通話装置に関する。
 スピーカホン電話などのハンズフリー通話が可能な音声通話装置においては、ハウリングやエコーを防止するためのエコーキャンセラが用いられている。エコーが発生する条件は、音声通話装置が設定される環境に依存し、一般に狭くて硬い壁に囲まれた部屋は残響が大きいため大きなエコーが発生し、逆に広い部屋であればエコーが比較的小さい場合もある。エコーキャンセラは、エコー経路の特性(インパルス応答など)を逐次学習する適応フィルタを備えており、適応フィルタは環境によって異なるエコー経路の特性を逐次学習してエコーを消去する。但し、設置環境が大きく異なる場合などに、この逐次学習が困難となる、あるいは学習に時間がかかるといった問題が生じるため、通話前に初期学習を行って予め学習したパラメータを与えておく技術が開示されている(例えば、特許文献1)。
 特許文献1に開示される技術では、初期学習を行う学習モードにおいて、エコーキャンセラの校正音を発生して音声通話装置のスピーカに出力し、このときマイクロフォンに入力される信号を用いて初期学習を行う。この初期学習を行うタイミングについては、電源投入時に自動的に初期学習を行うか、または音声通話装置に初期学習スイッチを備えてユーザがそのスイッチを用いて指定したタイミングで初期学習を行う方法が開示されている。
特開2005-323308号公報.
エレベータの非常通報に用いられる音声通話装置は、エレベータ内に設置されたインターホンのマイクとスピーカによりハンズフリー通話を行う装置であり、エコーキャンセラが必要となる。このマイクとスピーカ特性のばらつきや、エレベータの大きさによって、エコー環境は大きく異なるため、従来技術で示される初期学習の導入は有効である。しかし、エレベータ非常通報用の音声通話装置は、エレベータ内での閉じ込めなどの事態に遭遇したエレベータ搭乗者が用いることになるため、閉じ込められた状況でユーザが初期学習の開始を指定することには困難が伴う。従って、従来技術をそのまま用いると、初期学習のタイミングとして適しているとは言えないという問題がある。
 この発明は上記のような問題点を解決するためになされたもので、ユーザに違和感を与えることなく適切な時間帯で自動的に初期学習を行うことが可能な音声通話装置を得ることを目的とする。
 この発明に係る音声通話装置は、エレベータ用の音声通話装置であり、信号のエコーの経路に依存するパラメータを保持するパラメータ保持部と、前記パラメータを用いて音声通話時の音声信号を処理する信号処理部と、自装置が設置されたエレベータ内の環境に応じて、前記音声通話に先立って前記パラメータの学習を行うことが可能か否かを判定する学習契機判定部と、前記学習契機判定部で学習を行うことが可能と判定されたとき、前記パラメータの学習を行う学習信号を発生する学習信号発生部と、を備えたことを特徴とする。
この発明によれば、ユーザに違和感を与えることなく適切な時間帯で自動的に初期学習を行うことができる。
実施の形態1に係る音声通話装置が用いられるエレベータ非常通報用システムの構成図。 実施の形態1に係る音声通話装置4の内部構成。 実施の形態1に係る音声通話装置4のハードウェア構成を示す図。 実施の形態1に係る音声通話装置4の図3と異なるハードウェア構成を示す図。 実施の形態1に係る音声通話装置4の動作を示すフローチャート。 実施の形態1に係る学習契機判定部41の初期学習時間の判定フロー。 実施の形態1に係る信号処理部45の内部構成を示す図。 実施の形態2に係る学習契機判定部41の初期学習時間の判定フロー。 実施の形態3に係る学習契機判定部41の初期学習時間の判定フロー。 実施の形態5に係る音声通話装置4の動作を示すフローチャート。 実施の形態6による信号処理部45の内部構成図。 実施の形態6による信号処理部45の内部構成図。
実施の形態1.
 この発明の実施の形態1に係る音声通話装置について説明する。図1は、この発明による音声通話装置が用いられるエレベータ非常通報用システムの構成図である。図において、1はエレベータ、2はエレベータ1内に設置されるインターホン、3はエレベータ1の動作を制御するエレベータ運転制御部、4は音声通話装置、5は通信ネットワーク、6はエレベータ1の通話先となる監視センター、7は監視センター6内の電話端末である。
 このシステムは、例えば、エレベータ1が故障してエレベータ1内に搭乗者が閉じ込められた場合、監視センター6のオペレータを呼出して通話する場合に用いられる。このとき、インターホン2は、エレベータ1に閉じ込められた人の音声入出力に用いられ、音声通話装置4はインターホン2のアナログ音声と通信ネットワーク5上を伝送するデジタル音声との相互変換、エレベータ1内で発生するエコーの抑圧を行う。通信ネットワーク5は音声通話装置4と監視センター6との間の音声データを伝送する。電話端末7は監視センター6内のオペレータが通話に用いる。なお、エレベータ運転制御部3はエレベータ1内に設置され、エレベータ1の運転、すなわち昇降やドアの開閉の制御を行い、上記音声通話には直接関係しないが、本実施形態においては、音声通話装置4が初期学習の時間を判断するための情報を提供する。
図2には、音声通話装置4の内部構成を、同装置に接続されるインターホン2、エレベータ運転制御部3と共に示す。図において、41は初期学習の契機を判定する学習契機判定部、42は通話の開始・終了を制御する通話制御部、43は学習用の信号を発生する学習信号発生部、44は通信回線からの入力と学習信号との何れかを選択するスイッチ、45はインターホン2のスピーカ21から出力された音声がインターホン2のマイクに回り込んだ信号であるエコーを抑圧するエコーキャンセラ機能を有する信号処理部、46はデジタル信号をアナログ信号に変換するD/A変換器、47はアナログ信号をデジタル信号に変換するA/D(Analog/Digital)変換器、48は初期学習によって得られたパラメータを保持するパラメータ保持部、49は通信回線とデータの送受信を行う通信回線インターフェース、21はインターホン2内部のスピーカ、22はインターホン2内部のマイクロフォン(以下、マイクと呼ぶ)、23はインターホン2による非常通話開始に用いられる非常通話ボタンである。
 図3は、この発明の実施の形態1における音声通話装置4のハードウェア構成を示す図である。学習契機判定部41、通話制御部42、学習信号発生部43、スイッチ44、信号処理部45、パラメータ保持部48は、メモリ402に記憶されたプログラムを実行するプロセッサ401によって実現される。なお、これは一例であって、これ以外の専用処理回路などを用いたハードウェア構成であっても構わない。
 D/A変換器46、A/D変換器47は、A/D、D/A変換LSI(Large Scale Integration)403により実現される。なお、これは一例であって、例えばプロセッサ401が、A/D、D/A変換LSI403と統合されたシステムLSI等であっても良い。
 スイッチ開閉検出LSI404は、非常通話ボタン23のボタン押下状態を、プロセッサ401の特定ポートから参照できるように電気変換する。なお、これは一例であって、例えばプロセッサ401がスイッチ開閉検出LSI404と統合されたシステムLSI等であっても良い。
 エレベータ運転制御部3は、学習契機判定部41に出力する各種情報をネットワークフレームに乗せて出力し、ネットワークインターフェースA405がこれを受信する。また、ネットワークフレームに乗せられた通信回線側の入出力データは、ネットワークインターフェースB406が送受信する。すなわち、ネットワークインターフェースB406は図2における通信回線インターフェース49に相当する。なお、これは一例であって、例えば、1つのネットワークインターフェースが、エレベータ運転制御部3からの情報の受信と、通信回線側の入出力データの送受信を行う構成でも良い。
 更に、図4に示す構成として、プロセッサ401が実現する処理を複数のプロセッサで実現しても良く、この図においては、信号処理部45、学習信号発生部43などの信号処理をデジタル信号処理プロセッサ407が実現する。
図5は音声通話装置4の動作を示すフローチャートであり、以下、図5を用いて音声通話装置4の動作を説明する。
まず、搭乗者がエレベータ1に閉じ込められる状況などが発生して通話が行われる場合について説明する。通話制御部42は非常通話ボタン23が押下されたかどうかを監視しており(ST1)、エレベータ1内に閉じ込められた搭乗者が非常通話ボタン23を押下すると、これを契機に通話制御部42が通信回線インターフェース49を介して監視センター6と制御信号を送受信し、監視センター6を呼出して通信を確立する(ST2)。この通信確立は、例えば、IETF(Internet Engineering Task Force)のRFC(Request for Comments)3261で規定されるSIP(Session Initiation Protocol)によって行われる。また、通話制御部42はその通信状態、すなわち、センター呼出し中か、通話中か、その何れでもないアイドル状態であるかを、学習契機判定部41と信号処理部45に出力する。監視センター6との通信が確立すると、信号処理部45はパラメータ保持部48に格納されたパラメータを入力し(ST3)、通話が始まる。通話中、スイッチ44は通信回線インターフェース49からの入力信号を選択して信号処理部45に出力するため、通信回線インターフェース49からの入力信号は信号処理部45を経由してD/A変換器46に出力される(ST4)。そして、D/A変換器46でアナログ信号に変換されてインターホン2内のスピーカ21から出力される。また、インターホン2内のマイク22からのエレベータ1内登場者の音声は、A/D変換器47でデジタル信号に変換された後、信号処理部45によってエコーが消去され、通信回線インターフェース49を経て通信回線に出力される(ST5)。そして、通話が終了するまでこの動作を継続する(ST6)。
なお、スイッチ44は、学習契機判定部41で行われる初期学習が可能か否かの判定結果が初期学習が可能でない場合、上述の通りに選択する。この学習契機判定部41で行われる初期学習が可能か否かの判定動作については後述する。
 続いて、通話制御部42が非常通話ボタン23を押下されていないと判定する環境において(ST1)、学習契機判定部41が初期学習可能と判定した場合の動作を説明する。学習契機判定部41が初期学習が可能な時間(初期学習時間)と判定すると(ST7)、学習処理が開始される。学習信号発生部43はパラメータ初期学習用の信号として白色雑音を出力する(ST8)。スイッチ44は、通信回線インターフェース49ではなく、学習信号発生部43からの入力を選択して信号処理部45に出力するので、学習信号発生部43の出力信号は、信号処理部45を経てD/A変換器46に出力される(ST9)。そして、D/A変換器46でアナログ信号に変換されてインターホン2内のスピーカ21から出力される。インターホン2内のマイク22からのエレベータ1内登場者の音声は、A/D変換器47でデジタル信号に変換された後、信号処理部45によってエコーが消去される(ST10)。そして、初期学習時間が終了するまでこの動作を継続し(ST11)、初期学習時間が終了すると、エコー消去動作に伴って信号処理部45が学習したパラメータをパラメータ保持部48に格納する(ST12)。
 なお、パラメータ初期学習用の信号は、信号処理部45によってエコーを消去できる信号であれば、白色雑音以外の信号であっても構わない。
 学習契機判定部41は、初期学習が可能か否かの判定結果をスイッチ44、信号処理部45、学習信号発生部43に出力する。以下、図5のフローにおいてST7に示した判定、すなわち学習契機判定部41が初期学習が可能か否かを判定する動作について説明する。
この判定は、エレベータ運転制御部3からの情報とA/D変換器47からの信号を基に行われる。まず、エレベータ運転制御部3は、エレベータ1の昇降、ドアの開閉制御を行うものだが、そのため、エレベータ1が停止中か動作(上昇または下降)中かどうかを示すエレベータ動作・停止情報、ドアが開いているか閉じているかを示すドア開閉情報、エレベータ1内の行先ボタンやドア開閉ボタンを押下したかどうかを示すボタン押下情報を持っており、これらの情報を学習契機判定部41に出力する。信号処理部45の初期学習は、エレベータ1が停止、かつドアが閉じた状態で、エレベータ1内に搭乗者がおらず、騒音が少ない状態で行うことが望ましい。このような条件を満たす時間帯を判定するため、学習契機判定部41は、エレベータ運転制御部3からの各情報、通話制御部42からの情報、及び、A/D変換器47の出力信号を用いる。
 なお、従来の音声通話装置では、電源投入は通話装置の設置時に行われるが、運用前の状態であるため、例えばエレベータのドアが開いているなど通話時のエコー環境と異なる状態である可能性がある。これに対して、本実施の形態において、ドアが閉じた状態で、エレベータ1内に搭乗者がおらず、騒音が少ない状態で初期学習を行う場合には、通話時のエコー環境に近い環境で初期学習を行うことができる。
図6は、学習契機判定部41での初期学習が可能か否かを判定する判定フローの一例である。以下、このフローを参照して説明する。初めは初期学習時間でないという判定状態からスタートする(ST13)。そして、エレベータ運転制御部3からのエレベータ動作・停止情報によりエレベータ1が停止中であり(ST14)、かつ、エレベータ運転制御部3からのドア開閉情報によりドアが閉じており(ST15)、かつ、エレベータ運転制御部3からのボタン押下情報よりエレベータ1内のボタンが最後に押下されてから所定の時間以上が経過しており(ST16)、かつ、通話制御部42からの情報により通話のための呼出し中でも通話中でもなく(ST17)、かつ、A/D変換器47の出力信号レベルが所定値以下(これはエレベータ1内の騒音が少ないことを意味する)である(ST18)、という全ての条件が満たされると初期学習が可能な時間(初期学習時間)と判定する(ST19)。そして、初期学習時間と判定したタイミングから一定時間、例えば10秒間を初期学習の時間と判定し(ST20)、この時間が経過すると初期学習時間でないという判定状態に戻る(ST13)。
 なお、エレベータ運転制御部3からのボタン押下情報よりエレベータ1内のボタンが最後に押下されてから所定の時間以上が経過しているという条件(ST16)はエレベータ1に搭乗者がいないという条件に相当する。従って、エレベータ1に搭乗者がいないことを他の条件から識別する構成を用いることも可能である。また、図6に示す判断フローは一例であって、音声通話装置4の置かれた環境を認識し、その環境に応じて初期学習が可能か否かを判定する構成であれば、他の条件設定に基づく判断フローを用いることも可能である。
 次に、信号処理部45の動作を、その内部構成を示す図7を用いて説明する。図において、451はエコー経路のインパルス応答を推定して擬似エコー信号を生成する適応フィルタ、452はインターホン2側から入力する送話信号から擬似エコーを減算する減算器、453は送話側の信号と受話側の信号から適応フィルタ451のインパルス応答推定動作の可否を判定する適応動作可否判定部、454は減算器452によってエコー抑圧後の残留エコーを更に抑圧する残留エコー抑圧部である。
まず、学習契機判定部41での判定結果が初期学習時間ではなく、通話が行われる場合について説明する。適応フィルタ451は、通話開始のタイミングでパラメータ保持部48に保持されたパラメータを読込む。ここで、パラメータ保持部48より入力するパラメータはエコー経路のインパルス応答推定値である。その後、適応フィルタ451は動作を開始し、受話側の信号(通信回線側の入力信号)より適応フィルタ451を通して擬似エコー信号を生成して出力し、減算器452がこの擬似エコー信号を送話信号(インターホン2側入力信号)から減算して適応動作可否判定部453、残留エコー抑圧部454に出力すると共に、適応フィルタに451に出力する。適応フィルタ451は、減算器452からの信号を用いてエコー経路のインパルス応答推定を行う。エコー経路のインパルス応答推定には、例えば、LMS(Least Mean Squared)アルゴリズムを用いる。ここで、エコー経路のインパルス応答推定動作を行うかどうかは、適応動作可否判定部453の判定に従う。適応動作可否判定部453は、適応フィルタ451におけるエコー経路推定動作が可能かどうかを判定し、判定結果を適応フィルタ451に出力する。ここで、受話側に通話信号があり、送話側には通話信号がなく受話側の信号がエレベータ1内で回り込んだエコー信号のみがある状態がエコー経路推定動作に最も望ましい状態であり、適応動作可否判定部453は、受話側の信号(通信回線側の入力信号)と減算器452による擬似エコー減算後の送話側信号を入力そのパワーを比較し、受話側の信号のパワーが送話側の信号のパワーよりも一定しきい値以上大きい場合、エコー経路推定動作が可能と判定する。減算器452の出力信号は、適応フィルタ451で生成した擬似エコー信号を送話信号から減算したエコー消去後の信号であるが、一般にはエコー成分が残留する。これを抑圧するため、残留エコー抑圧部454は、減算器452の出力信号に損失を与える。
なお、上記説明した適応動作可否判定部453の動作や残留エコー抑圧部454の動作は一例であって、例えば適応動作可否判定部453は擬似エコー減算前の送話側信号を併用する判定方法を取っても良く、残留エコー抑圧部454を備えない構成であっても良い。
次に、学習契機判定部41が初期学習が可能と判定した場合の初期学習中の動作を説明する。適応フィルタ451は、初期学習開始のタイミングでエコー経路のインパルス応答推定値を初期化(全て“0”)し、その後学習時間完了まで、通話時と同様な処理を行う。すなわち、受話側の信号(通信回線側の入力信号)より適応フィルタ451を通して擬似エコー信号を生成して出力し、減算器452からの信号を用いてエコー経路のインパルス応答推定を行う。適応動作可否判定部453は通話時と同様の動作を行う。同様に、残留エコー抑圧部454も通話時と同様の動作を行うが、通話中でないため、その出力は通信回線に送信されることはなく使用されない。初期学習時間が完了すると、その完了のタイミングにおいて、初期学習時間中に推定したエコー経路のインパルス応答推定値をパラメータ保持部48に出力し、これを格納させる。
以上のように、本実施の形態に係る発明によれば、学習契機判定部41が、周辺の環境を認識し、その環境に応じて初期学習が可能か否かを判定する構成を用いることにより、ユーザに違和感を与えることなく自動的に適切な時間帯で初期学習を行うことが可能な音声通話装置4を得ることができる。
特に、その周辺の環境として、エレベータ1が停止中で、ドアが閉まっており、エレベータ1内の行先ボタンが押下されてから所定の時間以上が経過し、通話中でなく、マイク22からの入力信号レベルが所定値以下の場合に初期学習可能と判断することにより、実際に音声通話装置4が用いられる環境に近い環境で、初期学習を行うことができ、実際に音声通話装置4が用いられる環境に適用することが可能となる。
 すなわち、実施の形態1に係る音声通話装置4は、エレベータ用の音声通話装置であり、信号のエコーの経路に依存するパラメータを保持するパラメータ保持部48と、前記パラメータを用いて音声通話時の音声信号を処理する信号処理部45と、自装置が設置されたエレベータ1内の環境に応じて、音声通話に先立って前記パラメータの学習を行うことが可能か否かを判定する学習契機判定部41と、前記学習契機判定部41で学習を行うことが可能と判定されたとき、前記パラメータの学習を行う学習信号を発生する学習信号発生部43と、を備えたことを特徴とする。この構成によって、ユーザに違和感を与えることなく自動的に適切なタイミングで初期学習を行うことが可能となる。
 また、実施の形態1に係る音声通話装置4では、学習契機判定部41は、エレベータ1内に人がいないときに、前記パラメータの学習を行うことが可能と判定することを特徴とする。この構成によって、音声通話装置4はエレベータ1内に人がいないタイミングで初期学習を行うことができる。
 また、実施の形態1に係る音声通話装置4では、学習契機判定部41は、エレベータ1が停止中であり、前記エレベータ1のドアが閉まった状態であり、前記エレベータ1内のボタンが押下されてから所定の時間が経過したとき、前記エレベータ1内の環境が前記パラメータの学習が可能な環境であると判定し、前記パラメータの学習を行うタイミングを決定することを特徴とする。この構成によって、ユーザに違和感を与えることなく自動的に適切なタイミングで初期学習を行うことが可能となる。
 また、実施の形態1に係る音声通話装置4では、パラメータ保持部48で保持されるパラメータは学習信号が音声通話装置4から送信される時点から音声通話装置4で受信される時点までに前記学習信号が通る経路のインパルス応答の値である。この構成によって、音声通話装置4はパラメータ保持部48で保持されたインパルス応答の値を用いて通話信号のエコーキャンセルを行うことができ、良好な通話信号の品質を確保することができる。
実施の形態2.
実施の形態1では、学習契機判定部41が図6に示すフローに基づいて初期学習が可能な時間か否かの判定が行われた。具体的には、エレベータ1に搭乗者がいないことをエレベータ運転制御部3からのボタン押下情報よりエレベータ1内のボタンが最後に押下されてから所定の時間以上が経過しているという条件(ST16)によって初期学習時間を判定した。これに対して、本実施の形態では、エレベータ1に搭乗者がいないことを他の手段で判定する構成を示す。
エレベータ1の中には、乗り過ぎを通知するブザーを備えたものがある。そのようなエレベータ1においては、エレベータ運転制御部3は学習契機判定部41に対して、エレベータ1内の重量情報を出力することができる。学習契機判定部41はこの情報を初期学習時間の判定に用いる。図8に初期学習時間の判定フローを示す。このフローでは、エレベータ1内のボタンが最後に押下されてから所定の時間以上が経過しているという条件に代わり、エレベータ1内の重量が一定値以下である(ST21)という条件を判定に用いており、それ以外は図6と同様のフローである。エレベータ1内の重量が一定値以下であれば搭乗者はいないと言える。
以上のように、本実施の形態に係る発明によれば、学習契機判定部41がエレベータ1内の重量が所定値以下であることを判定することにより、搭乗者がいないことを判定し、学習可能な時間か否かを決定する。この構成によって、実施の形態1と同様に、ユーザに違和感を与えることなく自動的に適切な時間帯で初期学習を行うことが可能な音声通話装置を得ることができる。
 すなわち、実施の形態2に係る音声通話装置4では、学習契機判定部41は、エレベータ1が停止中であり、前記エレベータ1のドアが閉まった状態であり、前記エレベータ1内の重量が所定値以下であるとき、前記エレベータ1内の環境が前記パラメータの学習が可能な環境であると判定し、前記パラメータの学習を行う時間帯を決定することを特徴とする。この構成によって、ユーザに違和感を与えることなく自動的に適切な時間帯で初期学習を行うことが可能となる。
実施の形態3.
本実施の形態では、エレベータ1内に搭乗者がいないという条件をカメラ画像により判定する構成を示す。この通話の際、音声通信だけでなく画像通信も同時に可能なエレベータもある。
図9に学習契機判定部41が初期学習時間を判定するフローを示す。このフローでは、エレベータ1内のボタンが最後に押下されてから所定の時間以上が経過しているという条件に代わり、カメラ画像内が無人である(ST22)という条件を判定に用いており、それ以外は図6と同様のフローである。
以上のように、本実施の形態に係る発明によれば、学習契機判定部41はカメラ画像内が無人であることを判定することにより、搭乗者がいないことを判定し、初期学習が可能か否かを判定する。この構成によって、実施の形態1、2と同様に、ユーザに違和感を与えることなく自動的に適切な時間帯で初期学習を行うことが可能な音声通話装置を得ることができる。
 すなわち、実施の形態3に係る音声通話装置4では、学習契機判定部41は、エレベータ1が停止中であり、前記エレベータ1のドアが閉まった状態であり、前記エレベータ1内に設置されたカメラの画像が無人であるとき、前記エレベータ1内の環境が前記パラメータの学習が可能な環境であると判定することを特徴とする。この構成によって、ユーザに違和感を与えることなく自動的に適切な時間帯で初期学習を行うことが可能となる。
実施の形態4.
実施の形態1~3では、信号処理部45がパラメータ保持部48に保持するパラメータをエコー経路のインパルス応答推定値とした。これに対して、本実施の形態では、このインパルス応答推定値の全てを保持するのではなく、所定の遅延時間内のインパルス応答推定値のみを保持する構成を示す。
適応フィルタ451が備えるインパルス応答推定値がn個ある場合、本実施の形態ではこれを遅延時間の短い順に並べるとH0、H1、・・・Hn-1となるとすると、パラメータ保持部48にはm個のインパルス応答H0、H1、・・・Hm-1(m<n)のみを格納する。また、通話開始の際、信号処理部45はパラメータ保持部48からm個のインパルス応答のみを入力することになるため、残りn-m個のインパルス応答Hm、Hm+1、・・・Hn-1については0値を用いて動作を開始する。
インパルス応答は、エコー経路特性をインパルス入力時の応答信号で表現するものであり、遅延時間の短いインパルス応答はインターホン2のスピーカ21から出力される音声が直接インターホン2のマイク22に伝わる直接音によるエコーに相当し、遅延時間の長いインパルス応答はインターホン2のスピーカ21から出力される音声がエレベータ1の壁、ドアなどで反射してからインターホン2のマイク22に伝わる反射音によるエコーに相当する。反射音はエレベータ1内の搭乗者の人数や位置に依存して変化するが、直接音は変化しない。このため、通話開始の際に、遅延時間の長いインパルス応答推定値Hm、Hm+1、・・・Hn-1について全て0の状態で通話が開始されたとしても、全インパルス応答推定値H0、H1、・・・Hn-1をパラメータ保持部48から入力する場合とエコー消去性能に殆ど差異はなく、保持するインパルス応答推定値が少なくなることからパラメータ保持部48に要するメモリ量、すなわちH/W(Hardware)規模を削減することができる。
以上のように、本実施の形態に係る発明によれば、パラメータ保持部48に所定の遅延時間内のインパルス応答推定値のみを保持するためH/W規模を削減が可能となる。また、ユーザに違和感を与えることなく自動的に適切な時間帯で初期学習を行うことが可能な音声通話装置を得ることができる。
 すなわち、実施の形態4に係る音声通話装置4では、パラメータ保持部48で保持されるパラメータは学習信号が音声通話装置4から送信される時点から音声通話装置4で受信される時点までに前記学習信号が通る経路のインパルス応答の値の中で遅延時間の短い一部のインパルス応答の値である。この構成によって、保持するインパルス応答推定値が少なくなることからパラメータ保持部48に要するメモリ量、すなわちH/W規模を削減することができる。
実施の形態5.
実施の形態1~4においては、エレベータ搭乗者がなく、センターとの間の通話が行われていない間にパラメータの初期学習を行うことが可能と判定した。これに対して、本実施の形態では、エレベータの閉じ込めなどが発生して通話が行われる直前に初期学習を行う形態を示す。
初期学習時には白色雑音などの学習信号をスピーカから出力する必要があるが、エレベータ内で緊急事態に遭遇したユーザに対して耳障りな学習信号を聞かせる運用は許容し難いという問題がある。そこで、本実施の形態では、緊急事態に遭遇したユーザに対して耳障りに感じない学習信号を用いる構成を示す。
図10は音声通話装置4の動作を示すフローチャートであり、以下、この図を用いて音声通話装置4の動作を説明する。通話制御部42は非常通話ボタン23が押下されたかどうかを監視しており(ST1)、エレベータ内に閉じ込められた搭乗者が非常通話ボタン23を押下すると、これを契機に通話制御部42が通信回線インターフェース49を介して監視センター6と制御信号を送受信し、監視センター呼出しを開始する(ST23)。これと同時に、学習契機判定部41は初期学習の時間と判定し(ST24)、初期学習を開始する。
初期学習が始まると、学習信号発生部43はパラメータ初期学習用の信号としてチャープ信号を出力する(ST25)。なお、チャープ信号の説明は後述する。スイッチ44は、通信回線インターフェース49ではなく、学習信号発生部43からの入力を選択して信号処理部45に出力するので、学習信号発生部43の出力信号は、信号処理部45を経てD/A変換器46に出力される(ST9)。そして、D/A変換器46でアナログ信号に変換されてインターホン2内のスピーカ21から出力される。インターホン2内のマイク22からのエレベータ内登場者の音声は、A/D変換器47でデジタル信号に変換された後、信号処理部45によってエコーが消去される(ST10)。学習契機判定部41は、初期学習の開始から一定時間、例えば10秒経過するまでを初期学習時間と判定し(ST20)、その間、上記の学習動作(ST25、ST9、ST10)を継続する。初期学習時間が終了すると、エコー消去動作に伴って信号処理部45が学習したパラメータをパラメータ保持部48に格納する(ST12)。
上記初期学習動作と、通話制御部42による監視センター6への呼出しは並行して行われ、監視センター6との通信が確立して呼出しが完了すると(ST26)、信号処理部45はパラメータ保持部48に格納されたパラメータを入力し(ST3)、通話が始まる。通話中、スイッチ44は通信回線インターフェース49からの入力信号を選択して信号処理部45に出力するため、通信回線インターフェース49からの入力信号は信号処理部45を経由してD/A変換器46に出力される(ST4)。そして、D/A変換器46でアナログ信号に変換されてインターホン2内のスピーカ21から出力される。また、インターホン2内のマイク22からのエレベータ内登場者の音声は、A/D変換器47でデジタル信号に変換された後、信号処理部45によってエコーが消去され、通信回線インターフェース49を経て通信回線に出力される(ST5)。そして、通話が終了するまでこの動作を継続する(ST6)。
以下、初期学習において学習信号発生部43が発生する信号について説明する。初期学習の時間はセンター呼出し中であることから、学習信号発生部43は、学習信号として、断続する呼出し音を発生する。一般の電話通信で用いられる呼出し音は、400Hzのトーン信号を16Hzで振幅変調した信号であるが、このような周波数帯域の狭い信号は学習信号には適していない。そこで、チャープ信号を断続的に出力し、これを呼出し音とする。チャープ信号とは、周波数が時間とともに増加または下降する信号である。ある時間t(0≦t≦T)におけるチャープ信号をCH(t)とし、この信号が時間0からTの間に、周波数F0からF1まで増加するものである場合、下式のように表すことができる。
Figure JPOXMLDOC01-appb-I000001
上式において、Aはチャープ信号の最大振幅である。チャープ信号は、虫や鳥の鳴き声(chirp)に似た音であることから白色雑音のように耳障りでない。また断続音とすることで呼出し音として自然に感じられるため、エレベータ搭乗者に違和感を与えることがない。更に、広い周波数帯域を持つため適応フィルタ451の学習にも適している。
以上のように、本発明によれば、学習契機判定部41が、センターの呼出しが開始されてから一定時間と、呼出し開始から通話確立までの時間のうち、何れか長い方を初期学習可能と判断する。また、学習信号発生部43は周波数帯域が広く断続する呼出し音を学習信号として発生する。この構成を用いることにより、ユーザに違和感を与えることなく自動的に適切な時間帯で初期学習を行うことが可能な音声通話装置を得ることができる。
また、実施の形態5において、センターの呼出しが開始されるのはエレベータ1内に人がいるときである。すなわち、実施の形態5に係る音声通話装置4では、エレベータ1内に人がいるときに、前記学習信号発生部はチャープ信号を前記学習信号として用いることを特徴とする。この構成によって、エレベータの閉じ込めなどが発生して通話が行われる直前にユーザの存在する環境で初期学習を行う場合でも、ユーザにとって耳障りでない環境を維持しつつ、初期学習を行うことができる。その結果、ユーザにとって、違和感を与えることなく、良好な通話環境を実現することができる。
実施の形態6.
実施の形態1~5では、エコー経路のインパルス応答推定値を初期学習で学習するパラメータとしたのに対し、本実施の形態では、エコー経路のインパルス応答推定値以外のパラメータを初期学習で学習するパラメータとする構成を示す。
図11は、本実施の形態による信号処理部45の内部構成図であり、図において、455は減算器452の前後の信号に与えるゲインまたはロスを算出するゲイン/ロス算出部、456及び457は信号にゲインまたはロスを与えるゲイン/ロス挿入部である。
図において、適応動作可否判定部453と残留エコー抑圧部454の動作は、図7に示した信号処理部45と同様である。適応フィルタ451の動作については、学習契機判定部41が初期学習可能と判定した初期学習中の動作のみが図7に示した信号処理部45と異なる。適応フィルタ451は、学習開始のタイミングから一定時間経過後、例えば1秒後にエコー経路のインパルス応答推定値を初期化(全て“0”)し、その後学習時間完了まで、通話時と同様な処理を行う。初期学習時間が完了すると、その完了のタイミングにおいて、初期学習時間中に推定したエコー経路のインパルス応答推定値をパラメータ保持部48に出力し、これを格納させる。
そして、学習契機判定部41が初期学習可能と判定したタイミングから適応フィルタ451が学習を開始するまでの間は、ゲイン/ロス算出部455がゲイン/ロスの学習を行う。この間、ゲイン/ロス算出部455は、インターホン2に出力される信号レベルL1とインターホン2から入力される信号レベルL2とを算出し、適応フィルタ451が学習を開始するタイミングで、ゲイン/ロス挿入部456に与えるゲイン/ロス値としてα×L2/L1を、ゲイン/ロス挿入部457にはその逆数であるL1/(α×L2)を与えると共に、ゲイン/ロス挿入部456用のゲイン/ロス値であるα×L2/L1とその逆数でありゲイン/ロス挿入部457用のゲイン/ロス値であるL1/(α×L2)とをパラメータ保持部48に出力して格納させる。ここで、αは安全係数であり、1以下の固定値を用いる。また、ゲイン/ロス算出部455は、通話制御部42からの情報により通話開始のタイミングを知り、この通話開始のタイミングでパラメータ保持部48からゲイン/ロス挿入部456用のゲイン/ロス値とゲイン/ロス挿入部457用のゲイン/ロス値を取り出し、それぞれゲイン/ロス挿入部456及びゲイン/ロス挿入部457に設定する。
ゲイン/ロス挿入部456及びゲイン/ロス挿入部457は通話時、初期学習時ともに同じ動作を行い、ゲイン/ロス算出部455から設定されたゲイン/ロス値を、入力信号に対して乗算して出力する。
上記のようなゲイン/ロスの挿入は、適応フィルタ451を固定小数点演算で実現する場合に以下のような効果がある。エコー経路のインパルス応答は、エコー経路のゲインが大きいと大きな値となり、逆に、エコー経路のゲインが小さいと小さな値となる。従って、上記のようなゲイン/ロスの挿入を行わない場合、適応フィルタ451内のエコー経路インパルス応答推定値H0、H1、・・・、Hn-1が固定小数点数であれば、数値のオーバーフローを防止するため想定される最大のエコー経路ゲインに応じて、予め小数点位置を定めておくことになる。このような方法を取ると、エコー経路のゲインが小さい場合には固定小数点数であるH0、H1、・・・、Hn-1の上位側のビットが余って有効ビット数が減ることになり、エコー経路インパルス応答の推定精度が低くなる。上記のようなゲイン/ロスの挿入を行うと、ゲイン/ロス挿入部456で挿入されるゲイン/ロスによって適応フィルタ451から見たエコー経路のゲインが常に同様になり、H0、H1、・・・、Hn-1の有効ビット減少を防止することが可能となる。また、ゲイン/ロス挿入部457では、ゲイン/ロス挿入部456で挿入するゲイン/ロスの逆数を乗算するため、その他の処理に影響を与えないことになる。
なお、図11に示す構成に変わり、ゲイン/ロス挿入部456とゲイン/ロス挿入部457によるゲイン/ロスの挿入位置を図12のようにしても全く同様な効果がある。
以上のように、本発明によれば、ゲイン/ロス算出部455がエコー経路のゲインに応じたゲイン/ロス値を求め、適応フィルタ451の入力、出力信号に求めたゲイン/ロス値とその逆数を乗算する。この構成によって、適応フィルタ451によるエコー経路インパルス応答の推定精度を高く保つことができる音声通話装置を得ることができる。
すなわち、実施の形態6に係る音声通話装置4では、パラメータ保持部48で保持されるパラメータは学習信号が音声通話装置4から送信される時点から音声通話装置4で受信される時点までに学習信号が通る経路のゲインであることを特徴とする。この構成によって、適応フィルタ451によるエコー経路インパルス応答の推定精度を高く保つことができる音声通話装置を得ることができる。
なお、実施の形態1~6では初期学習を扱ったが、初期学習は通話に先立って行われる学習を意味するものである。従って、初期学習を1回だけ行ってもよいし、初期学習を数回行っても構わない。
1:エレベータ、2:インターホン、3:エレベータ運転制御部、4:音声通話装置、5:通信ネットワーク、6:監視センター、7:電話端末、21:スピーカ、22:マイクロフォン、23:非常通話ボタン、41:学習契機判定部、42:通話制御部、43:学習信号発生部、44:スイッチ、45:信号処理部、46:D/A変換器、47:A/D変換器、48:パラメータ保持部、49:通信回線インターフェース、401:プロセッサ、402:メモリ、403:A/D、D/A変換LSI、404:スイッチ開閉検出LSI、405:ネットワークインターフェースA、406:ネットワークインターフェースB、407:デジタル信号処理プロセッサ、451:適応フィルタ、452:減算器、453:適応動作可否判定部、454:残留エコー抑圧部、455:ゲイン/ロス算出部、456、457:ゲイン/ロス挿入部

Claims (9)

  1.  信号のエコーの経路に依存するパラメータを保持するパラメータ保持部と、
    前記パラメータを用いて音声通話時の音声信号を処理する信号処理部と、
    自装置が設置されたエレベータ内の環境に応じて、前記音声通話に先立って前記パラメータの学習を行うことが可能か否かを判定する学習契機判定部と、
    前記学習契機判定部で学習を行うことが可能と判定されたとき、前記パラメータの学習を行う学習信号を発生する学習信号発生部と、
    を備えたことを特徴とするエレベータ用の音声通話装置。
  2.  前記学習契機判定部は、前記エレベータ内に人がいないときに、前記パラメータの学習を行うことが可能と判定すること
    を特徴とする請求項1に記載の音声通話装置。
  3.  前記学習契機判定部は、
    前記エレベータが停止中であり、
    前記エレベータのドアが閉まった状態であり、
    前記エレベータ内のボタンが押下されてから所定の時間が経過したとき、
    前記エレベータ内の環境が前記パラメータの学習が可能と判定することを特徴とする請求項1または請求項2に記載の音声通話装置。
  4.  前記学習契機判定部は、
    前記エレベータが停止中であり、
    前記エレベータのドアが閉まった状態であり、
    前記エレベータ内の重量が所定値以下であるとき、
    前記エレベータ内の環境が前記パラメータの学習が可能と判定することを特徴とする請求項1または請求項2に記載の音声通話装置。
  5.  前記学習契機判定部は、
    前記エレベータが停止中であり、
    前記エレベータのドアが閉まった状態であり、
    前記エレベータ内に設置されたカメラの画像が無人であるとき、
    前記エレベータ内の環境が前記パラメータの学習が可能と判定することを特徴とする請求項1または請求項2に記載の音声通話装置。
  6. 前記パラメータは前記学習信号が前記音声通話装置から送信される時点から前記音声通話装置で受信される時点までに前記学習信号が通る経路のインパルス応答の値である
    ことを特徴とする請求項1乃至5のいずれか1項に記載の音声通話装置。
  7. 前記パラメータは、前記インパルス応答の値の中で遅延時間の短い一部のインパルス応答の値であることを特徴とする請求項6に記載の音声通話装置。
  8. 前記パラメータは前記学習信号が前記音声通話装置から送信される時点から前記音声通話装置で受信される時点までに前記学習信号が通る経路のゲインである
    ことを特徴とする請求項1乃至5のいずれか1項に記載の音声通話装置。
  9. 前記エレベータ内に人がいるときに、前記学習信号発生部はチャープ信号を前記学習信号として用いる
    ことを特徴とする請求項1に記載の音声通話装置。
PCT/JP2016/053375 2016-02-04 2016-02-04 音声通話装置 WO2017134798A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2016544644A JP6011751B1 (ja) 2016-02-04 2016-02-04 音声通話装置
PCT/JP2016/053375 WO2017134798A1 (ja) 2016-02-04 2016-02-04 音声通話装置
CN201680079879.0A CN108495803B (zh) 2016-02-04 2016-02-04 语音通话装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/053375 WO2017134798A1 (ja) 2016-02-04 2016-02-04 音声通話装置

Publications (1)

Publication Number Publication Date
WO2017134798A1 true WO2017134798A1 (ja) 2017-08-10

Family

ID=57140234

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2016/053375 WO2017134798A1 (ja) 2016-02-04 2016-02-04 音声通話装置

Country Status (3)

Country Link
JP (1) JP6011751B1 (ja)
CN (1) CN108495803B (ja)
WO (1) WO2017134798A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114258129A (zh) * 2021-12-31 2022-03-29 展讯通信(上海)有限公司 终端注册方法及装置、存储介质、终端设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08237175A (ja) * 1995-02-24 1996-09-13 Casio Comput Co Ltd エコーキャンセラ装置、該エコーキャンセラ装置のフィルタ係数設定方法および該エコーキャンセラ装置を備える音声通信装置
JP2008056442A (ja) * 2006-08-31 2008-03-13 Toshiba Elevator Co Ltd エレベータの通話点検システム
JP2010168155A (ja) * 2009-01-21 2010-08-05 Mitsubishi Electric Corp エレベータの非常用通話装置
JP5034607B2 (ja) * 2006-11-02 2012-09-26 株式会社日立製作所 音響エコーキャンセラシステム
JP5784539B2 (ja) * 2012-04-10 2015-09-24 株式会社日立ビルシステム エレベータ非常通話装置の点検装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1284309C (zh) * 1994-05-07 2006-11-08 株式会社Ntt都科摩 回波消除器学习方法
JP5705782B2 (ja) * 2012-05-09 2015-04-22 株式会社日立ビルシステム エレベータ用非常通話点検システム
CN105007364B (zh) * 2015-05-26 2017-04-05 腾讯科技(深圳)有限公司 语音通话方法及语音通话装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08237175A (ja) * 1995-02-24 1996-09-13 Casio Comput Co Ltd エコーキャンセラ装置、該エコーキャンセラ装置のフィルタ係数設定方法および該エコーキャンセラ装置を備える音声通信装置
JP2008056442A (ja) * 2006-08-31 2008-03-13 Toshiba Elevator Co Ltd エレベータの通話点検システム
JP5034607B2 (ja) * 2006-11-02 2012-09-26 株式会社日立製作所 音響エコーキャンセラシステム
JP2010168155A (ja) * 2009-01-21 2010-08-05 Mitsubishi Electric Corp エレベータの非常用通話装置
JP5784539B2 (ja) * 2012-04-10 2015-09-24 株式会社日立ビルシステム エレベータ非常通話装置の点検装置

Also Published As

Publication number Publication date
CN108495803B (zh) 2019-08-06
JP6011751B1 (ja) 2016-10-19
CN108495803A (zh) 2018-09-04
JPWO2017134798A1 (ja) 2018-02-08

Similar Documents

Publication Publication Date Title
JP4569618B2 (ja) エコーキャンセラ及び通話音声処理装置
CN110838300B (zh) 回声消除的处理方法及处理***
JP3727258B2 (ja) エコー抑制処理システム
US8160239B2 (en) Echo canceller and speech processing apparatus
JP4568439B2 (ja) エコー抑圧装置
WO2013166761A1 (zh) 回声消除方法及装置
JP3009647B2 (ja) 音響反響制御システム、音響反響制御システムの同時通話検出器及び音響反響制御システムの同時通話制御方法
JP3607625B2 (ja) 多チャネル反響抑圧方法、その装置、そのプログラム及びその記録媒体
JP2003324370A (ja) エコーキャンセラ
JP2009094802A (ja) 通信装置
KR100547765B1 (ko) 동시통화구간 검출에 따른 음향 반향 제거 방법 및 장치
JP4105681B2 (ja) エコーサプレス方法、エコーサプレッサ、エコーサプレッサプログラム、通信路上の損失量制御方法、通信路上の損失量制御装置、通信路上の損失量制御プログラム、記録媒体
JP6011751B1 (ja) 音声通話装置
JP3756839B2 (ja) 反響低減方法、反響低減装置、反響低減プログラム
JP4600423B2 (ja) エコーキャンセラ
JP4544040B2 (ja) エコーキャンセル装置およびそれを用いた電話機、並びにエコーキャンセル方法
EP1584178A1 (en) Device and method for suppressing echo, in particular in telephones
WO2019169272A1 (en) Enhanced barge-in detector
JP4696776B2 (ja) 音声処理装置及びマイク装置
JP4857652B2 (ja) ノイズキャンセラ及びマイク装置
JP4650163B2 (ja) 拡声通話装置
JPH09116613A (ja) 反響消去装置
KR102172608B1 (ko) 동시통화에 강인한 심층학습 기반 음향반향 제거 장치 및 그 방법
JP5963077B2 (ja) 通話装置
JP4877083B2 (ja) 残留エコー抑圧制御装置、方法及びプログラム

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2016544644

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16889284

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16889284

Country of ref document: EP

Kind code of ref document: A1