ES2246123A1 - Subtitling transcription system for transcribing voice of user into transcript text piece by distributing tasks in real time, has restructuring captioning lines formed by recomposing transcript text piece and connected to output device - Google Patents

Subtitling transcription system for transcribing voice of user into transcript text piece by distributing tasks in real time, has restructuring captioning lines formed by recomposing transcript text piece and connected to output device

Info

Publication number
ES2246123A1
ES2246123A1 ES200400276A ES200400276A ES2246123A1 ES 2246123 A1 ES2246123 A1 ES 2246123A1 ES 200400276 A ES200400276 A ES 200400276A ES 200400276 A ES200400276 A ES 200400276A ES 2246123 A1 ES2246123 A1 ES 2246123A1
Authority
ES
Spain
Prior art keywords
user
sequence
subtitling
text
window
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
ES200400276A
Other languages
Spanish (es)
Other versions
ES2246123B1 (en
Inventor
Rosa Vallverdu Vilagines
Josep Ardenuy Bel
Blai Pocurull Ges
Ramon Cererols Macia
Pere Vila I Fumas
Victor Santa Olalla Boncomte
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Corporacio Catalana De Mitjans Audiovisuals Sa
Original Assignee
Televisio De Catalunya S A
TELEVISIO DE CATALUNYA SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Televisio De Catalunya S A, TELEVISIO DE CATALUNYA SA filed Critical Televisio De Catalunya S A
Priority to ES200400276A priority Critical patent/ES2246123B1/en
Publication of ES2246123A1 publication Critical patent/ES2246123A1/en
Application granted granted Critical
Publication of ES2246123B1 publication Critical patent/ES2246123B1/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • G06F17/289
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Television Systems (AREA)

Abstract

The system has a broadcast listening unit (3) and a computer screen (4) that display alphanumeric characters (5). A processing input unit (7) automatically processes a voice of a user into a transcript text piece through the computer screen. Restructuring captioning lines are formed by recomposing the transcript text piece, where the lines are connected to an output device (8).

Description

Sistema para la subtitulación o trascripción de voz a texto en tiempo real por distribución de tareas.System for subtitling or transcription of Voice to text in real time by distribution of tasks.

La presente invención se refiere a un sistema para la subtitulación simultánea de imágenes retransmitidas a través de pantalla y red de interconexión para la implementación de dicho sistema.The present invention relates to a system for simultaneous subtitling of images retransmitted to through screen and interconnection network for the implementation of said system.

Antecedentes de la invenciónBackground of the invention

Son conocidos procedimientos de subtitulación en tiempo real. Son conocidos distintos procedimientos de subtitulación en tiempo real. La subtitulación con estenotipia, la subtitulación con velotype y la subtitulación con un teclado QWERTY, que es el nombre que reciben los teclados normales de ordenador.Subtitling procedures are known in real time. Different procedures of Real time subtitling. Subtitling with stenotype, the subtitling with velotype and subtitling with a keyboard QWERTY, which is the name that normal keyboards receive from computer.

El procedimiento utilizado sobre todo para la subtitulación de programas en directo, por ejemplo, en Estados Unidos y en la Gran Bretaña, pero también en otros países es la estenotipia. Desde hace unos años, también se ha introducido en España, gracias al hecho que en el Congreso de Diputados todavía se utilizaba la estenotipia para las transcripciones y por lo tanto todavía había tradición y gente formada y usuarios en formación como estenotipistas de lengua española.The procedure used primarily for subtitling of live programs, for example, in States United and in Great Britain, but also in other countries is the stenotypy For a few years now, it has also been introduced in Spain, thanks to the fact that the Congress of Deputies still I used the stenotype for transcriptions and therefore there was still tradition and trained people and users in formation as Spanish language stenotypists.

También se utiliza el sistema de velotype, que tiene parecidos con la estenotipia, pero es un poco más fácil la formación. En estos momentos el teclado velotype se puede utilizar solo con las siguientes lenguas: chino, checo, danés, alemán, inglés, finlandés, francés, holandés, japonés, español y sueco. Por otro lado también es utilizado el teclado normal para la subtitulación de determinados programas.The velotype system is also used, which It has similarities with stenotyping, but it is a little easier training. The velotype keyboard can now be used Only with the following languages: Chinese, Czech, Danish, German, English, Finnish, French, Dutch, Japanese, Spanish and Swedish. By on the other hand the normal keyboard is also used for the Subtitling of certain programs.

Los dos primeros procedimientos presentan el inconveniente de que requieren un teclado a la lengua en que se quiere subtitular, un método de enseñanza para que se aprenda a utilizar este teclado y además un mínimo de 2 años para que los usuarios que lo van a utilizar empiecen a transcribir. Y un mínimo de 4 años para que la trascripción tenga una cierta calidad. Este método es muy lento de implementar y de adaptar a nuevos idiomas, y requiere por lo tanto que el usuario que lo utiliza haya adquirido una gran formación y sea muy especializado, resultando muy elevado el coste económico que representa llevarlo a cabo cuando se trata de transcribir a una lengua en la que no hay tradición de estenotipistas o, si la había, se ha perdido y ya nadie enseña el método. La subtitulación con velotype tiene muchos parecidos con la estenotipia, aunque parece que la formación de los usuarios no es tan lenta. Finalmente, la subtitulación con el teclado normal se hace con la participación de un solo usuario. Es imposible que un solo usuario, por muchas pulsaciones por minuto que adquiera, consiga subtitular a tiempo real.The first two procedures present the drawback that they require a keyboard to the language in which they wants to caption, a teaching method to learn to use this keyboard and also a minimum of 2 years for Users who are going to use it begin to transcribe. And a minimum 4 years so that the transcript has a certain quality. This method is very slow to implement and adapt to new languages, and  therefore requires that the user who uses it has acquired a great training and be very specialized, resulting very high the economic cost of carrying it out when it comes to of transcribing into a language in which there is no tradition of stenotypists or, if there was one, it has been lost and nobody teaches the method. Subtitling with velotype has many similarities with the  stenotypy, although it seems that user training is not so slow Finally, subtitling with the normal keyboard is It does with the participation of a single user. It is impossible for a single user, for many beats per minute you acquire, Get subtitling in real time.

Los métodos antes citados presentan los siguientes inconvenientes:The aforementioned methods present the following drawbacks:

En el caso de la estenotipia y el velotype:In the case of stenotypy and velotype:

\bullet Se requiere un teclado específico con una distribución de teclas asociadas a un programa informático que descifra lo que se escribe.A specific keyboard is required with a distribution of keys associated with a computer program that Unscramble what is written.

\bullet Se requiere, si no existe en el mercado, como es el caso de muchas lenguas, la creación de un método de enseñanza y de una distribución de teclas adecuada a cada lengua y un software adecuado a cada lengua.It is required, if it does not exist in the market, as is the case with many languages, creating a teaching method and a key distribution appropriate to each  language and software appropriate to each language.

\bullet Se requiere un usuario muy especializado y muy formado, teniendo en cuenta que si se quiere desde el principio será necesaria solo para empezar una formación mínima durante dos años, a dos horas diarias.A very required user is required specialized and very trained, considering that if you want from the beginning it will be necessary just to start a training minimum for two years, two hours a day.

\bullet Supone un coste muy alto en recursos humanos y equipo de trabajo.It implies a very high cost in resources Human and work team.

En el caso del teclado normal de ordenador utilizado por un solo usuario:In the case of the normal computer keyboard used by a single user:

\bullet Es imposible que un solo usuario transcriba a tiempo real lo que está oyendo, y que no es capaz de mecanografiar a la velocidad habitual de la voz hablada.It is impossible for a single user Transcribe in real time what you are hearing, and that you are not able to type at the usual speed of the spoken voice.

Descripción de la invenciónDescription of the invention

El objetivo de la presente invención es resolver los inconvenientes mencionados referidos al procedimiento para la subtitulación simultánea, desarrollando un sistema para la subtitulación o trascripción de voz a texto en tiempo real por distribución de tareas.The objective of the present invention is to solve the aforementioned inconveniences related to the procedure for simultaneous subtitling, developing a system for subtitling or transcription of voice to text in real time by distribution of tasks.

De acuerdo con este objetivo, el sistema de la presente invención comprende medios de escucha de la conversación que se está emitiendo, medios de introducción de caracteres alfanuméricos en un ordenador, medios de reproducción en pantalla de los caracteres alfanuméricos introducidos y medios de procesamiento y se caracteriza por el hecho de que comprende una pluralidad de estaciones de trabajo asignadas a una pluralidad de usuarios que trabajan en paralelo, por el hecho de que dichos medios de procesamiento comprenden dos aplicaciones, una de gestión y una de usuario, por el hecho de que dicha aplicación de usuario comprende un medio transcriptor, y por el hecho de que dicha aplicación de gestión comprende un medio temporizador de diferentes fragmentos de texto hablado, un medio distribuidor de dichos fragmentos de texto, y un medio contenedor que genera un mensaje a partir de dichos fragmentos de texto, de modo que se lleva a cabo la trascripción de dicho texto hablado con el trabajo en paralelo de dicha pluralidad de usuarios.In accordance with this objective, the system of The present invention comprises means of listening to the conversation being broadcast, character input media alphanumeric on a computer, playback media on screen of the alphanumeric characters entered and means of processing and is characterized by the fact that it comprises a plurality of workstations assigned to a plurality of users working in parallel, due to the fact that these processing means comprise two applications, one of management  and a user, due to the fact that said user application it comprises a transcription means, and by the fact that said management application comprises a different timer means fragments of spoken text, a medium distributor of said text fragments, and a container medium that generates a message to from said text fragments, so that it is carried out the transcription of said spoken text with parallel work of said plurality of users.

Esta característica permite distribuir la tarea de la subtitulación en tiempo real entre varios usuarios y pueden por tanto, trabajar en paralelo. Cada usuario recibe un fragmento breve de texto hablado a transcribir, se recompone el conjunto de estas transcripciones, se convierten en líneas de subtitulación que son enviadas sucesivamente al dispositivo de salida.This feature allows you to distribute the task of real-time subtitling among multiple users and can Therefore, work in parallel. Each user receives a fragment short of spoken text to transcribe, the set of these transcripts become subtitling lines that They are sent successively to the output device.

El dispositivo de salida está en función de cuál sea la aplicación concreta que se dé al sistema, ya que el mismo puede utilizarse en distintos entornos. La aplicación más corriente seguramente sea la subtitulación mediante teletexto de programas de televisión en directo. En este caso el mecanismo de salida será un dispositivo insertador de la señal de teletexto. Otra posible aplicación es la subtitulación de actos públicos, como discursos, seminarios, debates. En este caso el mecanismo de salida puede ser una pantalla o display de gran tamaño. Otra aplicación podría utilizarse también para guardar registro escrito o levantar acta de reuniones y deliberaciones. En este caso el mecanismo de salida puede ser una impresora. La relación de dispositivos de salida no es exhaustiva.The output device is a function of which be the concrete application that is given to the system, since the same It can be used in different environments. The most common application surely it is the subtitling by means of teletext of programs of live television In this case the exit mechanism will be a Teletext signal insertion device. Other possible application is the subtitling of public events, such as speeches, Seminars, debates. In this case the exit mechanism can be a large screen or display. Another application could also be used to keep written record or record minutes of meetings and deliberations. In this case the exit mechanism It can be a printer. The ratio of output devices does not It is exhaustive.

El hecho de presentar dos aplicaciones dentro del mismo sistema permite diferenciar entre los módulos de gestión interna y los módulos de gestión externa a la que son accesibles los usuarios.The fact of presenting two applications within the  same system allows to differentiate between the management modules internal and external management modules to which they are accessible the users.

El sistema permite que exista una pluralidad de usuarios que transcriben en paralelo en los teclados de ordenador, los diferentes fragmentos del texto escuchado durante un período de tiempo. Este hecho permite que con un corto período de tiempo de aprendizaje, el sistema pueda ponerse en marcha ya que sólo hace falta disponer de buenos mecanógrafos con un buen conocimiento de la lengua.The system allows a plurality of users that transcribe in parallel on computer keyboards, the different fragments of the text heard during a period of weather. This fact allows with a short period of time to learning, the system can get going since it only does lack of good typists with a good knowledge of language.

Además, dicho sistema se caracteriza por el hecho de que los diferentes tiempos de funcionamiento son parametrizables.In addition, said system is characterized by the fact  that the different operating times are Parameterizable.

La duración del tiempo de cada fragmento a transcribir. Fragmentos más cortos son más fáciles de recordar y rápidos de transcribir, pero producen más conflictos de transición entre uno y otro fragmento.The length of time of each fragment a transcribe. Shorter fragments are easier to remember and fast to transcribe, but produce more transition conflicts between one and another fragment.

La duración del eventual solape entre los fragmentos de usuarios consecutivos. Este solape tiene por objeto disminuir el riesgo de que una palabra a caballo entre dos fragmentos resulte ignorada.The duration of the eventual overlap between Fragments of consecutive users. This overlap is intended decrease the risk of a word riding between two Fragments are ignored.

La duración del período de aviso, que se traduce en la aparición de un color amarillo en el terminal del cliente.The duration of the notice period, which is translated in the appearance of a yellow color in the terminal of client.

Ventajosamente, dicho sistema se caracteriza por el hecho de que la aplicación de gestión comprende un medio "temporizador", un medio "distribuidor" y un medio "contenedor".Advantageously, said system is characterized by the fact that the management application comprises a means "timer", a medium "distributor" and a medium "container".

Adicionalmente, dicho sistema se caracteriza por el hecho de que el medio "temporizador", genera y envía las señales de sincronismo y los identificadores de secuencia a los usuarios de las estaciones de trabajo.Additionally, said system is characterized by the fact that the "timer" means generates and sends the synchronization signals and sequence identifiers at Workstation users.

Las primeras activarán en los terminales de las estaciones de trabajo, los colores del "semáforo" de control. Los identificadores de secuencia se adjuntan a los fragmentos de texto para permitir recomponerlos en el orden correcto.The first will activate in the terminals of the Workstations, the colors of the "traffic light" control. Sequence identifiers are attached to fragments of text to allow recomposing them in the correct order.

Ventajosamente, dicho sistema se caracteriza por el hecho de que el medio "distribuidor", recibe los fragmentos de mensajes de los terminales de las estaciones de trabajo, y retransmite cada uno de ellos a los terminales anterior y posterior en secuencia.Advantageously, said system is characterized by the fact that the medium "distributor" receives the fragments of messages from workstation terminals, and relay each of them to the front and rear terminals in sequence.

Este hecho permite que los fragmentos de texto aparezcan en las ventanas adjuntas y sirvan de guía de principio y fin del fragmento a transcribir. También envía los fragmentos completos al medio "contenedor" para su proceso.This fact allows text fragments appear in the attached windows and serve as a guiding principle and end of the fragment to be transcribed. Also send the fragments complete to medium "container" for its process.

Adicionalmente, dicho sistema se caracteriza por el hecho de que el medio "contenedor", recibe los fragmentos completos del texto, los ordena según su número de secuencia, los agrupa y corta las líneas según el ancho de la ventana, genera el mensaje en el formato adecuado y lo envía al dispositivo de salida.Additionally, said system is characterized by the fact that the medium "container" receives the fragments complete of the text, order them according to their sequence number, group and cut the lines according to the width of the window, generate the message in the appropriate format and sends it to the device exit.

Este medio permite también efectuar ciertas comprobaciones y correcciones en los textos, procesa los códigos que identifican al hablante en caso de diálogos y los substituye por colores o el símbolo o abreviatura convenidos. Muestra una interface para el administrador o supervisor del sistema, que contiene los siguientes elementos:This means also allows certain checks and corrections in texts, process codes that identify the speaker in case of dialogues and replace them by colors or the agreed symbol or abbreviation. Show one interface for the system administrator or supervisor, which It contains the following elements:

1.one.
Ventana de subtítulos, que muestra en tiempo real los que se van enviando al dispositivo de salida.Caption window, which shows in real time those that are sent to the device exit.

2.2.
Ventana de la siguiente línea en preparación.Next line window in preparation.

3.3.
Ventana de las líneas pendientes de envío.Window of the pending lines of Shipping.

4.Four.
Selector de programa o cadena de televisión (para el caso de teletexto).Program selector or chain television (in the case of teletext).

5.5.
Selector de salida al aire o trabajo en local.Selector of exit to the air or work in local.

6.6.
Lista de clientes conectados, con posibilidad de desactivar a cualquiera de ellos, quitándolo de la secuencia.List of connected clients, with the possibility of deactivating anyone of them, removing it from the sequence.

7.7.
Ventana de registro de entrada de mensajes, para comprobación y depuración del programa.Entry Registration Window messages, for checking and debugging the program.

Ventajosamente, dicho sistema se caracteriza por el hecho de que el medio "transcriptor", comprende en la pantalla:Advantageously, said system is characterized by the fact that the means "transcriber" comprises in the screen:

\bullet?
una ventana tipo "semáforo" de color uniforme que da órdenes al usuario de la estación de trabajo a través de distintos códigos de colores;a "traffic light" type window of uniform color that gives orders to the user of the station work through different color codes;

\bullet?
una ventana para introducir el texto a transcribir;.a window to enter the text to transcribe ;.

\bullet?
una ventana informativa que muestra lo que está introduciendo el usuario de la estación de trabajo anterior a la secuencia;an informational window that shows what the user of the station is entering pre-sequence work;

\bullet?
una ventana informativa que muestra lo que está introduciendo el usuario de la estación de trabajo posterior a la secuencia;an informational window that shows what the user of the station is entering post sequence work;

\bullet?
un código identificador de la estación de trabajo conectada; yan identifier code of the connected workstation; Y

\bullet?
un selector que permite activar o desactivar el terminal de la estación de trabajo de la secuencia de usuarios.a selector that allows you to activate or deactivate the workstation terminal of the sequence of users.

Este medio "transcriptos" permite al usuario mecanógrafo de la estación de trabajo, ausentarse sin alterar el funcionamiento del conjunto.This means "transcripts" allows the user  typist of the workstation, absent without altering the set operation.

El código de colores de la ventana tipo semáforo es:The color code of the traffic light window is:

\bullet?
amarillo ("termine de transcribir el fragmento anterior y prepárese para escuchar el fragmento que deberá transcribir a continuación"),yellow ("finish transcribe the above fragment and prepare to listen to the fragment to be transcribed next "),

\bullet?
rojo ("lo que escucha ahora es el fragmento que debe transcribir desde este mismo momento"),red ("what you hear now is the fragment that must be transcribed from it moment"),

\bullet?
verde ("puede continuar transcribiendo el fragmento que ha escuchado en el período rojo"), ygreen ("can continue transcribing the fragment you heard in the period Red and

\bullet?
azul ("el sistema le está esperando").blue ("the system is waiting").

Además, indica la información del identificador de secuencia del mensaje que se está introduciendo.In addition, it indicates the identifier information Sequence of the message being entered.

En la presente invención por "medios de escucha" se entiende cualquier dispositivo mediante el cual un usuario es capaz de oír un fragmento de texto incluyendo, pero no limitándose, a un auricular.In the present invention by "means of listen "means any device by which a user is able to hear a piece of text including, but not limited to a headset.

En la presente invención por "medios de introducción de caracteres alfanuméricos" se entiende cualquier dispositivo mediante el cual un usuario puede transcribir un texto incluyendo, pero no limitándose, a un teclado.In the present invention by "means of introduction of alphanumeric characters "means any device through which a user can transcribe a text including, but not limited to, a keyboard.

En la presente invención por "medios de reproducción" se entiende cualquier dispositivo mediante el cual un usuario puede visualizar un texto incluyendo, pero no limitándose, a una pantalla de ordenador.In the present invention by "means of reproduction "means any device by which a user can view a text including, but not limited to a computer screen.

Breve descripción de los dibujosBrief description of the drawings

Para mayor comprensión de cuanto se ha expuesto, se acompañan los dibujos en los que, esquemáticamente y solo a título de ejemplo no limitativos, se representa una realización preferida del sistema para la subtitulación.For more understanding of how much has been exposed, the drawings are accompanied in which, schematically and only to non-limiting example title, an embodiment is represented Preferred system for subtitling.

En la figura 1, se muestra una distribución genérica de componentes, para la subtitulación o trascripción de voz a texto en tiempo real, por distribución de tareas.In figure 1, a distribution is shown generic components, for subtitling or transcription of voice to text in real time, by distribution of tasks.

En la figura 2, se muestra una distribución de componentes en un ejemplo real, en el que se pretende mostrar una arquitectura de componentes, para la subtitulación o trascripción de voz en tiempo real, a subtítulos de teletexto en una salida de TV, en tiempo real, por distribución de tareas.In Figure 2, a distribution of components in a real example, in which it is intended to show a component architecture, for subtitling or transcription real-time voice, to teletext subtitles on an output of TV, in real time, by distribution of tasks.

Descripción de una realización preferidaDescription of a preferred embodiment

El sistema que aquí se expone lo soluciona permitiendo distribuir esta tarea entre varios usuarios, que de este modo pueden trabajar en paralelo. Permite efectuar esta distribución, asignando de modo automático a cada usuario un fragmento breve de texto hablado a transcribir, y recompone el conjunto de estas transcripciones, convirtiéndolo en líneas de subtitulación que envía sucesivamente al mecanismo de salida.The system presented here solves it allowing to distribute this task among several users, which of This mode can work in parallel. Lets make this distribution, automatically assigning each user a brief fragment of spoken text to transcribe, and recomposes the set of these transcripts, turning it into lines of subtitling that sends successively to the output mechanism.

Este mecanismo de salida depende de cuál sea la aplicación concreta que se dé al sistema, ya que el mismo puede utilizarse en distintos entornos. Así por ejemplo:This output mechanism depends on what the concrete application given to the system, since it can be used in different environments For example:

\bullet La aplicación más corriente seguramente sea la subtitulación mediante teletexto de programas de televisión en directo. En este caso el mecanismo de salida será un dispositivo insertador de la señal de teletexto.The most common application surely be the subtitling by teletext of television programs live. In this case the exit mechanism will be a device Teletext signal inserter.

\bullet Otra posible aplicación es la subtitulación de actos públicos, como discursos, seminarios, debates. En este caso el mecanismo de salida puede ser una pantalla o display de gran tamaño.Another possible application is the subtitling of public events, such as speeches, seminars, debates. In this case the output mechanism can be a screen or large display.

\bullet Podría utilizarse también para guardar registro escrito o levantar acta de reuniones y deliberaciones. En este caso el mecanismo de salida puede ser una impresora.It could also be used to save Written record or record minutes of meetings and deliberations. In In this case, the output mechanism can be a printer.

La anterior relación no es exhaustiva, sino que sólo pretende mostrar algunas de las aplicaciones prácticas.The previous relationship is not exhaustive, but It only pretends to show some of the practical applications.

El sistema permite que el número de usuarios mecanógrafos de las estaciones de trabajo sea cualquiera, aunque las pruebas realizadas demuestran que el número ideal se sitúa entre cuatro o cinco y permite parametrizar los siguientes tiempos de funcionamiento:The system allows the number of users typists of workstations are any, though the tests carried out show that the ideal number is between four or five and allows parameterizing the following times operating:

\bullet La duración del tiempo de cada fragmento a transcribir. Fragmentos más cortos son más fáciles de recordar y rápidos de transcribir, pero producen más conflictos de transición entre uno y otro fragmento.The length of time of each fragment to transcribe. Shorter fragments are easier to remember and quick to transcribe, but produce more conflicts of transition between one and another fragment.

\bullet La duración del eventual solape entre los fragmentos de usuarios consecutivos. Este solape tiene por objeto disminuir el riesgo de que una palabra a caballo entre dos fragmentos resulte ignorada.The duration of the eventual overlap between Fragments of consecutive users. This overlap has for object decrease the risk of a word riding between two Fragments are ignored.

\bullet La duración del período de aviso, que se traduce en la aparición de un color amarillo en el terminal del cliente.The duration of the notice period, which it results in the appearance of a yellow color in the terminal of the client.

Así, por ejemplo, en el caso de que haya cinco usuarios mecanografiando y que las fracciones de tiempo asignadas sean de tres segundos, cada usuario mecanógrafa dispone de un total de quince segundos para transcribir lo que ha oído en los tres segundos iniciales.Thus, for example, in case there are five typing users and that the fractions of time allocated be three seconds, each typist user has a total fifteen seconds to transcribe what you've heard in all three initial seconds

El sistema informático consta de dos partes: el servidor y los clientes.The computer system consists of two parts: the Server and clients.

El servidor contiene los módulos que gestionan los fragmentos de textos introducidos por las usuarios mecanógrafos y los envían al dispositivo de salida.The server contains the modules that manage text fragments introduced by typists users and send them to the output device.

En concreto, el servidor contiene tres módulos, que pueden residir en un único ordenador o en ordenadores distintos:Specifically, the server contains three modules, that can reside in a single computer or in computers different:

1. Módulo "temporizador": Genera y envía las señales de sincronismo y los identificadores de secuencia a los clientes. Las primeras activarán en los terminales clientes los colores del "semáforo" de control. Los identificadores de secuencia se adjuntan a los fragmentos de texto para permitir recomponerlos en el orden correcto.1. "Timer" module: Generates and sends the  synchronization signals and sequence identifiers at customers. The first ones will activate in the client terminals the "traffic light" control colors. The identifiers of sequence are attached to text fragments to allow recompose them in the correct order.

2. Módulo "distribuidor": recibe los fragmentos de mensajes que envían los terminales clientes y a su vez retransmite cada uno de ellos a los terminales anterior y posterior en secuencia, para que aparezcan en las ventanas adjuntas y sirvan de guía de principio y fin del fragmento a transcribir. También envía los fragmentos completos al módulo "Contenedor" para su proceso.2. Module "distributor": receives the message fragments sent by the client terminals and to their once retransmits each of them to the previous terminals and later in sequence, so that they appear in the attached windows and serve as a guide for the beginning and end of the fragment to be transcribed. It also sends the complete fragments to the "Container" module for your process

3. Módulo "contenedor": Recibe los mensajes completos, los ordena según su número de secuencia, agrupa y corta las líneas según el ancho de la ventana de teletexto, efectúa ciertas comprobaciones y correcciones en los textos, procesa los códigos que identifican al hablante en caso de diálogos y los substituye por colores o el símbolo o abreviatura convenidos, genera el mensaje en el formato adecuado y lo envía al dispositivo de salida.3. "Container" module: Receive the messages complete, sort them according to their sequence number, group and cut the lines according to the width of the teletext window, effect certain checks and corrections in the texts, processes the codes that identify the speaker in case of dialogues and the replace with colors or the agreed symbol or abbreviation, generates the message in the appropriate format and sends it to the device output

Además, el módulo "contenedor" muestra una interface para el administrador o supervisor del sistema, que contiene los siguientes elementos:In addition, the "container" module shows a interface for the system administrator or supervisor, which It contains the following elements:

1. Ventana de subtítulos, que muestra en tiempo real los que se van enviando al dispositivo de salida.1. Subtitles window, which shows in time real those that are sent to the output device.

2. Ventana de la siguiente línea en preparación.2. Window of the next line in preparation.

3. Ventana de las líneas pendientes de envío.3. Window of pending delivery lines.

4. Selector de programa o cadena de televisión (para el caso de teletexto).4. Program selector or television network (in the case of teletext).

5. Selector de salida al aire o trabajo en local.5. Selector of exit to the air or work in local.

6. Lista de clientes conectados, con posibilidad de desactivar a cualquiera de ellos, quitándolo de la secuencia.6. List of connected clients, with possibility of deactivating any of them, removing it from the sequence.

7. Ventana de registro de entrada de mensajes, para comprobación y depuración del programa.7. Message entry log window, for checking and debugging the program.

En funcionamiento normal suele haber unos cuatro o cinco terminales cliente. En cada uno de ellos se ejecuta un único módulo "transcriptor", que ofrece una interface al usuario mecanógrafo, con los siguientes elementos:In normal operation there are usually about four or five client terminals. In each one of them a only "transcriber" module, which offers an interface to typist user, with the following elements:

1. Ventana "semáforo" de color uniforme que puede ser: amarillo ("termine de transcribir el fragmento anterior y prepárese para escuchar el fragmento que deberá transcribir a continuación"), rojo ("lo que escucha ahora es el fragmento que debe transcribir desde este mismo momento"), verde ("puede continuar transcribiendo el fragmento que ha escuchado en el período rojo") o azul ("el sistema le está esperando").1. "Traffic light" window of uniform color that it can be: yellow ("finish transcribing the fragment previous and get ready to hear the fragment you should transcribe below "), red (" what you hear now is the fragment that you must transcribe from this moment "), green ("you can continue transcribing the fragment that has heard in the red period ") or blue (" the system is waiting").

2. Ventana para introducir el texto a transcribir.2. Window to enter the text to transcribe.

3. Ventana informativa que muestra lo que está introduciendo el cliente anterior en la secuencia.3. Information window that shows what is entering the previous client in the sequence.

4. Ventana informativa que muestra lo que está introduciendo el cliente posterior en la secuencia.4. Information window that shows what is entering the subsequent client in the sequence.

5. Código identificador del usuario que está conectado en el terminal cliente.5. User identifier code that is Connected in the client terminal.

6. Información del identificador de secuencia del mensaje que se está introduciendo.6. Sequence Identifier Information  message being entered

7. Selector que permite activar o reactivar el terminal de la secuencia de clientes, para permitir al usuario mecanógrafo ausentarse sin alterar el funcionamiento del conjunto.7. Selector that allows to activate or reactivate the terminal of the client sequence, to allow the user typist absent without altering the operation of the set.

En la figura 1, se diferencian dos partes: una primera referente a la distribución de audio, que se compone de un distribuidor de audio (1) y un auricular (3) en cada estación de trabajo (6). La segunda parte es una red de computadoras que une el conjunto de estaciones de subtitulado (5) con el servidor (7) encargado de la supervisión y control. El servidor (7) es el encargado de enviar el resultado a un dispositivo de salida (8).In Figure 1, two parts are distinguished: one first referring to the audio distribution, which is composed of a audio distributor (1) and a headset (3) at each station work (6). The second part is a computer network that unites the set of subtitling stations (5) with the server (7) in charge of supervision and control. The server (7) is the responsible for sending the result to an output device (8).

En la figura 2, se diferencian 3 partes: la primera parte corresponde a la señal de audio que se describe en la figura anterior. La segunda parte corresponde a una red de computadoras tal como describe la figura anterior, siendo en este caso el dispositivo de salida (8) un insertador de teletexto. La tercera parte corresponde a la distribución de la señal de vídeo, que se compone de un distribuidor de vídeo (2) que da servicio a cada estación de subtitulado (5), con un monitor (4). El distribuidor de vídeo (2) distribuye la señal de vídeo conmutada en el selector de vídeo: con el sintonizador de TV a través de una antena o un cable, o bien un sistema VTR que reproduce imágenes en cinta de vídeo. A fin de supervisar y controlar la recepción de los subtítulos, se conecta un TV a la salida del sistema.In Figure 2, 3 parts are distinguished: First part corresponds to the audio signal described in the previous figure. The second part corresponds to a network of computers as described in the previous figure, being in this case the output device (8) a teletext inserter. The third part corresponds to the distribution of the video signal, which consists of a video distributor (2) that serves each subtitling station (5), with a monitor (4). He video distributor (2) distributes the switched video signal in the video selector: with the TV tuner through a antenna or cable, or a VTR system that reproduces images in video tape. In order to supervise and control the reception of subtitles, a TV is connected to the system output.

Claims (5)

1. Sistema para la subtitulación o trascripción de voz a texto en tiempo real que comprende medios de escucha (3) de la conversación que se está emitiendo, medios de introducción de caracteres alfanuméricos (5) en un ordenador, medios de reproducción (4) en pantalla de los caracteres alfanuméricos introducidos y medios de procesamiento (7), caracterizado por el hecho de que comprende una pluralidad de estaciones de trabajo (6) asignadas a una pluralidad de usuarios que trabajan en paralelo, por el hecho de que dichos medios de procesamiento comprenden dos aplicaciones, una de gestión y una de usuario, por el hecho de que dicha aplicación de usuario comprende un medio transcriptor, y por el hecho de que dicha aplicación de gestión comprende un medio temporizador de diferentes fragmentos de texto hablado, un medio distribuidor de dichos fragmentos de texto, y un medio contenedor que genera un mensaje a partir de dichos fragmentos de texto, de modo que se lleva a cabo la trascripción de dicho texto hablado con el trabajo en paralelo de dicha pluralidad de usuarios.1. System for subtitling or transcription of voice to text in real time comprising listening means (3) of the conversation being broadcast, means for entering alphanumeric characters (5) on a computer, playback means (4) on the screen of the introduced alphanumeric characters and processing means (7), characterized by the fact that it comprises a plurality of workstations (6) assigned to a plurality of users working in parallel, by the fact that said means of processing comprises two applications, one of management and one of user, by the fact that said user application comprises a transcription means, and by the fact that said management application comprises a timer means of different spoken text fragments, a medium distributor of said text fragments, and a container medium that generates a message from said text fragments, so that the transfer is carried out ription of said spoken text with the parallel work of said plurality of users. 2. Sistema según la reivindicación 1, caracterizado por el hecho de que el medio temporizador genera y envía las señales de sincronismo y los identificadores de secuencia a los usuarios de las estaciones de trabajo (6).2. System according to claim 1, characterized in that the timer means generates and sends the synchronization signals and sequence identifiers to the users of the workstations (6). 3. Sistema según la reivindicación 1, caracterizado por el hecho de que el medio distribuidor recibe los fragmentos de mensajes de los terminales de usuario (6), y retransmite cada uno de ellos a los terminales anterior y posterior en secuencia.3. System according to claim 1, characterized in that the distributor means receives the message fragments from the user terminals (6), and each retransmits them to the previous and subsequent terminals in sequence. 4. Sistema según la reivindicación 1, caracterizado por el hecho de que el medio contenedor recibe los fragmentos completos de texto, los ordena según su número de secuencia, los agrupa y corta las líneas según el ancho de la ventana y, una vez generado el mensaje, lo envía al dispositivo de salida (8).4. System according to claim 1, characterized in that the container medium receives the complete text fragments, sorts them according to their sequence number, groups them and cuts the lines according to the width of the window and, once generated the message, sends it to the output device (8). 5. Sistema según la reivindicación 1, caracterizado por el hecho de que el medio trascriptor comprende en la pantalla:5. System according to claim 1, characterized in that the transcription means comprises on the screen:
\bullet?
una ventana tipo "semáforo" de color uniforme que da órdenes al usuario de la estación de trabajo (6) a través de distintos código de colores;a "traffic light" type window of uniform color that gives orders to the user of the station work (6) through different color codes;
\bullet?
una ventana para introducir el texto a transcribir;a window to enter the text to transcribe;
\bullet?
una ventana informativa que muestra lo que está introduciendo el usuario de la estación de trabajo (6) anterior a la secuencia;an informational window that shows what the user of the station is entering work (6) prior to the sequence;
\bullet?
una ventana informativa que muestra lo que está introduciendo el usuario de la estación de trabajo (6) posterior a la secuencia;an informational window that shows what the user of the station is entering work (6) after the sequence;
\bullet?
un código identificador de la estación de trabajo (6) conectada;an identifier code of the connected workstation (6);
\bullet?
un selector que permite activar o desactivar el terminal de la secuencia de estaciones de trabajo (6).a selector that allows you to activate or disable the workstation sequence terminal (6).
ES200400276A 2004-02-09 2004-02-09 SYSTEM FOR THE SUBTITLE OR TRANSACTION OF VOICE TO TEXT IN REAL TIME BY DISTRIBUTION OF TASKS. Expired - Fee Related ES2246123B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
ES200400276A ES2246123B1 (en) 2004-02-09 2004-02-09 SYSTEM FOR THE SUBTITLE OR TRANSACTION OF VOICE TO TEXT IN REAL TIME BY DISTRIBUTION OF TASKS.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
ES200400276A ES2246123B1 (en) 2004-02-09 2004-02-09 SYSTEM FOR THE SUBTITLE OR TRANSACTION OF VOICE TO TEXT IN REAL TIME BY DISTRIBUTION OF TASKS.

Publications (2)

Publication Number Publication Date
ES2246123A1 true ES2246123A1 (en) 2006-02-01
ES2246123B1 ES2246123B1 (en) 2006-11-16

Family

ID=35875072

Family Applications (1)

Application Number Title Priority Date Filing Date
ES200400276A Expired - Fee Related ES2246123B1 (en) 2004-02-09 2004-02-09 SYSTEM FOR THE SUBTITLE OR TRANSACTION OF VOICE TO TEXT IN REAL TIME BY DISTRIBUTION OF TASKS.

Country Status (1)

Country Link
ES (1) ES2246123B1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4953088A (en) * 1986-10-27 1990-08-28 Sharp Kabushiki Kaisha Sentence translator with processing stage indicator
US6366882B1 (en) * 1997-03-27 2002-04-02 Speech Machines, Plc Apparatus for converting speech to text
US20030050777A1 (en) * 2001-09-07 2003-03-13 Walker William Donald System and method for automatic transcription of conversations

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4953088A (en) * 1986-10-27 1990-08-28 Sharp Kabushiki Kaisha Sentence translator with processing stage indicator
US6366882B1 (en) * 1997-03-27 2002-04-02 Speech Machines, Plc Apparatus for converting speech to text
US20030050777A1 (en) * 2001-09-07 2003-03-13 Walker William Donald System and method for automatic transcription of conversations

Also Published As

Publication number Publication date
ES2246123B1 (en) 2006-11-16

Similar Documents

Publication Publication Date Title
US10186170B1 (en) Text caption error correction
Powell Dynamic presentations
McKain Not necessarily not the news: Gatekeeping, remediation, and The Daily Show
Zárate Captioning and subtitling for d/deaf and hard of hearing audiences
ES2802540T3 (en) Multilingual audio device and method for attractions
WO2005017674A3 (en) Method and system for providing conferencing services
CN105657469A (en) Online crowd funding method, platform and system based on network video broadcast
AR041812A1 (en) A COMMUNICATIONS DEVICE TO PROVIDE MULTIMEDIA IN A GROUP COMMUNICATIONS NETWORK
MXPA04003915A (en) Methods for multicasting content.
CN101763756A (en) Interactive intelligent foreign language dictation training system and method based on network
ES2246123B1 (en) SYSTEM FOR THE SUBTITLE OR TRANSACTION OF VOICE TO TEXT IN REAL TIME BY DISTRIBUTION OF TASKS.
US3674936A (en) Voice conference system
BARBER Fake News or Engaging Storytelling
Allan Old Media/New Futures: Revolutionary Reverberations of Fanon's Radio
CN109905756A (en) TV subtitling dynamic creation method and relevant device based on artificial intelligence
Lambourne Subtitle respeaking
JP2001036488A (en) Stenographic character input device for caption broadcast and its method
Homma et al. New real-time closed-captioning system for Japanese broadcast news programs
Orero Real-time subtitling in Spain
Gulomaliev The Wakhi language: Marginalisation and endangerment
Morettini Profiling deaf and hard-of-hearing users of subtitles for the deaf and hard-of-hearing in Italy: a questionnaire-based study
US20220150597A1 (en) Interactive electronic libretto/translation hd display interface apparatus and method
CN109033099A (en) A kind of multi-media management method and device
Katchen World Service Television: ELT Resource for Asia.
De Korte Live inter-lingual subtitling in the Netherlands

Legal Events

Date Code Title Description
EC2A Search report published

Date of ref document: 20060201

Kind code of ref document: A1

FG2A Definitive protection

Ref document number: 2246123B1

Country of ref document: ES

PC2A Transfer of patent

Owner name: CORPORACIO CATALANA DE MITJANS AUDIOVISUALS, S.A.

Effective date: 20180131

FD2A Announcement of lapse in spain

Effective date: 20240226