Sintetizadores del habla con voces rusas. El mejor sintetizador del habla.

Recientemente, obtuve el problema de seleccionar el discurso de voz sintetizadora. Los requisitos básicos son el soporte de la lengua rusa y la pronunciación más o menos normal.
Para aquellos que no son conscientes de lo que el sintetizador del habla, le diré: este es un programa especial, cuyo significado es convertir el texto escrito al discurso oral. Esta es la llamada síntesis.
¿Por qué es necesario? Bueno, por ejemplo, cuando necesita grabar un mensaje de voz en una voz extraña. Puede ser útil para los extranjeros para escuchar la pronunciación de una palabra en particular. El discurso de sintetizador es fácil de leer cuando necesita incluir un cuento de hadas que no está en audiolibros. Y en general, hay todos los sitios.
Entonces, en el proceso de elección, encontré varias herramientas muy útiles, incluido el trabajo en línea con el apoyo de la lengua rusa y ahora te contaré sobre ellos.

traductor de Google

Aquí hay un producto verdaderamente multiuso que se puede utilizar de manera completamente diferente. Ventajas principales:
- Este es un servicio completamente gratuito;
- Operación en línea sin instalación. Solo se necesita acceso;
- En mi opinión, este sintetizador de voz tiene el mejor módulo de voz, más cercano a natural;
- Probablemente el mejor equipo de desarrollo y apoyo técnico en el mundo;
- El mayor número de lenguajes soportados.
Desafortunadamente, la opción de voz es solo una mujer. No encontré una opción.

RHVOICE.

Excelente discurso de sintetizador multilingüe del desarrollador ruso - Olga Yakovlev. Hay versiones para ambos sistemas operativos Windows y Linux. El desarrollador del sintetizador es Olga Yakovlev. El programa se distribuye completamente gratuito y está disponible en el sitio web oficial en dos versiones: como una versión independiente compatible con SAPI5 y como un módulo para un programa de acceso de pantalla NVDA gratuito. Este sintetizador de voz de voz es capaz de expresar textos rusos en tres votos: Elena, Irina y Alexander.

ACAPELA.

Acapela es quizás uno de los sintetizadores de voz más populares y comunes del mundo. La característica principal es una vocación de textos por más de treinta en el mundo. Si considera ruso, entonces hay dos voces disponibles: Nikolai y Alena. Además, este último es más perfecto y natural en términos de pronunciación. En el modo de demostración, solo la voz de Alena está disponible en el sitio.
El programa está disponible para descargar en el sitio web oficial y apoya todos los sistemas operativos modernos populares: Windows, Linux, Mac. Incluso hay versiones para Android u iOS.

Vokalizer.

La voz de las mujeres Milena es otro motor de sintetizador de voz muy popular del matiz: es de muy alta calidad y, naturalmente, suena. Puede escucharlo en centros de llamadas y en varios sistemas de voz de red, así como en varias aplicaciones de aplicaciones, como Moon + Reader Pro, ID de llamadas de pantalla completa, Reader Cool, en programas de navegación TomTom, Igo Primo.
Entre las ventajas se puede observar la posibilidad de instalar varios diccionarios, control de volumen, acento y velocidad de lectura.
El código del programa está abierto, puede descargarlo de forma gratuita en el sitio web oficial, así como el instalador del programa en sí.

Festival

El festival no es solo otro sintetizador de voz de voz, y ya un reconocimiento de sistema completo y síntesis de habla con varias API. Desarrollador - Centro de Investigación para Tecnologías de Discurso de la Universidad de Edimburgo.
El festival está diseñado para soportar múltiples idiomas. El incumplimiento es compatible inglés, galés y español. Pero hay una oportunidad para conectar paquetes de voz de otros idiomas: checo, finlandés, hindi, italiano, marathi, polaco, ruso y telugu.
El código del programa está abierto, el propio sintetizador de voz se distribuye bajo la licencia de código abierto y está disponible solo para sistemas operativos Linux. Es cierto que hay una versión portátil de Makintosh.

Espeak

Último en mi revisión Sistema de síntesis de discurso: el programa de espaeak ya se está desarrollando durante aproximadamente 8 años. La última versión es 1.48.04 del 6 de abril de 2014. Este sintetizador de voz es una multiplataforma, hay versiones en Windows, Linux, Mac OS X e incluso bajo RISC OS, aunque los últimos dos no han sido compatibles con un largo tiempo.
Por separado, observo que el eje se usa en los sistemas operativos móviles de Android, la verdad tiene una serie de errores significativos.
El programa admite cincuenta idiomas diferentes, cuyo soporte se especifica al instalar el programa.
Una de las principales minuses es un sintetizador de voz: generación de voz solo en el archivo Formato WAV. Puede descargar el programa de forma gratuita en el sitio web oficial.

Desde mí solo agregaré que me gustaba RHVOICE y VOKALIZER, aunque aquí en mucho, es un individuo y en gran parte depende de lo que quieras obtener. Así que prueba, pone y mira. Creo que una de las opciones presentadas debe ser adecuada para usted.

Para: Wikipedia: Artículos sin imágenes (Tipo: No especificado) Para: Software desarrollado en 2006

espeak Este es un sintetizo de expresión gratuito compacto que admite lenguaje de marcado de síntesis de voz (SSML).

Os

Las versiones ESPAAK existen para tales sistemas operativos, ya que Microsoft Windows, Mac OS X, Linux, RISC OS y su código fuente en C ++ está disponible. Además, la documentación oficial Synthesizer proporciona una instrucción sobre la compilación en Windows Mobile. El programa tiene un límite significativo: la generación de votos es posible solo en el archivo WAV.

Además, el ESPAEK se utiliza en los sistemas operativos móviles de Android, comenzando con la versión 1.6 y Maemo, pero estos proyectos no son supervisados \u200b\u200bpersonalmente por el desarrollador personalmente, y no hay paquetes apropiados en el sitio web oficial de Espeak, y el dispositivo Android tiene Un número de errores significativos al trabajar en algunos idiomas, en particular y ruso.

Idiomas soportados

el ESPAEP es de una docena de idiomas diferentes. Al instalar, el usuario debe especificarse, el soporte de los que los dialectos lo interesa.

A continuación se muestra una lista de idiomas compatibles con el sintetizador ESPAEK y sus designaciones que se utilizan en su configuración.

  • Albanés - Sq.
  • Inglés (Americano) - EN-EEUU
  • Inglés (británico con el acento norte) - EN-N
  • Inglés (Británico con Acento Midland West) - EN-WM
  • Inglés (británico clásico) - en
  • Inglés (conversacional) - EN-RP
  • Inglés (Scottish) - EN-SC
  • Armenio (occidental) - Hy-West
  • Armenio (clásico) - hy
  • Afrikaans - af
  • Bosnio - BS.
  • Galés - cy.
  • Húngaro - hu.
  • Vietnamita - VI
  • Dutch - NL.
  • Mbrola Voices (voz XXX) - MB-XXX
  • Griego - El.
  • Griego antiguo - GRC.
  • Indonesio - ID
  • Islandés - es.
  • Español (Classic) - ES
  • Español (Latinoamericano) - ES-LA
  • Italiano - eso.
  • Catalán - CA.
  • Chino (dialecto cantonés) - ZH-YUE
  • Chino (Putunhua) - Zh
  • Kurdish - Ku.
  • Latino - la.
  • Letonia - LV.
  • Slubban - JBO.
  • Macedonio - MK.
  • Alemán - de.
  • Noruego - No.
  • Polaco - pl
  • Portugués (Brasileño) - PT
  • Portugués (Europeo) - PT-PT
  • Rumano - ro.
  • Inglés - ru
  • Serbio - sr.
  • Eslovaco - SK.
  • Esloveno - SW.
  • Tamil - ta.
  • Turco - tr
  • Finlandés - fi.
  • Francés - padre
  • Hindi - hola
  • Croata - hr.
  • Checo (conversacional) - CS
  • Sueco - sv
  • Esperanto - eo

La lista de idiomas compatibles también se puede extender utilizando las bibliotecas de voz de Mbrola que se pueden conectar a ESPAEK.

espeak y mbrola

MBROLA es un algoritmo especial de síntesis de discurso difuso, basado en el cual se han creado muchos productos de software diferentes con la inclusión de la tecnología de conversión de texto en el habla (TTS). Este proyecto es un titular de registro, entre otras tecnologías para la síntesis de voz por el número de idiomas diferentes para los cuales se utilizó. Aunque para algunos idiomas comunes, los votos de Mbrola no se crean hasta ahora, incluido el ruso.

el eje puede trabajar en un paquete con Mbrola, que proporciona la capacidad de usar las bibliotecas de voz de este proyecto como parte integral del mismo. Esto le permite ampliar aún más la lista de idiomas compatibles para sintetizar el habla en el texto.

Puede usar paquetes ESPAEK y MBROLA en sistemas operativos como Windows, Linux y Mac OS X.

Sin embargo, la integración con ESPAEK no es compatible con todas las bibliotecas de voz de Mbrola.

Principios de implementación

Las palabras del texto de entrada para sintetizar son dos etapas de procesamiento:

  • la palabra en la representación de la letra se convierte en una consistencia en el fondo;
  • se genera un pitido basado en la secuencia obtenida.

Las reglas para obtener una secuencia del teléfono se almacenan como "A, B, C \u003d D". Donde B es la letra en cuestión, A y C, el contexto del entorno de esta carta en la palabra, y D es un fonema, en el que esta carta se puede transformar. El contexto del medio ambiente puede definirse tanto por letras específicas como por caracteres especiales que denotan grupos de letras. Las reglas del sintetizador permiten la determinación ambigua de tales cadenas. Para resolver esta ambigüedad, el sintetizador asigna la prioridad a cada regla, que se calcula en función del número de letras involucradas en la regla, y el grado de concreción para determinar el contexto del medio ambiente. Las reglas también incluyen diferencias en la transmisión dependiendo del énfasis.

En espaeak, los sonidos de vocales siempre se sintetizan, los consonantes de sonidos se obtienen mezclando los sonidos sintetizados con voces pre-grabadas con ruido, y todos los otros sonidos se registran, por ejemplo, [sh].

Cada sonido, además de los consonantes sordos, está representado por la secuencia de formación. Además de la información sobre formantes, cada Fundación tiene información sobre su amplitud, duración del sonido y retraso antes de la base posterior. Sobre la base de estos parámetros, el sonido de una letra de vocal se sintetiza mediante algoritmos implementados en el sintetizador. La información sobre fonemas y formantes se almacena en archivos separados, también compilados posteriormente en formato binario.

Junto con el sintetizador, llega la utilidad de Espek Edit. Esta es una aplicación GUI escrita usando la biblioteca WXLIB. Le permite editar visualmente los teléfonos listosizados. El fonema se representa como un gráfico de la curva, donde puede seleccionar formantes y cambiar sus valores, como la frecuencia, la altura y el ancho. Gracias a estas oportunidades, sobre la base de un fondo listo, puede obtener sonidos nuevos y más fieles para algún idioma. Al mismo tiempo, algunos de los teléfonos no se obtienen mediante la modificación de la existencia. Por ejemplo, al desarrollar la parte de habla rusa del eje, el sonido [P] se registró específicamente, ya que no encontró una contraparte digna en otros idiomas.

Proyectos de espaek

Add-Ons de terceros

Algunos idiomas no tienen reglas simples y universales para construir el habla competente y el espaek requieren componentes adicionales para producir síntesis de alta calidad en estos idiomas. Para evitar aumentar el tamaño del paquete principal de espiga, estos componentes se distribuyen por separado. En particular, en ruso no hay reglas generales que establecen la sílaba de impacto en palabras. En estos casos, ESPAET intenta determinar el estrés de la palabra, pero esta pronunciación a menudo no coincide con la correcta. Para resolver esta tarea, hay un diccionario de pronunciación avanzada especial que necesita para instalar por separado del paquete principal.

Además de los componentes rusos, terceros de la corrección del habla, el espeak aún tiene para chino (Putunhua y cantonés).

Puede descargar estos diccionarios de la web oficial del proyecto.

ver también

Escribe una reseña sobre el artículo "Espeak"

Notas

Enlaces

  • sobre el .

Un extracto caracterizando el espe

Los soldados de los compañeros que caminaban junto a Pierre no miraron a su alrededor, así como él, el lugar del que se escuchó y luego el perro; Pero la expresión estricta yacía en todas las personas.

El depósito, y los prisioneros, y el remolque del mariscal se detuvo en el pueblo de Shamishev. Todo llamó a un montón de incendios. Pierre se acercó al fuego, rugió la carne asada a caballo, volvió al fuego e inmediatamente se quedó dormido. Durmió de nuevo con el mismo sueño mientras dormía en Mozhaisk después de Borodin.
Una vez más, los eventos de la realidad estaban relacionados con los sueños, y nuevamente a alguien, ya sea él mismo o quien le hablaba pensando, e incluso los mismos pensamientos que le dijeron en Mozhaisk.
"La vida es todo. La vida es dios. Todo se mueve y se mueve, y este movimiento es Dios. Y mientras que hay vida, hay un placer de identidad de identidad. Amor la vida, ama a Dios. Es más difícil amar esta vida en sus sufrimientos, en el desminnería del sufrimiento ".
"Karataev" - Recordé Pierre.
Y de repente, PIEAL se presentó como un vital, olvidado largo, el viejo hombre, quien enseñó la geografía de Pierre en Suiza. "Espera", dijo el anciano. Y mostró Pierre Globe. Este globo era un animado, la bola vacilante sin tamaños. Toda la superficie de la bola consistía en gotas, comprimidas firmemente. Y estas gotitas se movieron, se movieron y se fusionaron de varias a una, entonces de una se dividió en muchos. Cada gota buscó derramar, capturar el mayor espacio, pero otros, luchando, además, lo apretó, a veces se destruyeron, a veces se fusionaron con ella.
"Eso es la vida", dijo el anciano.
"Qué simple y claro", pensó Pierre. - Cómo no pude saber esto antes ".
- En medio de Dios, y cada caída busca expandirse para reflejarlo en el mayor tamaño. Y crece, se fusiona y se encoge, y se destruye en la superficie, se profundiza y se aparece de nuevo. Aquí, Karatayev, aquí se extendió y desapareció. - Vous Avez comprando, Mon Enfant, [usted entiende que usted.] - Dijo el profesor.
- Vous Avez comprando, Sacre Nom, [te entiendes, maldita sea.] - Gritó la voz, y Pierre se despertó.
Levantó y se sentó. Por el incendio, en cuclillas en cuclillas, el francés estaba sentado, que acababa de empujar al soldado ruso, y se enfrentaba a la carne del merpole. La carcasa, defectuosa, pintada con cabello, manos rojas con dedos cortos hábilmente giró el bastidor. Cara sombría marrón con las cejas extremas claramente visibles a la luz de las brasas.
"CA LUI EST BIEN EGAL", se quejó, se refirió rápidamente al soldado de pie detrás de él. - ... Brigand. ¡VIRGINIA! [A él no le importa ... Ladrón, ¿verdad!]
Y el soldado, Belite Schomdol, Glanly miró a Pierre. Pierre se dio la vuelta, mirando hacia las sombras. Un soldado ruso es el vigésimo, el que salió al francés, se sentó junto al fuego y goteaba con algo de mano. Mirando más de cerca, Pierre descubrió un perro lila, quien, moviendo su cola, estaba sentada cerca del soldado.
- ¿Y vino? - dijo Pierre. - A, PLA ... - comenzó y no negoció. En su imaginación, a la vez, al mismo tiempo, vinculan entre sí, surgió un maíz que se encontraba en la opinión de que Platón lo miró, sentado debajo del árbol, sobre el disparo, al escuchar en el lugar, sobre los perros, sobre las caras criminales. de dos franceses, que pasaron por encima de él, sobre el saco de la pistola giratoria, sobre la ausencia de karataeva en este privil, y ya estaba listo para entender que Karataev fue asesinado, pero en el mismo momento en su alma, él conocía a Dios de Donde, una memoria sobre la noche pasada con la belleza de Polla, en el verano, en el balcón de su casa de Kiev. Y aún así, sin cultivar las memorias de este día y sin llegar a conclusiones sobre ellos, Pierre cerró los ojos, y la imagen de la naturaleza del verano se mezcló con la memoria del baño, sobre una bola de respiración líquida, y se hundió en algún lugar del agua. , para que el agua se reuniera.
Antes del amanecer, sus fuertes tiros y gritos se despertaron. Pierra corrió los franceses.
- ¡Les Cosaques! [Cosacos!] - Gritó a uno de ellos, y un minuto después, la multitud de personas rusas rodeó Pierre.
Durante mucho tiempo no pude entender Pierre que estaba con él. Desde todos los lados escuchó gritos de la alegría de los camaradas.
- ¡Hermanos! Mis marcas de nacimiento, palomas! - Llorando, gritó soldados viejos, abrazando los cosacos y Gusar. Los húsares y los cosacos rodearon a los prisioneros y ofrecieron apresuradamente los vestidos que tienen botas que pan. Pierre sollozó, sentado en medio de ellos, y no pudo decir una palabra; Abrazó al primer soldado se acercó a él y lloró, lo besó.
Shelahov se encontraba en la puerta de la casa colapsada, fluyendo una multitud de francés desarmado. Los franceses, entusiasmados con todo lo sucedido, explicado en voz alta entre ellos; Pero cuando pasaron por Mima Dologsov, que se batieron ligeramente a lo largo de las botas con Nagaika y las miraron con su frío, de cristal, nada prometedoras, estaban en silencio. Por otro lado, el cosaco DologOv se puso de pie y consideró a los prisioneros, marcando un cien característica de tiza en la puerta.
- ¿Cuantos? - Preguntó a Shard del cosaco, quien consideraba a los prisioneros.
- En los segundos, respondió el cosaco.
- FILEZ, FILEZ, [PASS, PASS.] - Separentador para compartir, aprendiendo a esta expresión de los franceses y, reuniéndose con sus ojos con los prisioneros que pasaban, sus ojos estallaban con un brillo cruel.
Denisov, con una cara sombría, eliminando al papá, caminó sobre los cosacos que llevaban el cuerpo de Petit Rostov en el jardín.

A partir del 28 de octubre, cuando comenzó Frost, el vuelo de los franceses recibió solo un carácter más trágico de congelación y frunciendo el ceño hasta la muerte por los incendios de personas y continuando en abrigos de piel y cochecitos para conducir con un bien suelto del emperador, reyes. y duques; Pero en esencia, el proceso de vuelo y descomposición del ejército francés, ya que el desempeño de Moscú no cambió.
De Moscú a Vyazma desde el ejército francés setenta y descongelado, sin contar con la guardia (que no hizo nada a la totalidad de la guerra, excepto por robo), desde setenta y tres mil hubo treinta y seis mil (de este número, no más de cinco Mil abandonados en batallas). Aquí está el primer miembro de la progresión que se define matemáticamente el seguimiento.
El ejército francés en la misma proporción de derretido y destruido de Moscú a Vyazma, de Vyazma a Smolensk, de Smolensk a Berezina, de Berezia a Wilna, independientemente de los grados más o menores de frío, persecución, caminos de aluvión y todas las demás condiciones tomadas por separado. . Después de Vyazma, las tropas de los franceses en lugar de tres columnas se dispararon en una pila y así fueron al final. Berthier escribió su soberano (se sabe cuán remotamente de la verdad se permite que los jefes describan la posición del ejército). El escribio:
"Je Crois Devoir Faire Connaitre a Votre Majestte l" Etat de Ses Compartir DASS LES DIFERENTES CORPS D "ANEE QUE J" AI ETE A MemE D "Observer Depuis Deux Ou Trois Jours Dans Differents Passages. Elles Sont Presque Debandees. Le Nombre des soldados Qui Suivent Les Drapeaux EST EN Proporción du Quart AU Plus Dans Presques TOUS Les Regimientos, Les Autres Aislamiento MARCHENTE DAENS DIVERSOS DIRECTIVOS DE LOS INSTRICIA ET POUR LEUR COMPTE, DANS L "ESPERANCIAS DE SAPERANCIA DE DES SAPSISTANCES ET POURT SE DESARROSER DE LA DISCIPERTÍN. ES General ILS Sitientent Smolensk Comme Le Point Ou ILS Doivent SE Refairee. Ces Derniers Jours en un remarque Que Beaucoup de Soldats Jettent Leurs Cartuches et Leurs Arans. Dans Cet Etat de Choses, L "Interet du Service de Votre Majestte Exige, Quellos Que Souste Ses Vues UTELTERIEURS COL "ON Rallie L" Armeee A Smolensk en Comunicant a La Demasser des no combattans, Tels Que Hommes Demontes et des Bagages Inutiles et du Materiel de L "Artillerie Qui N" Est PLUS EN AVEC AVEC Les Forces Actuelles. En OUTRE LES JOUNS DE DEPOS, DES Subsistemas SONT NEXIONES AUX SOLDADS Qui SONT EXTENES PAR LA FAIM ET LA FATIGUE; Beaucoup SONT MORTS CES DERNERS LOUS SUR LA RUTAT ET DAONS LES BIVACS. CET EAT DE CHOSES VA TOUJOURS EN AUGMENTANT ET DONNE LIFT DE CRINDRE QUE SI L "ON N" Y PRELE UN PROMPT REMEDE, EN NE SOIT PLUS MAITRE DES LEONES DANS UNBAT. Le 9 de noviembre, un 30 versés de Smolensk ".
[Deber que entrego para llevar a su Majestad sobre el estado de los edificios inspeccionado por mí en la marcha en los últimos tres días. Están casi en perfecto descomposición. Solo la cuarta parte de los soldados permanece con pancartas, otros se convierten en diferentes direcciones, tratando de extinguir la comida y deshacerse del servicio. Todos piensan solo sobre Smolensk, donde esperan relajarse. En los últimos días, muchos soldados desmontaron cartuchos y rifles. Sean cuales sean sus futuras intenciones, pero los beneficios del servicio de Su Majestad se requieren para recolectar el Cuerpo de Smolensk y los oficiales de caballería apresurados separados de ellos, desarmados, sumas y parte de artillería, ya que ya no está en proporción a la cantidad de tropas. Se necesitan alimentos y varios días de paz; Los soldados son hambre y fatiga; En los últimos días, muchos murieron en la carretera y en Bivakov. Dicha posición distinguida es discreta y lo hace temer que si se tomen medidas rápidas para prevenir el mal, pronto no tendremos tropas en nuestro poder en caso de una batalla. 9 de noviembre, en 30 versos de Smolenka.]
Fue en Smolensk, quien representó la tierra prometida, los franceses se mataron mutuamente por la provincia, robaron sus propias tiendas y, cuando todo fue saqueado, corrió más lejos.

VoiceFabric es un servicio de Internet que le permite expresar cualquier información de texto de una voz sintetizada.
Una demo-síntesis con varias voces está disponible en VoiceFabric.com, con ella, puede estimar la calidad de la síntesis. Hoy, 8 votos (mujeres y hombres) están disponibles, que pueden hablar 3 idiomas (ruso, inglés, kazajo).

La síntesis del habla del ODM es útil si necesita personificar los mensajes de voz salientes. La solución le permite abandonar completamente las grabadoras de voz y evitar rodillos de sonido en el menú IVR, es decir, el texto escrito se convierte instantáneamente a la grabación de sonido y es expresado por el cliente en la línea telefónica.

Además, usando voces sintetizadas, puede visitar libros de voz, videos, grabar tarjetas de voz sin pérdida de entonación "natural". VoiceFabric garantiza la alineación competente del estrés, las reducciones de lectura adecuadas, los números, la abreviatura.

Puede registrarse en VoiceFabric.ru y obtener segundos gratuitos de síntesis, así como acceso a la interfaz de software del servicio.

Hoy en día, los sintetizadores del habla utilizados en sistemas de computación estacionarios o dispositivos móviles, algo inusual ya no parece. Las tecnologías se acercaron y permitieron reproducir una voz humana. Cómo funciona todo, donde se usa, cuál es el mejor sintetizador de voz y con qué problemas potenciales puede enfrentar el usuario, vea a continuación.

¿Qué son los sintetizadores del habla y donde se aplican?

Los sintetizadores de voz son programas especiales que consisten en varios módulos que permiten que el texto se traduzca en el teclado en un discurso humano normal en forma de soporte de sonido.

Sería ingenuo creer que las bibliotecas asociadas contienen absolutamente todas las palabras o las frases posibles registradas en los estudios de personas reales. Es simplemente físicamente imposible. Además, las bibliotecas de frases tendrían tal tamaño que los establezcan incluso en discos duros modernos de alto volumen, por no mencionar los dispositivos móviles, simplemente no parecerían ser posibles.

Para esto, se desarrolló la tecnología que se denominó texto a-discurso (traducción del texto en el habla).

La distribución más ampliamente de los sintetizadores del habla recibidos en varias áreas, que se pueden atribuir a un estudio independiente de idiomas extranjeros (los programas a menudo tienen apoyo en 50 idiomas o más), el código necesita escuchar la pronunciación correcta de la palabra, Escuchar los textos de los libros en lugar de leer, crear partes de habla y vocales en música, uso de personas con discapacidades, emitiendo consultas de búsqueda en forma de palabras y frases expresadas, etc.

Variedades de programas

Dependiendo del área de aplicación, todos los programas se pueden dividir en dos tipos principales: estándar, transformando directamente el texto en el habla y el habla o los módulos vocales utilizados en aplicaciones musicales.

Para una comprensión más completa de la imagen, consideraremos ambas clases, pero el mayor énfasis se hará todavía en los sintetizadores de voz en su cita inmediata.

Pros y contras de las aplicaciones de habla más simples.

En cuanto a las ventajas y desventajas de este tipo de programas, primero considere todas las mismas fallas.

En primer lugar, es necesario entender claramente que la computadora, es una computadora, que en esta etapa de desarrollo, el habla humano puede sintetizar bastante aproximadamente. En los programas más simples, a menudo hay problemas con los accidentes cerebrovasculares en palabras, reduce la calidad del sonido y en dispositivos móviles, aumentan el consumo de energía y, a veces, la carga no autorizada de los módulos de voz.

Pero hay suficientes ventajas, porque mucha información de sonido percibe mucho mejor que la visual. La conveniencia de la percepción es obvia.

¿Cómo usar el sintetizador de voz?

Ahora algunas palabras sobre los principios básicos del uso de programas de este tipo. Instale un sintetizador de voz de cualquier tipo que pueda ser sin ningún problema. En los sistemas estacionarios, se utiliza un instalador estándar, donde la tarea principal será la elección de los módulos de idioma compatibles. Para dispositivos móviles, el archivo de instalación se puede descargar de la tienda oficial o almacenamiento como Google Play o AppStore, después de lo cual la aplicación está instalada en modo automático.

Como regla general, cuando inicia la primera configuración, excepto para configurar el idioma predeterminado, no necesita producir. Es cierto que, a veces, el programa puede ofrecerle elegir la calidad de sonido (como estándar, usado en todas partes, frecuencia de muestreo 4410 Hz, profundidad 16 bits y bitrate 128 kbps). En dispositivos móviles, estos indicadores son más bajos. Sin embargo, se toma una cierta voz como la base. Uso de una plantilla de pronunciación estándar aplicando filtros y ecualizadores, es el sonido de tal voz.

En uso, puede seleccionar múltiples opciones manualmente, suena ya tener texto de un archivo, integración a otras aplicaciones (por ejemplo, navegadores web) con la activación de los resultados de búsqueda o la lectura del contenido de texto en las páginas en línea. Es suficiente elegir la acción deseada, el lenguaje y la voz que todo esto se pronunciará. Muchos programas tienen varias variedades de votos: tanto hombres como mujeres. Para activar el proceso de reproducción, se usa generalmente el botón de inicio.

Si hablamos de cómo deshabilitar el sintetizador de voz, puede haber varias opciones. En el caso más sencillo, el botón de parada de reproducción se usa en el programa en sí. En el caso de la integración en el navegador, la desactivación se realiza en la configuración de la extensión o en la eliminación completa del complemento. Pero con dispositivos móviles, a pesar de la desconexión directa, puede haber problemas que se dirán por separado.

En los programas de música, la configuración y la entrada del texto son mucho más complicadas. Por ejemplo, en la aplicación FL Studio hay un módulo de voz en el que puede seleccionar un cambio ligeramente de la Tonalidad, la velocidad de reproducción, etc. para configurar los accidentes cerebrovasculares, se usa el símbolo "_". Pero tal sintetizador es adecuado solo para crear votos robóticos.

Pero el paquete Vocaloid de Yamaha se refiere a programas de tipo profesional. La tecnología de texto a voz se implementa aquí en la más completa. En la configuración, además de los parámetros estándar, es posible poner articulación, Glissando, usar bibliotecas con voces de artistas profesionales, dibujar palabras y frases, personalizándolas en notas, y también un montón de todo. No es sorprendente que el paquete solo con una vocal toma alrededor de 4 GB y más en la distribución de la instalación, y después de desempacar, dos veces tres veces más.

Sintetizadores del habla con voces rusas: una breve descripción general de los más populares

Pero volver a las aplicaciones más simples y considerar lo más popular de ellos.

RHVOICE: según la mayoría de los expertos, el mejor sintetizador del habla, que es el desarrollo ruso de la autoría en la versión estándar de tres votos (Alexander, Irina, Elena) está disponible. Los ajustes son simples. Y la aplicación en sí puede usarse tanto como un programa independiente compatible con SAPI5, y como un módulo de pantalla.

ACAPELA es una aplicación bastante interesante, la característica principal de la cual es casi la voz ideal del texto en más de 30 idiomas del mundo. Sin embargo, en la versión habitual, solo una voz (alena) está disponible.

Vocalizer es una aplicación poderosa con una voz femenina MILENA. Muy a menudo, este programa se aplica en los centros de llamadas. Hay muchas configuraciones del estancamiento, volumen, velocidad de lectura e instalación de diccionarios adicionales. La principal diferencia es que el motor de voz se puede integrar en programas como Reader Reader, Moon + Reader Pro o ID de llamadas de pantalla completa.

El festival es la utilidad de reconocimiento de voz y de voz más poderosa, creada para sistemas Linux y Mac OS X. La aplicación viene con una fuente abierta y, además de los paquetes de lenguaje estándar, tiene el soporte de incluso finés y hindi.

espeak es una aplicación de habla que soporta más de 50 idiomas. La principal desventaja es guardar archivos con un habla sintetizada únicamente en el formato WAV, lo que requiere mucho espacio. Pero el programa es multiplataforma y se puede utilizar incluso en sistemas móviles.

Problemas con Synthesizer del habla en Google Android

Al instalar un sintetizador de voz "nativo" de Google, los usuarios se quejan constantemente que enciende espontáneamente la carga de módulos de idioma adicionales, lo que no solo puede tomar un período de tiempo suficientemente largo, sino que también consume el tráfico.

Puede deshacerse de ella en los sistemas Android es muy simple. Para hacer esto, use el menú Configuración, luego vaya a la sección Idioma y entrada de voz, seleccione Buscar de voz y en el parámetro de reconocimiento de voz sin conexión en la cruz (desconexión). Además, se recomienda limpiar el caché de la aplicación y reiniciar el dispositivo. A veces, puede ser necesario deshabilitar la visualización de notificaciones en la propia aplicación.

Cual es el resultado?

Una vez que un resultado, podemos decir que en la mayoría de los casos, los programas más simples son adecuados para usuarios comunes. En todas las calificaciones lideran el rmoice. Pero para los músicos que desean lograr el sonido natural de la voz para que la diferencia entre las voces en vivo y la síntesis de la computadora no se sienta en el rumor, es mejor dar preferencia a los programas de Vocaloid, especialmente, ya que muchas bibliotecas de voz adicionales están disponibles para ellos, Y los ajustes tienen tantas oportunidades que las aplicaciones primitivas, como dicen, no han estado cerca.

¡Atención! Este sitio utiliza la tecnología Javascript, cuyo soporte está deshabilitado en su navegador. Para una operación completa con un recurso, se recomienda habilitar esta función en la configuración de su navegador de Internet. Sin embargo, todo el contenido del sitio está disponible y en modo de operación con JavaScript deshabilitado, por lo que no se requiere la activación de esta configuración, aunque se recomienda.


Sintetizador del habla Capitán

"El capitán Synthesizer del habla" es un sintetizador compatible con la Sra. SAPI4. Apoya la síntesis del habla en ruso y ucraniano. El apoyo a la lengua ucraniana se basa en la sustitución del fondo ucraniano similar en el sonido de los fonones rusos.

El sintetizador se creó en la base de alapóismos de uno de los diez votos del complejo TTS del software de HABLE Mouse Home TTS, que fue desarrollado por el Club de Tecnología de Voice en el Parque Científico de MSU en 1995. Por herencia, este sintetizador consiguió el nombre de su prototipo de Hablando Mouse Home - Capitán.

Además de las lenguas rusas y ucranianas, el capitán puede trabajar con inglés, alemán y francés, así como para producir una lectura separada de textos multilingües: cada idioma por la voz correspondiente del sintetizador. Sin embargo, la lectura separada de documentos multilingües y apoyo para el inglés, alemán y francés se lleva a cabo mediante el uso de un módulo adicional basado en el sintetizador de espeak, sin embargo, no es necesario el uso de este módulo para el funcionamiento del capitán. El apoyo a los idiomas ruso y ucraniano se puede realizar sin instalación. Este módulo de capacidades de conversión Capabitan ya está incluido en el archivo que puede descargar desde nuestro sitio, por lo tanto, su carga separada, como se describe en la documentación que se acompaña del propio sintetizador, no se requiere.

El sintetizador tiene una voz masculina con buenas elecciones del habla, pero baja naturalidad del sonido. El PLUS se puede atribuir a una velocidad grande, tamaño pequeño y baja carga de energía del sistema. Sin embargo, "Capitán" tiene una serie de deficiencias:

  • El sintetizador prácticamente no es compatible con la función de ajuste de altura de voz.
  • En el proceso de trabajo, a veces pueden ocurrir los fenómenos de los sonidos de "deglución".
  • Periódicamente, el sintetizador puede callarse durante el trabajo o comenzar a leer solo la primera parte de las cadenas de texto. En este caso, se recomienda sobrecargar un sintetizador para devolver una operación a tiempo completo.

El componente del sistema puede ser necesario para el funcionamiento de este sintetizador.

Comparte con amigos o ahorra para ti mismo:

Cargando...