Syntezator mowy z rosyjskich głosów. Najlepszy syntezator mowy

Ostatnio otrzymałem problem wyboru mowy syntezatora głosowego. Wymagania podstawowe są wsparcie języka rosyjskiego i mniej więcej normalnej wymowy.
Dla tych, którzy nie są świadomi tego, co jest syntezator mowy, powiem ci - jest to specjalny program, którego znaczenie ma przekształcić pisemny tekst na mowę ustną. Jest to tak zwana synteza.
Dlaczego jest to konieczne? Na przykład, gdy trzeba nagrać wiadomość głosową w obcym głosie. Może być przydatny dla obcokrajowców, aby usłyszeć wymowę konkretnego słowa. Mowa syntezatora jest łatwa do przeczytania, gdy trzeba włączyć bajkę, która nie jest w audiobooks. W ogóle są wszystkie witryny.
Tak więc, w trakcie wyboru, znalazłem kilka bardzo przydatnych narzędzi, w tym działających przez Internet wraz z poparciem języka rosyjskiego, a teraz opowiadam ci o nich.

tłumacz Google

Oto prawdziwie wielofunkcyjny produkt, który może być używany całkowicie inaczej. Główne zalety:
- Jest to całkowicie darmowa usługa;
- Operacja online bez instalacji. Potrzebny jest tylko dostęp;
- Moim zdaniem ten syntezator mowy ma najlepszy moduł głosowy, najbliższy naturalny;
- prawdopodobnie najlepszy zespół rozwoju i wsparcie techniczne na świecie;
- największa liczba obsługiwanych języków.
Niestety, opcja Voic jest tylko jedna - kobieta. Nie znalazłem wyboru.

Rhvoice.

Doskonała mowa wielojęzyczna mowa syntezatora z rosyjskiego dewelopera - Olga Yakovlev. Istnieją wersje zarówno dla systemów operacyjnych Windows, jak i Linux. Deweloperem syntezatora jest Olga Yakovlev. Program jest całkowicie bezpłatny i jest dostępny na oficjalnej stronie internetowej w dwóch wersjach: jako niezależna wersja zgodna z SAPI5 i jako moduł dla bezpłatnego programu dostępu do ekranu NVDA. Ten syntezator mowy głosowej jest w stanie głosować rosyjskie teksty w trzech głosach - Elena, Irina i Aleksander.

ACAPELA.

ACAPELA jest być może jednym z najpopularniejszych i wspólnych syntezatorów głosowych na świecie. Główną cechą jest wyrażanie tekstów o ponad trzydzieści na świecie. Jeśli rozważasz rosyjski, dostępne są dwa głosy - Nikolai i Alena. Co więcej, ten ostatni jest doskonały i naturalny pod względem wymowy. W trybie demonstracyjnym dostępny jest tylko głos alny na stronie.
Program jest dostępny do pobrania na oficjalnej stronie internetowej i obsługuje wszystkie popularne nowoczesne systemy operacyjne - Windows, Linux, Mac. Istnieją nawet wersje dla Androida U iOS.

Vokalizer.

Damska Milena głosowa jest kolejnym bardzo popularnym silnikiem syntezatora głosu z Nuance - jest bardzo wysoka jakość i naturalnie brzmią. Możesz go usłyszeć w centrach telefonicznych i w różnych systemach mowy, a także w różnych aplikacjach aplikacjach - takich jak Moon + Reader Pro, pełnoekranowy identyfikator rozmówcy, chłodny czytnik, w programach nawigacji TomTom, Igo Primo.
Wśród zalet można zauważyć możliwość instalacji różnych słowników, regulacji głośności, akcentu i odczytu.
Kod programu jest otwarty, możesz pobrać go za darmo na oficjalnej stronie internetowej, w rzeczywistości, a także instalatora samego programu.

Festiwal

Festiwal jest nie tylko innym syntezatorem mowy głosowej, a już całe rozpoznawanie systemu i syntezę mowy z różnymi API. Deweloper - Centrum Badań Technologii Mowy Uniwersytet w Edynburgu.
Festiwal ma na celu wspieranie wielu języków. Domyślne obsługuje angielski, walijski i hiszpański. Istnieje jednak możliwość połączenia pakietów głosowych innych języków: czeski, fiński, hindi, włoski, marathi, polski, rosyjski i telugu.
Kod programu jest otwarty, sam syntezator głosowy jest dystrybuowany na licencji Open Source i jest dostępna tylko dla systemów operacyjnych Linux. Prawda jest przenośna wersja Makintosha.

Espeak.

Ostatnio w moim przeglądowym systemie syntezy mowy - program Espeak jest już opracowywany przez około 8 lat. Najnowsza wersja to 1.48.04 z dnia 6 kwietnia 2014 r. Ten syntetyzator głosowy jest przeniknikiem - są wersje w systemie Windows, Linux, Mac OS X, a nawet pod RISC OS, chociaż ostatnie dwa nie były obsługiwane dla a długi czas.
Oddzielnie zauważam, że Espeak jest używany w systemach operacyjnych Android Mobile, prawda ma wiele znaczących błędów.
Program obsługuje pięćdziesiąt różnych języków, których wsparcie jest określone podczas instalacji programu.
Jednym z głównych minusów jest syntezator głosowy - pokolenie głosowe tylko do pliku formatu WAV. Możesz pobrać program za darmo na oficjalnej stronie internetowej.

Od siebie dodam tylko, że podobał mi się Rhvoice i Vokalizer, choć tutaj w wielu z nich jest indywidualna i w dużej mierze zależy od tego, co chcesz uzyskać. Więc spróbuj umieścić i spójrz. Myślę, że jeden z prezentowanych opcji musi być odpowiedni dla Ciebie.

Do: Wikipedia: Artykuły bez obrazów (Typ: Nie określono) do: Oprogramowanie opracowane w 2006 roku

espeak. Jest to kompaktowy syntetyk wolnego słowa, który obsługuje język marżania syntezy mowy (SSML).

OS.

Wersje Espeak istnieją w takich systemach operacyjnych, jak Microsoft Windows, Mac OS X, Linux, RISC OS, a jego kod źródłowy w C ++ są dostępne. Ponadto oficjalna dokumentacja syntezatora daje instrukcję na kompilacji go pod Windows Mobile. Program ma jeden znaczący limit - wytwarzanie głosów jest możliwe tylko w pliku WAV.

Ponadto Espeak jest używany w systemach operacyjnych Android Mobile, począwszy od wersji 1.6 i Maemo, ale te projekty nie są osobiście nadzorowane przez dewelopera osobiście i nie ma odpowiednich pakietów na oficjalnej stronie internetowej Espeak i Android-Urządzenie ma szereg istotnych błędów podczas pracy w niektórych językach, w szczególności i rosyjskim.

Obsługiwane języki.

espeak obsługuje około pięciu tuzina różnych języków. Podczas instalowania, użytkownik musi zostać określony, wsparcie, którego dialekty go interesuje.

Poniżej znajduje się lista języków obsługiwanych przez Syntezator Espeak, a ich oznaczenia używane w jej ustawieniach.

  • Albańska - SQ.
  • Angielski (Amerykański) - En-USA
  • Angielski (Brytyjski z akcentem północnym) - en-n
  • Angielski (Brytyjski z akcentem West Midland) - EN-WM
  • Angielski (klasyczny brytyjski) - en
  • Angielski (konwersacyjny) - EN-RP
  • Angielski (Szkocki) - EN-SC
  • Armenian (Western) - Hy-West
  • Ormiański (klasyczny) - hy
  • Afrikaans - AF.
  • Bośniański - BS.
  • Walijski - CY.
  • Węgierski - Hu.
  • Wietnamski - VI.
  • Holenderski - NL.
  • Głosy mbrola (głos XXX) - MB-XXX
  • Grecki - El.
  • Starożytny Grecki - GRC.
  • Indonezyjski - Id
  • Islandzki - jest.
  • Hiszpański (klasyczny) - es
  • Hiszpański (Latin American) - ES-LA
  • Włoski - to.
  • Kataloński - CA.
  • Chiński (Kantoński dialekt) - Zh-Yue
  • Chiński (Putunhua) - ZH
  • Kurdish - Ku.
  • Łaciński - La.
  • Łotewski - LV.
  • Słuban - jbo.
  • Macedoński - Mk.
  • Niemiecki - de.
  • Norweski - Nie.
  • Polski - Pl.
  • Portugalski (Brazylijski) - PT
  • Portugalski (Europejski) - PT-PT
  • Rumuński - RO.
  • Angielski - RU
  • Serbski - Sr.
  • Słowacki - SK.
  • Słoweński - SW.
  • Tamil - TA.
  • Turecki - TR.
  • Fiński.
  • Francuski - ks.
  • Hindi - Hi.
  • Chorwacki - Hr.
  • Czechy (konwersacyjny) - CS
  • Szwedzki - Sv.
  • Esperanto - EO.

Lista obsługiwanych języków może być również rozszerzona za pomocą bibliotek głosowych MBRRRRRRROT, które można podłączyć do Espeak.

espeak i mbrola.

MBROLA jest specjalnym algorytmem syntezy mowy dyfońskich, na podstawie którego utworzono wiele różnych produktów oprogramowania z włączeniem technologii konwersji tekstu do mowy (TTS). Ten projekt jest właścicielem rekordów między innymi technologiami do syntezy mowy według liczby różnych języków, dla których został użyty. Chociaż dla niektórych wspólnych języków mbrola-głosy nie są tworzone do tej pory, w tym rosyjski.

espeak może pracować w pakiecie z MBRRRRRRRRO, który zapewnia możliwość korzystania z bibliotek głosowych tego projektu jako integralną część samej Espeak. Pozwala to na dalsze rozszerzenie listy obsługiwanych języków do syntetyzacji mowy na tekście.

Możesz użyć pakietów Espeak i MBRRORO w takich systemach operacyjnych jako Windows, Linux i Mac OS X.

Jednak integracja z Espeak nie jest obsługiwana przez wszystkie biblioteki głosowe MBRROT.

Zasady wdrażania

Słowa tekstu wejściowego do syntezy to dwa etapy przetwarzania:

  • słowo w reprezentacji litery jest konwertowane w spójność w tle;
  • wygenerowany jest sygnał dźwiękowy na podstawie uzyskanej sekwencji.

Zasady uzyskania sekwencji telefonu są przechowywane jako "A, B, C \u003d D". Gdzie b jest listą, A i C - kontekst środowiska tego listu w słowie, a D jest fonem, w którym można przekształcić ten list. Kontekst środowiska można zdefiniować zarówno przez określone litery, jak i znaki specjalne oznaczające grupy liter. Zasady syntezatora umożliwiają niejednoznaczne określenie takich łańcuchów. Aby rozwiązać tę niejednoznaczność, syntezator przypisuje priorytet każdej reguły, który jest obliczany na podstawie liczby liter zaangażowanych w regułę, a stopień konkretności w celu określenia kontekstu środowiska. Zasady obejmują również różnice w transmisji w zależności od nacisku.

W Espeak dźwięki samogłoskowe są zawsze syntetyzowane, dzwoniące spółgłoski uzyskuje się przez mieszanie syntetycznych dźwięków z wcześniej nagranymi głosami z hałasem, a wszystkie inne dźwięki są po prostu nagrane, na przykład [SH].

Każdy dźwięk, oprócz spółgłosek głuchych, jest reprezentowany przez sekwencję formą. Oprócz informacji o formantach, każda fundacja ma informacje o jego amplitudzie, czas trwania i opóźnienia przed późniejszym fundamentem. Na podstawie tych parametrów dźwięk listu samogłoskowego jest zsyntetyzowany za pomocą algorytmów zaimplementowanych w syntezji. Informacje o fonemach i formantach są przechowywane w oddzielnych plikach, a następnie skompilowane do formatu binarnego.

Wraz z syntezatorem przybywa narzędzie Espeak Edytuj. Jest to aplikacja GUI napisana za pomocą biblioteki WXLIB. Pozwala wizualnie edytować gotowe telefony. Fonem jest reprezentowany jako wykres krzywej, gdzie można wybrać formantów i zmienić swoje wartości, takie jak częstotliwość, wysokość i szerokość. Dzięki tym możliwościom, na podstawie gotowego tła, możesz uzyskać nowe, bardziej wierne dźwięki dla jakiego języka. Jednocześnie niektóre telefony nie są uzyskane przez modyfikację istniejących. Na przykład, podczas opracowywania rosyjskojęzycznej części Espeaku, dźwięk [P] został specjalnie zarejestrowany, ponieważ nie znalazł godnego odpowiednika w innych językach.

Projekty Espeak.

Dodatki stron trzecich

Niektóre języki nie mają prostych i uniwersalnych zasad budowy kompetentnej mowy i Espeak wymagają dodatkowych komponentów do produkcji wysokiej jakości syntezy w tych językach. Aby uniknąć zwiększenia rozmiaru głównego pakietu Espeak, elementy te są rozprowadzane oddzielnie. W szczególności, w języku rosyjskim nie ma ogólnych zasad ustalających sylabę wpływu słowami. W takich przypadkach Espeak próbuje określić stres słowu, ale ta wymowa często nie pasuje do właściwego. Aby rozwiązać to zadanie, istnieje specjalny zaawansowany słownik wymowy, który musisz zainstalować oddzielnie od głównego pakietu Espeak.

Oprócz rosyjskich, części trzecich partii korekty mowy Espeak nadal mają dla Chińczyków (Putunhua i Cantonese).

Możesz pobrać te słowniki z oficjalnej strony projektu.

Zobacz też

Napisz recenzję o artykułu "Espeak"

Notatki

Spinki do mankietów

  • na .

Fragment charakteryzujący Espeak

Żołnierze towarzyszy, którzy chodzą obok Pierre, nie rozejrzyli się, a także w miejscu, z którego był słyszany, a potem pies; Ale ścisłe wyrażenie leżało na wszystkich osobach.

Depot i więźniowie, a marszałek holowniczy zatrzymał się w wiosce Shamisheva. Wszystko przewróciło się do bukiet pożarów. Pierre zbliżył się do ognia, ryked palonych mięso konia, wrócił do ognia i natychmiast zasnął. Spał ponownie z tym samym snem, jak spał w Mozhaisk po Borodinie.
Ponownie, wydarzenia rzeczywistości były związane z marzeniami, a znowu ktoś, czy on sam czy ktokolwiek rozmawiał z nim myśli, a nawet te same myśli, które powiedziano w Mozhaiskie.
"Życie jest wszystkim. Życie jest Bogiem. Wszystko porusza się i porusza, a ten ruch jest Bogiem. I choć jest życie, jest przyjemność tożsamości tożsamości. Kochaj życie, kochaj Boga. Trudniej jest kochać to życie w ich cierpieniach, w demonstrieniu cierpienia. "
"Karataev" - Pamiętałem Pierra.
Nagle Piear został zaprezentowany jako żywy, długi zapomniany, łagodny stary człowiek, który uczył geografii Pierre w Szwajcarii. - Poczekaj - powiedział stary człowiek. I pokazał Pierre Globe. Ta globus była żywa, zawahała piłka bez rozmiarów. Cała powierzchnia piłki składała się z kropelek, szczelnie skompresowana. A te kropelki przeniesione, przesunął się i połączyły od kilku do jednego, od jednego zostały podzielone na wiele. Każda kropla starała się rozlać, uchwycić największą przestrzeń, ale inni, dążąc, oprócz, ściskał go, czasami zniszczyli, czasami połączono z nią.
"To życie" - powiedział stary człowiek.
"Jak proste i wyraźnie" pomyślał Pierre. - Jak nie mogłem tego poznać wcześniej. "
- W środku Boga i każda kropla ma na celu rozszerzenie, aby odzwierciedlić go w największej wielkości. I rośnie, łączy się i kurczy się i zniszczył na powierzchni, idzie głęboko i ponownie wyskakuje. On, Karatayev, tutaj rozprzestrzenił się i zniknął. - Vous Avez Compis, Mon Enfant, [Rozumiesz Cię.] - powiedział nauczyciel.
- Vous Avez Compris, Sacre Nom, [Rozumiesz Cię, Cholera.] - krzyknął głos, a Pierre się obudził.
Podniósł się i usiadł. Przez ogień, kucane kucanie, siedział Francuz, który właśnie popchnął rosyjskiego żołnierza i smażył na mięso merpole. Obudowa, wadliwa, malowana włosami, czerwone ręce z krótkimi palcami zręcznie obrócił stojak. Brązowa ponura twarz z ekstremalnymi brwiami wyraźnie widoczna w świetle węgli.
"Ca Lui Est Bien Egal", mruknął, szybko odnosząc się do żołnierza stojącego za nim. - ... Brigand. Va! [On nie obchodzi ... Robber, prawda!]
I żołnierz, belit Schomdol, Glanly spojrzał na Pierre'a. Pierre odwrócił się, wpatrując się w cienie. Jeden rosyjski żołnierz jest dwudziestym, tym, który ten Francuz wyszedł, siedział przy ognisku i kapał z czymś ręką. Patrząc bliżej, Pierre odkrył bzu psa, który machał ogonem, siedział blisko żołnierza.
- I przyszedł? - powiedział Pierre. - A, Pla ... - Zaczął i nie negocjował. W swojej wyobraźni, jednocześnie, w tym samym czasie, wiążąc się między sobą, memoiler powstał o poglądu, że Platon spojrzał na niego, siedząc pod drzewem, o strzale, słuchu w miejscu, o psach, o twarzach karnych dwóch francuskich, którzy przeszli obok niego, o usuniętym wirującemu pistoletu, o nieobecności Karataevy na tym prywatnym, a on był już gotowy, aby zrozumieć, że Karataev został zabity, ale w tej samej chwili w duszy, znał Boga Gdzie, pamiętnik o wieczornym spędzonym z pięknem Pollą, w lecie, na balkonie jego domu Kijowa. I wciąż bez uprawy wspomnień tego dnia i bez dokonania wniosków na ich temat, Pierre zamknął oczy, a obraz lata natury miesza się z pamięcią kąpieli, o płynnej piłce oddechowej, a on zatonął gdzieś do wody , aby woda była wspólna.
Przed wschodem słońca, jego głośne częste strzały i krzyki zostały oburzone. Pierra prowadził francuski.
- Les Cosaques! [Kozaków!] - krzyknął jeden z nich, a minutę później tłum rosyjskich ludzi otaczających Pierre.
Przez długi czas nie mogłem zrozumieć Pierre, że był z nim. Ze wszystkich stron usłyszał krzyki radości towarzyszy.
- bracia! Moje znamiki, gołębie! - Płacz, krzyknął starych żołnierzy, przytulanie Kozaków i Gusar. Husars i Kozaków otoczyli więźniowie i pośpiesznie oferowali, którzy ubierają się, którzy mają buty, którzy chleb. Pierre Sobbed, siedząc po środku, i nie mógł powiedzieć słowa; Przytulił, że pierwszy żołnierz zbliżył się do niego i płakał, pocałował go.
Shelahow stał przy bramie upadłego domu, płynąca przez siebie tłum rozbrojenia francuskiego. Francuzi, podekscytowany wszystkimi stało się, napisali głośno między sobą; Ale kiedy minęli Mima Dologova, który lekko bił się z butami z Nagaika i spojrzał na nich z zimnym, szkłem, nic dobrego obiecującego, milczały. Z drugiej strony Cossack Dologov stał i rozważał więźniów, oznaczając stu kredą na bramie.
- Ile? - Poprosiła odłamek z Kozaku, który uważał więźnia.
- Drugi sto - odpowiedział Kozak.
- FileZ, FileZ, [Pass, Pass.] - Separatywny do dzielenia się, uczenie się tego wyrażenia od francuskiego, i, spotkanie ze swoimi oczami z przechodzącymi więźniami, jego oczy wybuchły z okrutnym brokatem.
Denisov, z ponurą twarzą, usuwając tata, przeszedł przez kozaków, którzy niosą ciało Petit Rostov w ogrodzie.

Od 28 października, kiedy zaczął się francuski, lot francuskiego otrzymał tylko bardziej tragiczny charakter zamrożenia i marszcząc brwi na śmierć przez pożary ludzi i kontynuując w futrzach i wózkach, aby jeździć z luźnym dobremm cesarza, królów i książęce; Ale w istocie proces lotu i rozkładu armii francuskiej, ponieważ występ Moskwy nie zmienił się.
Od Moskwy do Vyazma z siedemdziesięciu rozmrożonej armii francuskiej, nie licząc strażnika (który nie zrobił nic do całej wojny, z wyjątkiem rabunku), z siedemdziesięciu trzech tysięcy było trzydzieści sześć tysięcy (z tej liczby nie więcej niż pięć tysiąc spadł w bitwach). Oto pierwszy członek postępu, który jest określony matematycznie matematycznie.
Armia francuska w takiej samej części stopionej i zniszczonej z Moskwy do Vyazmy, z Vyazmy do Smoleńska, z Smoleńska do Bereziny, z Berezii do Wilny, niezależnie od bardziej lub mniejszych stopni zimnych, prześladowań, ścieżek zapory i wszystkich innych warunków pobranych osobno . Po Vyazmie wojska francuskiego zamiast trzech kolumn zostało zastrzelonych w jednym stosie i tak poszedł do końca. Berthier napisał swój suwerenny (wiadomo, jak zdalnie z prawdy pozwala nam na opisanie pozycji armii). On napisał:
"Je Crois Devoir Faire Connaitre A Votre Majeste L" Etat de Ses Troupes Dans Les Różnicy Corps D "Annee que J" Ai Ete A Meme D "Observer Depuis Deux Ou Trois Jours Dans Dix Divage. Elles Sont Preque Debandees. Le Nombre Des Soldatats Qui Suivent Les Drapeaux EST PL Proporcja Du Quart AU Plus Dans Preque TOS LES PESTENTS, LES Autres Marenta Izolement Dans różni kierunki ET LEUR COMPTE, DANY L "ESPERANCE DE TROVE DES SUBSESTENTES ET LINE SE DEFERSER DE LA Dyscyplina. En Ogólne ILS BEZPIECZEŃSTWO SMOLENK COMME LE Point Ou Ils Doivent SE Remapare. Ces Deriers Jours on a Remarque Que BeaUsoup de Soldats Jettent Leurs Carttues et Leurs Armes. Dany Cet Etat de Choses, L "INTERET du Service DE Votre Majeste Exige, Quelles Que Stare Ses Vues Utertermieurs que "On Rallie L" Armee A Smolensk en Cencert A La Grooming Des Non Combattany, Tels Que Hommes Demontes et des Bagages inutules et du Materiela de l "Artillerie Qui N" EST Plus PL Proporcja Avec Les Sices Actruelles. EN Outre Les Jours de Repos, Des Subistance Sont Istminesa Aux Soldats Qui Sont Extenues Par La Faim et La zmęczenie; BeaUsoup Sont Morts Ces Derniers Jour Sur La Route Et Dans Les Bivacs. CET ETAT DE Choses Va Toujours EN Augmentant et Donne Lieu de Craindre Que Si L "On N" Y Prete ONZ Szybki, na Ne Soit Plus Maitre Des Troupes Dans ON ON Balka. LE 9 LISTOPAD, 30 WENSE DE SMOLENSK.
[DUŻO Dostarczam, aby doprowadzić do Twojej Królewskiej Mości o stanie budynków sprawdzonych przez mnie w marcu w ciągu ostatnich trzech dni. Są prawie w doskonałym załamaniu. Tylko czwarta część żołnierzy pozostaje z banerami, inni idą na różnych kierunkach, próbując ugasić żywność i pozbyć się usługi. Każdy myśli tylko o Smoleńsku, gdzie mają nadzieję się zrelaksować. W ostatnich dniach wielu żołnierzy demontowali wkłady i karabiny. Niezależnie od twoich przyszłych intencjach, ale korzyści z serwisu Twojej Królestwy wymaga zebrania Korpusu w Smoleńsku i oddzielają pospiesznych oficerów kawalerii z nich, nieuzbrojone, dodatkowe podady i część artylerii, ponieważ nie jest już proporcjonalnie do liczby żołnierzy. Potrzebne są jedzenie i kilka dni pokoju; Żołnierze są głodem i zmęczeniem; W ostatnich dniach wielu zmarło na drodze i na Bivakovie. Taka pozycja wyróżniająca jest niepozorna i sprawia, że \u200b\u200bto obawia się, że jeśli podejmowane są szybkie środki, aby zapobiec złoowi, wkrótce nie będziemy mieć oddziałów w naszej mocy w przypadku bitwy. 9 listopada, w 30 wersjach z Smolenka.]
Poszedłem w Smoleńsku, który reprezentowany przez ziemię obiecaną, Francuzi zabił się nawzajem do prowincji, obrabował własnych sklepów i, kiedy wszystko było splądrowane, pobiegł dalej.

VoiceFabric to usługa internetowa, która umożliwia głosowanie dowolnych informacji tekstowych z syntetyzowanego głosu.
Synteza demonstracyjna z różnymi głosami jest dostępna na Voicefabric.com, możesz oszacować jakość syntezy. Dziś dostępne są 8 głosów (kobiet i mężczyzn), które mogą mówić 3 językami (rosyjski, angielski, kazachski).

Synteza mowy z MCR jest przydatna, jeśli trzeba osobowość wychodzących wiadomości głosowych. Rozwiązanie pozwala całkowicie porzucić rejestratorów głosowych i zapobiec wałkom dźwięku w menu IVR, czyli tekst pisemny jest natychmiast konwertowany na nagrywanie dźwięku i jest wyrażone przez klienta w linii telefonicznej.

Ponadto, używając syntetyzowanych głosów, możesz głosować książki, filmy, nagrywać karty głosowe bez utraty "naturalnej" intonacji. Voicefabric gwarantuje kompetentne wyrównanie stresu, odpowiednich redukcji czytania, liczb, skrót.

Możesz zarejestrować się na Voicefabric.ru i uzyskać bezpłatne sekundy syntezy, a także dostęp do interfejsu oprogramowania usługi.

Dziś syntetyzatory mowy używane w stacjonarnych systemach komputerowych lub urządzeń mobilnych, nie wydaje się już niezwykłe. Technologie wszedł daleko do przodu i pozwoliły odtworzyć ludzki głos. Jak to wszystko działa, gdzie jest używany, jaki jest najlepszy syntezator mowy iz jakim potencjalnym problemami użytkownik może zmierzyć się, patrz poniżej.

Jakie są syntezatory mowy i gdzie mają zastosowanie?

Syntezatory mowy są specjalnymi programami składającymi się z kilku modułów, które umożliwiają przetłumaczenie tekstu na klawiaturze w normalną mowę ludzką w formie wsparcia dźwięku.

Byłoby naiwne, aby uwierzyć, że związane z nimi biblioteki zawierają absolutnie wszystkie słowa lub możliwe frazy nagrane w studiach prawdziwych ludzi. Jest to po prostu fizycznie niemożliwe. Ponadto biblioteki zwrotów miałyby tak wielkość, która ustanawiająca je nawet na nowoczesnych dyskach twardych o dużej objętości, nie wspominając o urządzeniach mobilnych, po prostu nie wydają się być możliwe.

W tym celu opracowano technologię, która nazywana tekstem do mowy (tłumaczenie tekstu w mowie).

Najczęściej podział syntezatorów mowy otrzymanych w kilku obszarach, które można przypisać niezależnym badaniem języków obcych (programy często mają wsparcie w 50 językach lub więcej), kod musi usłyszeć poprawną wymowę słowa, Słuchanie tekstów książek zamiast czytania, tworzenia stron mowy i wokalnych w muzyce, wykorzystanie przez osoby niepełnosprawne, wydawanie zapytań wyszukiwania w formie głosowych słów i fraz itp.

Odmiany programów

W zależności od obszaru zastosowania Wszystkie programy można podzielić na dwa główne typy: standard, bezpośrednio przekształcanie tekstu w mowy mowy i moduły mowy lub wokalne stosowane w zastosowaniach muzycznych.

Aby uzyskać bardziej pełniejsze zrozumienie obrazu, rozważymy obie klasy, ale większy nacisk zostanie wykonany nadal w syntezatorach mowy w ich natychmiastowym spotkaniu.

Plusy i minusy najprostszych zastosowań mowy

Jeśli chodzi o zalety i wady tego typu programów, najpierw rozważ wszystkie te same wady.

Przede wszystkim konieczne jest jasno zrozumieć, że komputer - jest komputerem, który na tym etapie rozwoju mowa ludzka może zsyntetyzować dość w przybliżeniu. W najprostszych programach często występują problemy z uderzeniami słowami, zmniejszoną jakość dźwięku, aw urządzeniach mobilnych - zwiększone zużycie energii, a czasami nieautoryzowane ładowanie modułów mowy.

Ale jest wystarczająco dużo zalet, ponieważ bardzo wiele informacji o dźwięku postrzegają znacznie lepiej niż wizualne. Wygoda percepcji jest oczywista.

Jak korzystać z syntezatora mowy?

Teraz kilka słów o podstawowych zasadach wykorzystania programów tego typu. Zainstaluj syntezator mowy dowolnego typu, może być bez problemów. W systemach stacjonarnych używany jest standardowy instalator, w którym głównym zadaniem będzie wybór obsługiwanych modułów językowych. W przypadku urządzeń mobilnych plik instalacyjny można pobrać z oficjalnego sklepu lub przechowywania, takich jak Google Play lub AppStore, po którym aplikacja jest zainstalowana w trybie automatycznym.

Z reguły, po pierwszym uruchomieniu dowolnych ustawień, z wyjątkiem ustawienia domyślnego języka, nie musisz produkować. To prawda, że \u200b\u200bczasami program może zaoferować wybranie jakości dźwięku (w standardzie, używane wszędzie, częstotliwość próbkowania 4410 Hz, głębokość 16 bitów i bitrate 128 kbps). W urządzeniach mobilnych wskaźniki te są niższe. Niemniej jednak pewny głos jest podejmowany jako podstawa. Korzystanie ze standardowej szablonu wymowy, stosując filtry i korektory, jest dźwięk takim głosem.

W użyciu można ręcznie wybrać wiele opcji, brzmiąc już tekst z pliku, integracja z innymi aplikacjami (na przykład przeglądarek internetowych) z aktywacją wyników wyszukiwania lub czytania treści tekstowych na stronach online. Wystarczy wybrać pożądane działanie, język i głos, że wszystko to zostanie wymawiane. Wiele programów ma kilka odmian głosów: zarówno mężczyzn, jak i kobiety. Aby aktywować proces odtwarzania, przycisk Start jest zwykle używany.

Jeśli porozmawiamy o tym, jak wyłączyć syntezator mowy, może być kilka opcji. W najprostszym przypadku przycisk STOP jest używany w samym programie. W przypadku integracji z przeglądarką dezaktywacja jest wykonana w ustawieniach przedłużenia lub pełnym usunięciu wtyczki. Ale z urządzeniami mobilnymi, pomimo bezpośredniego odłączenia, mogą występować problemy, które zostaną powiedziane oddzielnie.

W programach muzycznych ustawienia i wprowadzanie tekstu są znacznie bardziej skomplikowane. Na przykład w aplikacji FL Studio jest moduł mowy, w którym można wybrać nieznacznie zmienić ustawienia tonalności, prędkość odtwarzania itp. Aby ustawić uderzenia, symbol "_" jest używany. Ale taki syntezator jest odpowiedni tylko do tworzenia głosów robotycznych.

Ale pakiet Vocaloid z Yamaha odnosi się do profesjonalnych programów. Technologia tekstowa do mowy jest tutaj wdrażana w najbardziej kompletnych. W ustawieniach, oprócz standardowych parametrów, możliwe jest umieszczenie artykulacji, Glissando, korzystanie z bibliotek z wokalami profesjonalnych wykonawców, sporządzić słowa i frazy, dostosowywanie ich pod nutami, a także back of wszystkie. Nic dziwnego, że pakiet tylko z jednym wokalem trwa około 4 GB i więcej w dystrybucji instalacji, a po rozpakowaniu - dwa razy trzy razy więcej.

Syntezatory mowy z rosyjskim głosami: krótki przegląd najbardziej popularnych

Ale z powrotem do najprostszych aplikacji i weź najpopularniejsze z nich.

Rhvoice - według większości ekspertów, najlepszy syntezator mowy, który jest rosyjski rozwój autorstwa w standardowej wersji trzech głosów (Alexander, Irina, Elena). Ustawienia są proste. A sama aplikacja może być stosowana zarówno jako niezależny program zgodny z SAPI5, jak i jako moduł ekranu.

Acapela to dość interesująca aplikacja, której główną cechą jest prawie idealne wyrażanie tekstu w ponad 30 językach świata. Jednak w zwykłej wersji jest jednak dostępny tylko jeden głos (Alena).

Vocalizer to potężna aplikacja z żeńskim głosem Milena. Bardzo często program jest stosowany w centrach telefonicznych. Istnieje wiele ustawień stagnacji, objętości, odczytu prędkości i instalacji dodatkowych słowników. Główną różnicą jest to, że silnik mowy może być zintegrowany z programami takimi jak fajny czytnik, księżyc + czytnik pro lub pełnoekranowy identyfikator rozmówcy.

Festiwal jest najpotężniejszą syntezą mowy i narzędzie do rozpoznawania mowy, utworzone dla systemów Linux i Mac OS X. Aplikacja jest wyposażona w open source, a oprócz standardowych pakietów językowych, ma wsparcie nawet fińskiego i hindi.

espeak to aplikacja mowy, która obsługuje ponad 50 języków. Główną wadą jest zapisanie plików z syntetyzowaną mową wyłącznie w formacie WAV, który zajmuje dużo miejsca. Ale program jest platforma krzyżowa i może być używana nawet w systemach mobilnych.

Problemy z syntezatorem mowy w Google Android

Podczas instalacji "rodzimego" syntezatora mowy z Google użytkownicy stale narzekają, że spontanicznie włącza się na ładowanie dodatkowych modułów językowych, które mogą nie tylko zużywać wystarczająco długi okres czasu, ale także zużywa ruch.

Możesz się go pozbyć w systemach Android, jest bardzo prosty. Aby to zrobić, użyj menu Ustawienia, a następnie przejdź do sekcji Wyszukiwanie języka i głosu, wybierz Wyszukiwanie głosowe i na parametrze rozpoznawania mowy Offline Kliknij na krzyż (odłączenie). Dodatkowo zaleca się czyszczenie pamięci podręcznej aplikacji i ponownego uruchomienia urządzenia. Czasami może być konieczne wyłączenie wyświetlania powiadomień w samej aplikacji.

Jaki jest wynik?

Razem możemy powiedzieć, że w większości przypadków najprostsze programy są odpowiednie dla zwykłych użytkowników. We wszystkich ocenach prowadzą Rhvoice. Ale dla muzyków, którzy chcą osiągnąć naturalny dźwięk głosu, aby różnica między wokalami na żywo a syntezą komputera nie jest odczuwana na plotom, lepiej jest zapewnić preferencję do programów Vocaloid, zwłaszcza że wiele dodatkowych bibliotek głosowych jest dla nich dostępny, A ustawienia mają tak wiele możliwości, które prymitywne aplikacje, jak mówią, nie stali w pobliżu.

Uwaga! Ta strona wykorzystuje technologię JavaScript, której wsparcie jest wyłączone w przeglądarce. Aby uzyskać pełną obsługę z zasobami, zaleca się włączenie tej funkcji w ustawieniach przeglądarki internetowej. Jednak wszystkie treści witryny są dostępne i w trybie pracy z obsługą JavaScript, więc aktywacja tego ustawienia nie jest wymagana, choć zalecana.


Kapitan Mowy Synthesizer.

"Kapitan syntezatora mowy" jest syntetyzator kompatybilny z MS SAPI4. Obsługuje syntezę mowy w języku rosyjskim i ukraińskim. Wsparcie dla języka ukraińskiego opiera się na zastępowaniu ukraińskiego tła podobnego na dźwięk rosyjskich fononów.

Syntezator został stworzony na podstawie bazy allogowej jednej z dziesięciu głosów oprogramowania Myszy Myszy Complex Complex, który został opracowany przez klub technologii głosowej w Parku Naukowym MSU w 1995 roku. Według dziedziczenia ten syntezator otrzymał nazwę swojego prototypu z domu myszy - kapitan.

Oprócz języków rosyjskich i ukraińskich Kapitan jest w stanie pracować z angielskim, niemieckim i francuskim, a także produkować oddzielne czytanie tekstów wielojęzycznych: każdego języka przez odpowiedni głos syntezatora. Odrębne czytanie wielojęzycznych dokumentów i wsparcia dla języka angielskiego, niemieckiego i francuskiego odbywa się przy użyciu dodatkowego modułu na podstawie syntezatora Espeak, zastosowanie tego modułu do działania kapitana nie jest konieczne. Obsługa języków rosyjskich i ukraińskich można przeprowadzić bez instalacji. Ta modułowa konwersji Capabitan Capacilities jest już zawarta w archiwum, którą można pobrać z naszej witryny, dlatego jego oddzielne obciążenie, jak opisano w załączonej dokumentacji samego syntezatora, nie jest wymagane.

Syntezator ma męski głos z dobrym wyborami mowy, ale niska naturalność dźwięku. Plus można przypisać dużą prędkością, małym rozmiarze i niskim obciążeniu mocy systemu. Jednak "kapitan" ma wiele niedociągnięć:

  • Syntezator praktycznie nie jest obsługiwany przez funkcję regulacji wysokości mowy.
  • W trakcie pracy mogą wystąpić zjawiska "połykające" dźwięki.
  • Okresowo syntezator może się zamknąć podczas pracy lub rozpocząć czytanie tylko pierwszej części ciągów tekstowych. W takim przypadku zaleca się przeciążenie syntezatora, aby zwrócić pracę w pełnym wymiarze godzin.

Komponent systemu może być potrzebny do działania tego syntezatora.

Udostępnij znajomym lub zapisz dla siebie:

Ładowanie...