Przegląd mowy – przegląd programu mowy na tekst na dużą skalę

Szukając najlepszych aplikacji syntezatora mowy, natrafiliśmy na Speechmatics, program do transkrypcji oparty na sztucznej inteligencji. Oferuje szereg bezpłatnych i premium funkcji, w tym transkrypcje w czasie rzeczywistym i przesyłanie plików audio. 

Nasz przegląd mowy obejmuje każdy aspekt tego programu, w tym jego wydajność, ceny, główne funkcje i użyteczność. Program jest skierowany głównie do dużych użytkowników biznesowych, ale jedną godną uwagi rzeczą jest to, że umożliwia wykonywanie podstawowych transkrypcji bez tworzenia konta.

Mowy: Plany i ceny 

Podstawowa wersja mowy jest dostępna dla ogółu społeczeństwa za pośrednictwem strony internetowej programu. Nie wymaga konta ani płatności ani danych osobowych. Jednak darmowa wersja jest ograniczona i ma znacznie mniej funkcji niż abonament. Ponadto możesz transkrybować tylko dwie minuty dźwięku / mowy na żywo jednocześnie.  

Speechmatics oferuje zarówno darmowe, jak i premium wersje swojego oprogramowania. (Źródło zdjęcia: Speechmatics)

Jeśli to nie wystarczy, możesz przejść na subskrypcję premium, kontaktując się z zespołem sprzedaży Speechmatics. Ceny są niestandardowe i podawane indywidualnie dla każdego przypadku, a dołączone narzędzia, funkcje i minuty transkrypcji można również zmieniać.   

Mowa: cechy 

Jako potężny program przetwarzania tekstu na mowę, Speechmatics oferuje oczywiście szereg wspaniałych funkcji. Po pierwsze, twierdzi, że jest w stanie zapewnić niski poziom błędów we wszystkich językach i akcentach. Obsługuje szeroki zakres języków, a wersja premium zawiera szereg różnych opcji wdrażania. 

Mowy mają wiele zaawansowanych funkcji. (Źródło zdjęcia: Speechmatics)

Ponadto użytkownicy z płatną subskrypcją będą mieli dostęp do szeregu dodatkowych funkcji, w tym do transkrypcji wsadowych i integracji API. Obsługiwanych jest wiele formatów plików, a Speechmatics zawiera nawet potężne narzędzia do rozpoznawania głośników. Niestety wersje aplikacji na Androida i iOS nie są dostępne.  

Speechmatics: Setup 

Rozpoczęcie pracy ze Speechmatics jest niezwykle proste. Jeśli chcesz zapisać tylko niewielką ilość mowy lub przesłać krótki plik (maksymalnie dwie minuty), nie musisz nawet tworzyć konta. Możesz przekonwertować głos na tekst bezpośrednio na stronie internetowej dostawcy, klikając przycisk „Wypróbuj teraz”.  

Konfiguracja mowy jest tak prosta, jak przejście do właściwej strony internetowej. (Źródło zdjęcia: Speechmatics)

Jeśli zdecydujesz się na uaktualnienie do planu premium, będziesz musiał porozmawiać z zespołem ds. Mowy. Poszczególne plany są wyceniane na zamówienie, a zespół wsparcia przeprowadzi Cię przez proces instalacji.  

Mowa: Interfejs 

Natywny interfejs użytkownika Speechmatics jest dość intuicyjny, ale brakuje mu zaawansowanych funkcji i narzędzi. Zasadniczo umożliwia użytkownikom transkrybowanie mowy na żywo i przesyłanie plików multimedialnych do transkrypcji. Transkrypcje mowy na żywo można kopiować i wklejać do innego dokumentu, a przesyłane pliki są transkrybowane i wysyłane pocztą e-mail jako plik .txt.  

Natywny interfejs użytkownika Speechmatics jest prosty i intuicyjny. (Źródło zdjęcia: Speechmatics)

Należy jednak pamiętać, że abonament premium Speechmatics daje dostęp do wszechstronnego, konfigurowalnego interfejsu zarządzania. Można go zintegrować z własną witryną za pośrednictwem interfejsu API lub spersonalizować zgodnie z potrzebami.  

Speechmatics: Performance 

Chociaż twierdzi, że jest to jedna z najdokładniejszych dostępnych aplikacji syntezatora mowy na mowę, naprawdę nie działała dobrze. To było powolne, bardzo opóźnione i niedokładne.  

Niestety, parametry mowy nie są tak dokładne, jak się spodziewano. (Źródło zdjęcia: Speechmatics)

Na początek przetestowaliśmy go na komputerze przenośnym z połączeniem internetowym 50 Mb / s. Transkrypcja mowy na żywo zajęła ponad dziesięć sekund, a oczekiwanej dokładności po prostu nie było. Program wydaje się losowo wstawiać kropki w nielogicznych pozycjach. W ogóle nie radzi sobie dobrze z hałasem w tle i wydaje się mieć problem z egzotycznymi akcentami. Niestety wyniki nie były lepsze, gdy korzystaliśmy z wersji internetowej ze smartfonem z Androidem.

Przetestowaliśmy również narzędzia do transkrypcji wsadowej Speechmatics, przesyłając krótki plik multimedialny. Wyniki wysłano do nas e-mailem w ciągu pięciu minut. Ale znowu transkrypcja była niedokładna i bardzo źle interpunkcyjna. Wiele zdań nawet nie miało sensu.

Mowa: Wsparcie 

Speechmatics oferuje wybór strumieni obsługi klienta, w tym telefon, e-mail, chatbot i obszerną dokumentację. Pomoc telefoniczna jest dostępna w Anglii, Stanach Zjednoczonych i Kanadzie, ale dzwonienie spoza tych krajów może spowodować znaczne opłaty za połączenia komórkowe.  

Speechmatics oferuje wybór opcji wsparcia. (Źródło zdjęcia: Speechmatics)

Mając to na uwadze, zalecamy skorzystanie z internetowego zgłoszenia biletu Speechmatics lub wsparcie przez e-mail. Nie oczekuj jednak szybkiej usługi, chyba że masz abonament na płatną subskrypcję. 

Na szczęście istnieje jednak szeroki wachlarz pisemnych poradników, które pomogą Ci rozwiązać typowe problemy. Sekcja FAQ bardzo nam pomogła, kiedy zaczynaliśmy, a osoby posiadające płatny plan mogą również uzyskać dostęp do obszernej biblioteki dokumentacji.

Speechmatics: Ostateczny werdykt 

Biorąc pod uwagę wszystko, Speechmatics jest znośną aplikacją syntezatora mowy. Możesz skorzystać z bezpłatnego abonamentu, aby transkrybować do dwóch minut dźwięku przez jego interfejs internetowy, ale nie byliśmy pod wrażeniem jego szybkości ani dokładności. Natywny interfejs użytkownika jest dość ograniczony i oferuje tylko dość podstawowe funkcje. 

Jednak osoby z płatną subskrypcją będą miały dostęp do bardziej zaawansowanych funkcji, szybkiej pomocy technicznej i usług masowej transkrypcji. Ceny ustalane są indywidualnie dla każdego przypadku, co oznacza, że ​​zapłacisz tylko za rzeczy, których potrzebujesz. 

Ogólnie rzecz biorąc, Speechmatics jest opcją wartą rozważenia w przypadku większych firm z dużymi woluminami transkrypcji, chociaż jej działanie stanowi problem. 

Konkurs 

Mowa jest opcją dla osób potrzebujących transkrypcji na dużą skalę, ale z pewnością nie jest to jedyna lub najlepsza. Na przykład Wydra jest świetną alternatywą dla osób poszukujących szybkich, dokładnych transkrypcji popartych potężnymi funkcjami. Oferuje 600 minut darmowego głosu na SMS, a płatne abonamenty są dostępne od 8,33 USD miesięcznie. Tymczasem programy takie jak Braina Pro (49 USD rocznie lub 139 USD na całe życie) oferują szeroki zakres narzędzi do zarządzania i edycji, a także ich podstawowe funkcje przetwarzania tekstu na mowę.

Dowiedz się więcej o konkurentach mowy w naszym przewodniku po najlepszym oprogramowaniu syntezatora mowy.