Najlepsze oprogramowanie do rozpoznawania głosu z 2019 roku

Najlepsze oprogramowanie do rozpoznawania głosu

1. Smok

2. Dragon Anywhere

3. Wpisywanie głosu w Dokumentach Google

4. Braina Pro

5. Rozpoznawanie mowy w systemie Windows 10

Czytaj dalej, aby uzyskać szczegółową analizę każdej aplikacji

Wiele osób uważa, że ​​rozpoznawanie głosu i dyktowanie na komputerze, zamiast pisać na klawiaturze, jest technologią wciąż tkwiącą w przysłowiowych ciemnych wiekach – ćwiczeniu sfrustrowanym, które skutkuje dokumentem zaśmieconym błędami, które trwają wiecznie.

Ale w dzisiejszych czasach prawda nie mogła być dalej od tego. Nawet po wyjęciu z pudełka, dobry pakiet rozpoznawania mowy jest imponująco dokładny – a nawet bardziej, gdy trochę go wyszkoliłeś. Pomaga także pamiętać o stałym i równym mówieniu, ponieważ jeśli wypędzisz zniekształcone zdania, możesz zauważyć, że oprogramowanie trochę się zmaga.

Ogólnie rzecz biorąc, oprogramowanie do dyktowania ma ogromne skoki i nie tylko pozwala dyktować wiadomości e-mail lub dokumenty, ale także w pewnym stopniu kontrolować komputer za pomocą poleceń głosowych.

Rozpoznawanie mowy to nie tylko komputer. W dzisiejszych czasach istnieją pełnowymiarowe narzędzia do tabletów i telefonów, które można zsynchronizować z komputerem, aby umożliwić Ci pracę w terenie, a następnie odebranie miejsca, w którym zakończyłeś pracę po powrocie do biura. Ponownie wiodący dostawcy w tej dziedzinie oferują sprytne sztuczki.

Jakie są najlepsze narzędzia, które warto rozważyć, aby jak najlepiej wykorzystać rozpoznawanie głosu? Czytaj dalej i dowiedz się.

  • Wybraliśmy najlepsze darmowe oprogramowanie dla małych firm
  • Chcesz, aby Twoja firma lub usługi zostały dodane do tego przewodnika dla kupujących? Wyślij prośbę na adres [email protected] z adresem URL przewodnika zakupu w temacie.

Image Credit: Dragon

1. Smok

Bestia z pakietu zasilanego przez głęboką naukę

Platformy: Windows, Mac | Funkcje: Polecenia głosowe, dyktowanie, transkrypcja

Bardzo dokładne rozpoznawanie mowyDoskonałe dodatkowe funkcje, w tym transkrypcjaNie tanie

Dragon od dawna uważany był za władcę, jeśli chodzi o rozpoznawanie mowy na PC, z długą linią wysokiej jakości produktów, które działają w wysokim standardzie. Dzieje się tak nie tylko ze względu na technologię „głębokiego uczenia się”, która pomaga oprogramowaniu dyktującemu osiągnąć wyższy poziom dokładności, im więcej go używasz, ucząc się powszechnie używanych słów i zwrotów, a także dostosowując się do szumu tła lub akcentu.

Najnowsze oprogramowanie do rozpoznawania mowy Dragon ma również wyższą dokładność wyjściową zaraz po wyjęciu z pudełka. Ogólnie rzecz biorąc, okazało się, że jest znacznie bardziej dokładny i elastyczny niż starsze wersje.

To oprogramowanie zapewnia pełne możliwości dyktowania, a także polecenia głosowe do sterowania komputerem (aby otwierać programy, poruszać się po stronach internetowych itd. – i pamiętać, że możesz dyktować gdziekolwiek chcesz, na przykład w Gmailu w przeglądarce). Jest także przystosowany do pracy z urządzeniami z ekranem dotykowym zgodnie z wymaganiami. Wszystko to jest zawarte w edycji Dragon Home, która kosztuje 150 USD.

Dodatkowe ulepszenia dostępne są w wersji Dragon Professional Individual, w tym możliwość tworzenia szablonowych formularzy lub podpisów e-mail, które można wstawiać do dokumentu za pomocą jednego polecenia. Istnieje również funkcja transkrypcji, która może analizować klip audio, podcast lub podobny, zamieniając go w tekst. Ponadto dostępne są zaawansowane opcje poleceń niestandardowych oraz możliwość synchronizacji pracy z urządzeniami z systemem Android lub iOS.

Dragon Professional Individual sprzedaje się po 300 USD, ale istnieje również pakiet korporacyjny dostępny dla grup biznesowych, który obejmuje wszystkie te możliwości i udostępnia je wielu użytkownikom, a także dodatkowe funkcje integracji.

  • Możesz kupić oprogramowanie Dragon tutaj

Image Credit: Dragon

2. Dragon Anywhere

Skorzystaj z możliwości dyktowania, gdziekolwiek jesteś

Platformy: Android, iOS | Funkcje: Dyktowanie, synchronizacja z Dragon Professional i usługami w chmurze

Wysokiej jakości rozpoznawanie mowySyncs z oprogramowaniem Dragon SoftwareDictation ograniczonym do połączenia internetowego appRequires do uruchomienia

To mobilny produkt Dragon na urządzenia z systemem Android i iOS, jednak nie jest to aplikacja „lite”, ale oferuje w pełni ukształtowane możliwości dyktowania zasilane przez chmurę. Zasadniczo otrzymujesz takie samo doskonałe rozpoznawanie mowy, jak w przypadku oprogramowania komputerowego – jedyną znaczącą różnicą, jaką zauważyliśmy, było bardzo niewielkie opóźnienie w wypowiadaniu słów pojawiających się na ekranie (niewątpliwie z powodu przetwarzania w chmurze). Należy jednak pamiętać, że aplikacja nadal była wystarczająco czuła.

Oferuje również wsparcie dla gotowych fragmentów tekstu, które można skonfigurować i wstawić do dokumentu za pomocą prostego polecenia, a te, wraz z niestandardowymi słownikami, są synchronizowane w aplikacji mobilnej i oprogramowaniu Dragon. Ponadto możesz udostępniać dokumenty między urządzeniami za pośrednictwem Evernote lub usług w chmurze (takich jak Dropbox).

Nie jest to jednak tak elastyczne, jak aplikacja komputerowa, ponieważ dyktowanie jest ograniczone do Dragon Anywhere – nie można dyktować bezpośrednio w innej aplikacji (chociaż można skopiować tekst z podkładki do dyktowania Dragon Anywhere do aplikacji innej firmy) ). Inne zastrzeżenia to konieczność połączenia z Internetem, aby aplikacja działała (ze względu na jej charakter oparty na chmurze) oraz fakt, że jest to oferta subskrypcyjna bez jednorazowej opcji zakupu, która może nie pasować do gustów wszystkich.

Jednak mając na uwadze te ograniczenia, zdecydowanym dobrodziejstwem jest pełnoprawne, potężne rozpoznawanie głosu o tej samej wysokiej jakości, co oprogramowanie komputerowe, pisklę na telefonie lub tablecie, gdy jesteś poza biurem.

Nuance Communications oferuje 7-dniowy darmowy okres próbny, aby dać aplikacji wir, zanim zobowiążesz się do subskrypcji.

  • Możesz kupić Dragon Anywhere na Androida lub iOS tutaj

Image Credit: Google

3. Wpisywanie głosu w Dokumentach Google

Sprytny pisklę freebie w G Suite

Platformy: Przeglądarka Chrome, Android, iOS | Funkcje: Dyktando

Kosztuje nicDobra dokładność dla darmowego rozwiązania Ograniczona do przeglądarki ChromeDictation i formatowanie dokumentów tylko

Google ma bezpłatne narzędzie do rozpoznawania mowy wbudowane w Dokumenty Google (edytor tekstu w G Suite).

Siła dzięki rozwiązaniu głosowemu Google polega na tym, że jest zaskakująco dokładna, zwłaszcza biorąc pod uwagę, że jest to oferta bezpłatna. Jeśli jesteś zadowolony z korzystania z G Suite i chcesz czegoś dla swobodnego dyktowania, które nic nie kosztuje, jest to świetna opcja.

Istnieje jednak pewne zastrzeżenie, a mianowicie, że musisz używać przeglądarki Google Chrome, aby głos był obsługiwany na komputerze stacjonarnym (Pisanie głosu może być również używane z niektórymi urządzeniami z Androidem i iOS).

Należy również pamiętać, że jest to wyłącznie dyktowanie mowy w Dokumentach Google, a system nie oferuje poleceń głosowych na pulpicie. Chodzi o dyktowanie tekstu i wydawanie poleceń dotyczących formatowania dokumentu, ale nic poza tym.

Możesz uruchomić funkcję głosową w Dokumentach Google (pamiętaj, musisz korzystać z przeglądarki Chrome), klikając menu Narzędzia, a następnie wybierając Pisanie głosowe.

  • Sprawdź G Suite tutaj

Image Credit: Brainasoft

4. Braina Pro

Wirtualny asystent na komputerze

Platformy: Windows XP-10 | Funkcje: Polecenia głosowe, dyktowanie, asystent AI, aplikacja na Androida do zdalnego sterowania komputerem

Potężny asystent cyfrowyNifty aplikacja Android do zdalnego kontrolowania tylko PCSubskrypcja (bez jednorazowego zakupu)

Braina to oprogramowanie do rozpoznawania mowy, które zostało zbudowane nie tylko do dyktowania, ale także jako wszechstronny cyfrowy asystent, który pomaga w realizacji różnych zadań na komputerze. Obsługuje dyktowanie do oprogramowania innych firm nie tylko w języku angielskim, ale w prawie 90 różnych językach, z imponującymi układami rozpoznawania głosu.

Poza tym wirtualny asystent może zostać poinstruowany, aby ustawiać alarmy, przeszukiwać komputer w poszukiwaniu pliku, przeszukiwać internet, odtwarzać pliki MP3, czytać ebook na głos, a także zaimplementować różne niestandardowe polecenia.

Program Windows ma także towarzyszącą aplikację na Androida, która może zdalnie sterować komputerem i korzystać z lokalnej sieci Wi-Fi, aby dostarczać polecenia do komputera, dzięki czemu możesz stworzyć listę odtwarzania muzyki, na przykład gdziekolwiek jesteś dom. Fajnie.

Dostępna jest bezpłatna wersja Brainy, która ma ograniczoną funkcjonalność, ale zawiera wszystkie podstawowe polecenia na PC, a także 7-dniową wersję próbną rozpoznawania mowy, która pozwala na przetestowanie swoich możliwości przed zatwierdzeniem subskrypcji. Tak, jest to kolejny produkt przeznaczony wyłącznie do subskrypcji, bez możliwości zakupu za jednorazową opłatą. Pamiętaj również, że musisz być online i mieć zainstalowaną przeglądarkę Google Chrome, aby działała funkcja rozpoznawania mowy.

  • Możesz kupić Brainę tutaj

Image Credit: Microsoft

5. Rozpoznawanie mowy w systemie Windows 10

Komputer stacjonarny firmy Microsoft ma w pełni zintegrowane rozpoznawanie głosu

Platformy: Windows 10 | Funkcje: Polecenia głosowe, dyktowanie

W pełni zintegrowany z systemem WindowsNie dodatkowy koszt Nie oferuje najlepszej dokładności (jednak szkolenie pomaga)

Jeśli nie chcesz płacić za oprogramowanie do rozpoznawania mowy i korzystasz z najnowszego systemu operacyjnego Microsoft do komputerów stacjonarnych, możesz być zadowolony, słysząc, że system Windows 10 ma pewne bardzo solidne możliwości rozpoznawania głosu wbudowane w system operacyjny.

Rozpoznawanie mowy w systemie Windows, ponieważ jest nazwane z wyobraźnią – i zauważ, że jest to coś innego niż Cortana, która oferuje podstawowe polecenia i możliwości asystenta – pozwala nie tylko wykonywać polecenia za pomocą sterowania głosem, ale także oferuje możliwość dyktowania dokumentów.

Rodzaj dokładności, który otrzymujesz, nie jest porównywalny z dokładnością oferowaną przez takie osoby jak Dragon, ale z drugiej strony nie płacisz nic, aby go użyć. Możliwe jest również zwiększenie dokładności poprzez szkolenie systemu poprzez czytanie tekstu i zapewnienie mu dostępu do dokumentów, aby lepiej poznać słownictwo. Zdecydowanie warto poddać się treningowi, zwłaszcza jeśli masz zamiar użyć funkcji rozpoznawania głosu.

Ta funkcja rozpoznawania mowy jest w rzeczywistości również w poprzednich wersjach systemu Windows, chociaż Microsoft ulepszył ją dzięki najnowszemu systemowi operacyjnemu. Firma intensywnie chwali się swoimi postępami w dziedzinie rozpoznawania głosu wykorzystującego głębokie sieci neuronowe, a Microsoft z pewnością prowokuje nas, byśmy w przyszłości oczekiwali imponujących rzeczy. Prawdopodobnie celem Cortana jest zrobienie wszystkiego, od poleceń głosowych po dyktowanie.

Włącz rozpoznawanie mowy w systemie Windows, kierując się do Panelu sterowania (wyszukaj go lub kliknij prawym przyciskiem myszy przycisk Start i wybierz go), a następnie kliknij opcję Łatwość dostępu, a zobaczysz opcję „rozpoczęcia rozpoznawania mowy” (będziesz dostrzeż także opcję ustawienia mikrofonu tutaj, jeśli jeszcze tego nie zrobiłeś.

  • Może użyjesz rozpoznawania głosu z jednym z naszych najlepszych laptopów biznesowych