Recenzja Sonix.ai

Każde narzędzie, które transkrybuje, jest ukierunkowane na określoną niszę, a Sonix wybrał te, które rejestrują spotkania lub prezentacje, a następnie potrzebują wersji na maszynie do wyszukiwania lub rozpowszechniania.

Dlatego może być równie przydatny dla studenta, jak i dla kierownictwa, zapewniając transkrypcje, które można łatwo indeksować do wykorzystania w przyszłości.

Aby jednak wykonać te zadania, oprogramowanie musi być dokładne i niedrogie.
Czy Sonix.ai to narzędzie i może konkurować usługą online z zainstalowaną aplikacją?

  • Chcesz wypróbować Sonix.ai? Sprawdź stronę tutaj

(Źródło zdjęcia: Sonix)

Plany i ceny

Podobnie jak w przypadku wielu usług transkrybowania, model kosztów Sonix opiera się na czasie. W szczególności długość każdego nagrania przesłanego do usługi w celu przetworzenia, a koszt tego zasobu wynosi 10 USD za godzinę, jeśli korzystasz z jego standardowej usługi płatności zgodnie z rzeczywistym użyciem.

Koszt za godzinę można obniżyć do 5 USD, jeśli zarejestrujesz się w usłudze subskrypcji Premium za 22 USD miesięcznie dla każdego użytkownika. I rabaty ilościowe są dostępne dla firm, które wymagają ponad 100 godzin miesięcznej transkrypcji.

Standardowy plan ma najbardziej podstawowe funkcje, a Premium dodaje dodatkowe, takie jak dostęp dla wielu użytkowników i udostępnianie zespołu. Ponadto Enterprise ma wszystko, co oferuje Premium z dużą ilością dodatkowej administracji i ulepszonym modelem wsparcia.

W miarę upływu czasu usługi transkrypcji Sonix jest jednym z droższych i na pewno nie jest czymś, na co większość studentów i użytkowników domowych mogłaby sobie pozwolić.

(Źródło zdjęcia: Sonix)

Projekt

Witryna my.sonix.ai ma wyjątkowo czysty wygląd, a założenie konta jest bezpłatne.

W chwili pisania tego tekstu jest to wyłącznie usługa internetowa, a Sonix nie ma aplikacji mobilnej do przechwytywania i wysyłania do przetwarzania nagrań audio.

Jednak, jak omówimy później, istnieją proste sposoby rozwiązania tego problemu, które nieco rozwiązują problem braku aplikacji mobilnej.

Punktem wyjścia dla każdego zadania transkrypcji jest pulpit nawigacyjny Sonix.ai, w którym można zobaczyć zapisany dźwięk i dodać nowe do przetworzenia.

Ponieważ ten system został zaprojektowany dla wielu użytkowników, zawiera system folderów wirtualnych do organizowania transkrypcji w dowolny sposób, który zostanie uznany za odpowiedni.

Kliknięcie przycisku „Prześlij” powoduje przejście do strony, na której można upuścić wiele plików do systemu, a jeśli konto ma wystarczające środki, można je następnie przetworzyć.

Obsługiwane są wszystkie standardowe formaty plików audio, w tym wav, mp3, mp4a, aiff, acc, ogg i wma, a także można przesyłać niektóre struktury pakietów wideo. Maksymalny rozmiar pliku to 4 GB, więc przed przesłaniem dużego pliku wideo o rozdzielczości 4K zalecamy skorzystanie z innego narzędzia do podziału dźwięku, aby przyspieszyć przesyłanie.

Dobrym sposobem na przyspieszenie przesyłania jest użycie magazynu w chmurze, takiego jak Dysk Google, Jeden dysk, Box lub Dropbox i połączenie go bezpośrednio z kontem. Możesz także wysłać e-mail do systemu za pomocą Gmaila, aby stworzyć bardziej elegancki przepływ pracy niż upuszczanie plików na stronie internetowej.

Ta automatyzacja jest zapewniana za pośrednictwem Zapiera, umożliwiając znacznie szerszą integrację, jeśli firma korzystająca z niej zainwestuje w tę technologię w celu połączenia swoich procesów biznesowych.

Kolejnym miłym akcentem jest to, że wraz z plikiem audio lub wideo możesz dołączyć istniejącą transkrypcję, aby przyspieszyć proces i poprawić dokładność.

(Źródło zdjęcia: Sonix)

Kolejnym miłym akcentem jest to, że wraz z plikiem audio lub wideo możesz dołączyć istniejącą transkrypcję, aby przyspieszyć proces i poprawić dokładność.

Ze względu na naturę przetwarzania w chmurze nie jest możliwe oszacowanie, jak szybkie lub wolne przetwarzanie, ale Sonix.ai jest stosunkowo szybki z naszego doświadczenia. Zazwyczaj transkrypcja trwa od 10% do 20% czasu trwania nagrania. Dlatego ukończenie 10-minutowego nagrania zwykle zajmuje mniej niż 2 minuty.

Nie musisz śledzić przetwarzania, ponieważ system wyśle ​​Ci powiadomienie e-mailem po zakończeniu pracy, wraz z linkiem do nowej transkrypcji.

Po przetworzeniu pliku możesz go otworzyć na stronie edycji i przejrzeć wyniki, a także wyeksportować tekst w wielu przydatnych formatach, w tym w niektórych aplikacjach zdefiniowanych jako napisy..

Liczba języków i dialektów obsługiwanych przez system wynosi 36 i obejmuje wiele krajów anglojęzycznych, francuskich, kantońskich, mandaryńskich, portugalskich i hiszpańskojęzycznych, a także wszystkie popularne języki zachodniej i wschodniej Europy, a także niektóre języki azjatyckie i arabskie.

(Źródło zdjęcia: Sonix)

Nagrania

Oprócz pracy nad sztuczną inteligencją potrzebną do interpretacji dźwięków wydawanych przez ludzi, prawdopodobnie strona Nagrania stanowi znaczny wysiłek w zakresie kodowania.

Tutaj zarówno dźwięk, jak i powiązana z nim transkrypt mogą być porównywane i ręcznie wzbogacane o szczegóły zmian głośników oraz poprawki do błędnych interpretacji.

Dla każdego, kto pracuje nad transkrypcją w celu dopracowania tekstu, ta strona zapewnia lokalizację węgla. Ma sens, że włożono trochę wysiłku w tę część, ponieważ jest bardzo łatwa w użyciu i podążaniu.

Próbując skierować użytkownika do miejsca, w którym mogą wystąpić problemy, Sonix.ai pokoloruje zawartość, aby zaznaczyć te sekcje, które są mniej pewne. Ta funkcja może być użyteczna, chociaż Sonix.ai może popełniać błędy nawet w tych częściach, w których uważa, że ​​transkrypcja ma status „Bardzo pewny siebie”.

Najlepsze aspekty tej strony to synchronizacja odtwarzania audio i tekstu, tak aby umieszczenie kursora w tekście przesunęło pozycję odtwarzania do tej samej sekcji.

Oprócz zwykłej edycji można również wyróżniać sekcje w różnych stylach i robić notatki towarzyszące transkrypcji.

Możesz także dostosować kod czasowy, szczególnie przydatny, jeśli nagranie rozpoczyna się długą przerwą lub niechcianą preambułą.

(Źródło zdjęcia: Sonix)

Precyzja

Sonix opisuje Sonix.ai jako „Najlepsze oprogramowanie do automatycznej transkrypcji oparte na najnowocześniejszej sztucznej inteligencji”.

Biorąc pod uwagę nasze testy, opisalibyśmy ten produkt jako wysoce zależny od jakości nagrania i wielu innych czynników, których nie można łatwo kontrolować.

Podczas przetwarzania naszych klasycznych historycznych nagrań mowy z niektórymi głośnikami było naprawdę trudno, nawet jeśli wydawały się nam jasne.

Wyniki te były wyraźnie sprzeczne z niektórymi bardziej równoczesnymi nagraniami, w których dokładność była do zaakceptowania, ale mało gwiezdna.

Doszliśmy do wniosku, że podejście przyjęte przez Sonix przyjmuje kilka założeń, które mogą działać lub nie, w zależności od głośnika i jakości nagrania.

Fascynujące było to, że usługa pokoloruje swoją transkrypcję na podstawie tego, jak bardzo jest pewna tego, co zostało powiedziane, a ta samoanaliza jest bardzo odkrywcza.

W niektórych okolicznościach poprawnie rozpozna, że ​​sekcja może być podejrzana, ale w innych częściach jest pewna, że ​​sekcja została przepisana całkowicie niepoprawnie.

Wydaje się, że kilka typowych problemów sprawia, że ​​jest to krzywa, a jednym z nich są ludzie, którzy nie mówią gramatycznie idealnej prozy. Starając się, aby ich mowa była bardziej bezpośrednia, usunęli kilka słów ze zdań, tworząc bardziej dramatyczny styl. Kiedy są one transkrybowane przez Sonix, wydaje się zdeterminowane, aby dodać te słowa z powrotem, aby pasowały do ​​jego wewnętrznego modelu gramatycznego, zamiast tego, co zostało wypowiedziane.

Transkrypcja brzmi lepiej jako dokument, ale nie jest tak naprawdę reprezentatywna dla tego, co zostało powiedziane.

Sonix jest z pewnością lepszy, gdy jakość nagrania i czystość głośnika są wysokie, jak udowodniliśmy małym klipem Stephena Fry’ego czytającego Harry’ego Pottera. Ale nie zawsze można mieć taką kontrolę nad jakością dźwięku i nadal popełnił błędy podczas tego testu.

Innym obszarem problemowym są formalne nazwy i techniczne słowa lub skróty. Można temu zaradzić, dodając je do słownika niestandardowego, ale wymaga to pracy, aby system mógł lepiej realizować, gdy używane są nazwy lub akronimy.

Dla tych, którzy potrzebują doskonałego słowa do transkrypcji, Sonix ma wybór powiązanych profesjonalnych transkrybentów, którzy mogą pracować z nagraniem i rozwiązać te problemy, ale to w pewnym sensie przeczy celowi przetworzonej transkrypcji.

(Źródło zdjęcia: Sonix)

Bezpieczeństwo

Bezpieczeństwo Sonix.ai koncentruje się na serwerach, na których przetwarzany jest dźwięk i przeprowadzane są transkrypcje.

Cały ruch jest szyfrowany przy użyciu TLS (Transport Layer Security), a gdy pliki znajdą się na serwerze, który jest chroniony wieloma warstwami zapory, ochrona przed włamaniem, a wszystkie dane są chronione przez szyfrowanie po stronie serwera AES-256. Firma obiecuje, że pracownicy nie będą mieli dostępu do nagrań ani transkrypcji, chyba że otrzymają wyraźne pozwolenie na ich posiadanie.

Krytycznym problemem związanym z tym podejściem jest to, że prosty login i hasło mogą obejść to wszystko. Sonix.ai nie ma uwierzytelniania dwuskładnikowego i nie ma łatwo dostępnego dziennika, kto uzyskuje dostęp do plików i kiedy.

Z punktu widzenia bezpieczeństwa można to uznać za nadmierne poleganie na uczciwości osób korzystających z systemu, aby nie udostępniać nagrań innym osobom spoza firmy lub zachować potencjalnie wrażliwe pliki po opuszczeniu firmy.

Krótko mówiąc, bezpieczeństwo musi być lepsze, a śledzenie lub aktywność użytkowników mają większy priorytet.

Ostateczny werdykt

Biorąc pod uwagę stosunkowo wysoki koszt, spodziewaliśmy się, że Sonix będzie działał lepiej niż on.

Być może mieliśmy pecha z wyborem rzeczy do transkodowania, ale nadal wydawało się, że popełniamy nadmierną liczbę błędów.

Zaletą tego równania jest szybki i niezwykle łatwy w użyciu system, chociaż przed uruchomieniem subskrypcji zalecamy wykonanie kilku przykładowych nagrań za pomocą tego rozwiązania..

Największym problemem związanym z Sonix jest wysoki koszt, a nawet jeśli jest to odpowiednie narzędzie do określonych wymagań, istnieją tańsze sposoby na zamianę dźwięku na tekst w innym miejscu.

Poprzedni artykuł
Następny artykuł