Tech

Oto historia sukcesu IVONA Software, polskiego projektu kupionego dziś przez Amazon

Dziś informowaliśmy, że polskie przedsiębiorstwo IVONA Software zostało przejęte przez Amazon. Firma odpowiedzialna za najlepszy na świecie syntezator mowy nie od razu stała się liderem w swojej kategorii. Postanowiliśmy przybliżyć historię jednego z najlepiej prosperujących polskich przedsiębiorstw z zakresu nowych technologii.

Firma IVO Software została założona w 2001 roku przez dwóch absolwentów Politechniki Gdańskiej, Łukasza Osowskiego oraz Michała Kaszczuka. W 2011 roku nazwa została zmieniona na IVONA Software.

Od czego się zaczęło?

W celu realizacji współpracy naukowej oraz biznesowej, na początku ubiegłej dekady powstała firma, której celem przewodnim był rozwój oraz wprowadzenie na rynek produktów nowych technologii wykorzystujących sztuczną inteligencję. Panowie zdecydowali, że głównym założeniem przedsiębiorstwa ma być tworzenie aplikacji wykorzystujących algorytmy syntezy mowy w oparciu o elementy sztucznej inteligencji oraz mowy ludzkiej, jako sposobu komunikacji z komputerem. Tak narodziła się firma, o której głośno było w całym polskim internecie. Najciekawsze jest to, że wszystko zaczęło się od… Gdyńskiego Biznesplanu - konkursu dla osób pragnących otworzyć własny biznes.

Założyciele IVONA Software

Jeżeli ktoś nie jest zaznajomiony z terminem syntezatora mowy, już tłumaczę – w dużym skrócie jest to nic innego, jak program (lub maszyna) pozwalająca na konwersję tekstu pisanego w wypowiedź głosową – mowę. Na co to komu potrzebne? Zastosowań jest wiele. Mogą być to systemy alarmowe, narzędzia pomocne w nauce języków obcych lub pomoc przy tłumaczeniu, np. tekstów zapisanych alfabetem Brailla. Producent charakteryzuje syntezator jako narzędzie do udźwiękawiania:

  • multimediów,
  • serwisów WWW,
  • systemów IVR i rozgłoszeniowych,
  • urządzeń elektronicznych i mobilnych,
  • aplikacji i systemów informatycznych.

Aplikacja numer jeden

Pierwszą aplikacją firmy IVONA Software był syntezator mowy Spiker 1.0, który doczekał się kolejnych pięciu aktualizacji. Sukcesem okazała się mobilna wersja – Speaker Mobile, która znalazła zastosowanie w telefonach komórkowych dla osób niewidomych oraz niedowidzących.  Rozwiązanie to zostało nagrodzone w maju 2004 roku, gdy firmie wręczono nagrodę „Medal Gdynia bez Barier”.

Nieco później, we wrześniu 2004 roku, IVONA Software zaprezentowało kolejną aplikację, Intelligent Web Reader. Ułatwiała ona przeglądanie zasobów sieci osobom niewidomym oraz niesłyszącym. Aplikacja odczytywała na głos tekst wyświetlany na ekranie komputera. Wtedy też narodził się Jacek, pierwszy polski głos.

Przełom

W 2005 roku przedsiębiorstwo zaprezentowało syntezator nowej generacji. IVONA, bo tak nazwano flagowy produkt firmy, charakteryzowała się tym, że jakość głosu można było porównać z ludzką mową. Pamiętam jak dziś, jak duże było poruszenie dotyczące premiery tego rozwiązania. Wszyscy chcieli mieć tę aplikację, by móc przetestować jej możliwości (przede wszystkim skonfrontować program z szeregiem bluzgów). Krótko potem aplikacja została doceniona i zwyciężyła w konkursie Blizzard Challenge 2006 otrzymując miano najlepszego syntezatora mowy na świecie. Polska firma pokonała gigantów IT takich jak: Nokia, Microsoft czy IBM. Kolejnym wyróżnieniem była nagroda Traveler Odkrycie Roku 2006 w konkursie National Geographic. Od tego czasu IVONA nie schodziła z piedestału.

Pierwszy obcojęzyczny głos, Jennifer, ujrzał światło dzienne w roku 2007. On również został wyróżniony w konkursie Blizzard Challenge 2007.

W 2008 roku narodziła się Carmen, głos dedykowany syntezatorowi mowy języka rumuńskiego. Nikt wcześniej nie podjął się tego zadania ze względu na jego złożoność oraz charakter.

IVONA Software

Dominacja

W tym samym czasie IVONA Software opracowało własną, innowacyjną technologię RVD (Rapid Voice Development), która otworzyła drzwi do dalszego dynamicznego rozwoju. Przy użyciu tej technologii można było szybko tworzyć nowe głosy bardzo wysokiej jakości, porównywalne z mową ludzką. Wykorzystano ją przy pracach nad amerykańskim głosem Eric, który został udostępniony w lutym 2009 roku.

Obecnie firma pracuje nad kolejnymi głosami oraz wersjami językowymi. Zapowiadany jest na przykład język brytyjski, który sam chętnie przetestuję (gwara cockney z syntezatora byłaby niesamowita!). Z pozostałych należy wymienić: języki portugalski, turecki, japoński czy flamandzki. W portfolio znajduje się kilkadziesiąt lektorów mówiących w kilkunastu językach.

Targi

Polskie przedsiębiorstwo nie osiadło nad polskim morzem, tylko prezentowało swoje rozwiązania na wielu prestiżowych imprezach (także za granicą). Owoce pracy Polaków można było podziwiać (posłuchać) np. w niemieckim Hanowerze (targi CeBIT, największe europejskie targi nowych technologii), w Las Vegas na CES (Consumer Electronics Show), ale i np. w stolicy wielkopolski podczas GMINA – areny wymiany wiedzy na temat nowoczesnych narzędzi dla rozwoju regionów. Najbliższą okazją do zapoznania się na żywo z ofertą IVONA Software będzie wydarzenie Bett - Powering Learning w londyńskim Centrum ExCeL, które odbędzie się w dniach 30.01-2.02.2013.

IVONA Software

Nagrody

Okazją do porzucenia siedziby były także konkursy (które IVONA krótko mówiąc dominowała). Poza wspomnianymi, wśród innych nagród zdobytych przez IVONA Software znalazły się Fenonemy Przekroju (2007), Produkt z Przyszłością (2007) czy Brussels Innova (2008).

Ostatni raport dotyczący syntezatorów mowy wykonany przez amerykańską organizację Voice Information Associates również należy zaliczyć jako ogromny sukces. IVONA pokonała takich wielkich graczy jak: Microsoft, AT&T, Nuance czy Loquendo. Polski produkt zwyciężył w 5 z 7 kategorii (dokładność wymowy w zadaniach: interpretacja liczebników, homografów, wyrażeń obcojęzycznych, akronimów, skrótów, nazw i adresów, czyli sumując – całe mnóstwo skomplikowanych wyrażeń). IVONA uzyskała łączny wynik 94,5%, czyli o 22 punkty procentowe więcej od średniego wyniku pozostałych rozwiązań.

W sieci można znaleźć opinie, jakoby obecna w iPhone'ach Siri mogłaby usługiwać IVONIE. ;)

Media o firmie

O IVONA Software było głośno w wielu mediach, zarówno lokalnych, jak i ogólnoświatowych. O polskim sukcesie pisaliśmy także i my. Panowie Kaszczuk i Osowski byli także bohaterami szeregu wywiadów na temat sukcesu ich – jakby nie było – startupu.

Wspomniałem wcześniej, że IVONĘ chciał mieć każdy do zastosowań znacznie odbiegających od tych, które wymienia firma. W sieci krąży cała masa lepszych i gorszych amatorskich twórczości. Poniżej prezentuję te, które mnie chwyciły za gardło.

Słynny już stół Kamila D., który niedawno został sprzedany na aukcji WOŚP (uwaga, wulgaryzmy prowadzącego):

IVONA zamawia pizzę:

Coś dla nerdów, czyli idziemy expić (uwaga wulgaryzmy):

Zastosowanie IVONY w aplikacjach

Gdzie można usłyszeć głosy z Gdańska? IVONY posłuchamy na przykład odpalając nawigację w niektórych smartfonach BlackBerry. Podobnie rzecz ma się z systemem Android – aplikacja Google Navigator również posiada ten syntezator. Wiele innych aplikacji dostępnych na ten system jest przystosowanych do pracy z IVONĄ. Wśród kompatybilnych programów są też czytniki książek czy narzędzia do odczytywania wiadomości tekstowych lub emaili.

Skąd taki sukces?

Twórcy oprogramowania sami się czasem zastanawiają, dlaczego nikt z konkurencji nie wpadł na rozwiązania, które od dawna z powodzeniem stosowane są aplikacjach IVONA. Osowski śmieje się, że nie wie, jak to jest możliwe. Cieszy się jednak, że daje im to przewagę nad oponentami. Co więcej, obecnie prowadzone są działania patentowe nad kilkoma pomysłami firmy. Dzięki tym zabiegom przedsiębiorstwo na 20 lat zapewni sobie ochronę autorskich rozwiązań.

Jedną z technologii, która wyróżnia produkt na tle konkurencji jest BrightVoice. Wedle producenta, zapewnia ona lektorskie, ekspresyjne brzmienie wymawianych przez syntezator słów, zdań, całych wypowiedzi, a nawet książek. Wykorzystuje ona szereg algorytmów sztucznej inteligencji, które – jakby nie było – z komputerową precyzją naśladują mowę ludzką. Producent zapewnia, że efekt końcowy jest nie do odróżnienia do głosu lektora nagranego w profesjonalnym studio. Pierwszym głosem opartym o tę technologię był brytyjski Brian zaprezentowany w czwartym kwartale 2009 roku.

Drugą z innowacyjnych technologii jest wspomniana już metoda szybkiego opracowywania nowych głosów – RVD.

IVONA Software

O firmie IVONA Software

IVONA Software jest jednym z najlepiej prosperujących polskich przedsiębiorstw zajmujących się nowymi technologiami. W 2011 roku spółka zanotowała 2,2 miliona dolarów przychodu. Mówi się, że przedsiębiorstwo zarobiło około 3,5 miliona złotych w ubiegłym roku.

IVONA Software tworzy i rozwija oprogramowanie komputerowe w zakresie syntezy mowy na najwyższym światowym poziomie. Produkty firmy wyróżniają się innowacyjnymi i niestandardowymi rozwiązaniami technicznymi, dzięki czemu są wdrażane w najbardziej zaawansowanych technologicznie przedsięwzięciach.

przeczytaj następny tekst


przeczytaj następny tekst


przeczytaj następny tekst


przeczytaj następny tekst


przeczytaj następny tekst