Technologie RTX Voice odstraní šum z on-line komunikace

AI filtruje okolní ruchy a nechává vyniknout hlas. Použít lze i starší GTX karty

Zdroj: Nvidia
27. 4. 2020

Nvidia má v poslední době ve velké oblibě umělou inteligenci. Po zprávě o nad očekávání dobře fungující technologii DLSS verze 2.0 se můžeme podívat na další pozoruhodnou vychytávku jménem RTX Voice. Ta má za cíl maximálním způsobem vylepšit audio hovory, chaty a vysílání tak, aby vždy vynikl pouze hlas mluvčího. Umělá inteligence se tedy v tomto případě stará o potlačení okolního šumu i o vyfiltrování nežádoucích zvuků.

Technologie RTX Voice je softwarovou vrstvou stojící mezi zdrojem audia (což je například mikrofon) a cílovou aplikací, kterou může být třeba Twitch, YouTube, Skype, Zoom a další komunikační služby či streamovací platformy. Novinku tedy mohou ocenit jistě i hráči a streameři, nicméně nejpoužitelnější je dnes tato technologie patrně pro všechny ty, kteří musí v aktuální situaci volit komunikaci z domova a skrze on-line prostředí. Všem těm dává Nvidia zcela volně k dispozici nástroj, který dle prvních ohlasů dokáže dramatickým způsobem vyčistit zdroje audia od okolních ruchů a nechá vyniknout právě hlasu. Zdarma je ale platforma pouze z hlediska pořizovací ceny, daň si tato technologie vybírá na samotném hardwaru. Nicméně název novinky klame – novou grafickou karty řady RTX k rozběhnutí nepotřebujete a pro chod RTX Voice bohatě postačí například i starší grafická karta řady GTX.

Nezávisle na použité grafické kartě se vytížení procesoru počítače zvýší o 2–3 %, celkový výkon stroje (tedy i včetně grafické karty) pak naroste v průměru o 10 %.

Návod na zprovoznění i na kartách GTX patrně jako první přinesl uživatel David Lake z fór guru3D. V jeho podání jde o jednoduchou úpravu konfiguračního souboru. Díky tomu lze dle reakcí dalších uživatelů použít například i GeForce GTX 1060, u starších generací už ale mohou vznikat jisté potíže. Pozoruhodné je ale to, že rozdíl mezi výsledkem pořízeným na GTX 1060 a RTX 2080 není slyšitelný (uvádí například Ars Technica). Dá se tedy předpokládat, že pro výpočty umělé inteligence určená jádra Tensor Cores obsažená v kartách RTX tedy nejsou v tomto případě plně využívána. Magazín PC Gamer v souvislosti s tím poukazuje na to, že zapnutí RTX Voice ovlivňuje chod celého počítače, nikoli pouze grafické karty. Nezávisle na použité grafické kartě se vytížení procesoru počítače zvýší o 2–3 %, celkový výkon stroje (tedy i včetně grafické karty) pak naroste v průměru o 10 %. Menší dopad je znát u nejnovějších karet (tedy řada RTX), starší hardware pak znamená i větší dopad na celkovou zátěž na počítač. To ale není mnoho, RTX Voice totiž dokáže hotové divy.

Technologie oficiálně pracuje se všemi rozšířenými aplikacemi, kam kromě těch již zmíněných patří například i Discord, Battle.net a další. U některých pak ale Nvidia na svém webu varuje před možnými drobnými obtížemi. Neoficiální podpora je ale podstatně širší už jen proto, že RTX Voice funguje jako virtuální zvuková karta, takže v dané aplikaci stačí jen zvolit odpovídající zvukový výstup. Poté RTX Voice začne pracovat a dokáže prakticky úplně ztlumit okolní nepořádek, kam například spadá štěkající pes u souseda, vařící se voda v konvici, či třeba jen klapání hlasité mechanické klávesnice. Drobnou nevýhodou může být malé zkreslení hlasu, nicméně i zde výsledek toto negativum bohatě vyváží. To největší překvapení v podání Nvidie pak znamená to, že RTX Voice funguje nejen na odchozí komunikaci, ale i na příchozí. To v praxi znamená, že například při hovoru na Skypu dochází ve spolupráci s AI k vyčištění obousměrného audia, takže uživatel výrazně lépe rozumí i hlasu z druhé strany. A to bez nutnosti instalace jakéhokoli klienta u druhého uživatele, který navíc může být po stránce hardwaru vybavený úplně libovolně, nemusí tedy ani mít grafickou kartu od Nvidie. A bavíme se samozřejmě o hovorech probíhajících v reálném čase.

Volně přístupná betaverze

Návod na zprovoznění novinky a na nastavení těch nejběžnějších aplikací naleznete na stránkách Nvidie, v boxu níže pak můžete spatřit instrukce k tomu, jak RTX Voice zprovoznit i na starších grafických kartách. Na svých fórech pak Nvidia k novince ještě dodává následující komentář: „Stejně jako mnozí z vás se i my všichni snažíme přizpůsobit se našemu novému normálu. Naše domovy jsou nyní společnou kanceláří, streamovacím studiem a herním doupětem v jednom. Na RTX Voice – naší aplikaci pro potlačování hluku – jsme tiše pracovali dál, ale chtěli jsme to dostat do vašich rukou co nejdříve prostřednictvím komunitní betaverze s předběžným přístupem. Produkt je stále ve vývoji, ale doufáme, že vám bude užitečný!“

Instalace na GTX kartách

Po spuštění instalace se na systémovém disku objeví dočasná složka NvAFX umístěná v C:\temp\NVRTXVoice\. Pro povolení instalace i na kartách řady GTX stačí v souboru RTXVoice.NVI odstranit následující část kódu: <constraints> <property name="Feature.RTXVoice" level="silent" text="${{InstallBlockedMessage}}"/> </constraints>
Po úpravě je zapotřebí instalaci opětovně spustit přímo ze zmíněné dočasné složky.

Čili závěrem mohu jen dodat to, že současná verze je stále ještě produktem ve vývoji. Za zmínku rozhodně stojí, že podílet se na tom můžete i vy sami, a to za pomocí trénování neuronové sítě. V tom případě stačí zavítat na stránky Nvidie a nahrát dvojici patnáctivteřinových klipů – jeden s nahraným hlasem a jeden, ve kterém bude slyšet pouze typický hluk pozadí. Právě tímto způsobem se aktuálně aplikační rozhraní jménem RTX Broadcast Engine učí a díky tomu může podávat dobré výsledky.

 

Nahlásit chybu v článku

2

Napsat komentář

Mohlo by vás zajímat

Nahoru