Speech Recognition in glasovni ukazi v OS X

Speech Recognition in glasovni ukazi v OS X

0
David Praznik, 23. February 2012 v Mac z značkami avdio, multitasking, speech-recognition, siri.

Ena vročih debat v zadnjem času je vprašanje, ali bo z novim OS X Mountainin Lion na voljo tudi Siri za OS X. Preden se posvetim mnenju bi želel ponoviti, kaj OS X na to temo že ponuja, sliši pa na ime Speech Recognition.

Kaj je Speech Recognition (SR)?

Je del sistema OS X, ki je namenjen upravljanju računalnika z glasovnimi ukazi namesto tipkovnice. Služi za namene ljudi s posebnimi potrebami, a je vsesplošno koristna funkcija in možnost. SR ni potrebno posebej učiti, da bi z njim lahko kominucirali, saj s pomočjo govornih ukazov (Speakable Items) že zmore upravljati z meniji, vnašati bližnjice, prepozna imena izbirnih gumbov (checkbox, radio button) v vnosnih formah, zna odpreti program in ga zapreti (Open/Quit), pozna funkcijo menjave med odprtimi programi (Switch) in še več.

S kakšnimi ukazi lahko operiram?

Ukazi so v osnovi preprosti in neposredni, nekateri pa zelo podobni tistim, ki jih uporabljamo za komunikacijo s Siri:
Chat with (ime uporabnika ali njegov vzdevek)
Mail to (ime uporabnika ali njegov vzdevek)
Meet with (ime ali vzdevek) at (ura) (AM/PM) on (dan v tednu, Now, Today, Tomorrow)
Get my email
Close this window
Log me out
Make this into a sticky note
Insert today’s date
Move page down/up/to bottom/to top
Open a documet/my browser/Firefox.app
Switch to Firefox.app
Quit this application
Quit from Mail.app
What day/time is it
Start Screen saver
Save this document
Switch to Things.app

… in tako naprej (seznam ponujenih ukazov je na voljo v SR v oknu Speech Commands).

Sem kot uporabnik omejen na ponujene ukaze ali si lahko nastavim tudi kaj po domače?

Sploh ne, seveda lahko. V kategorijo Speakable Items lahko dodamo ukaze, ki odprejo vse kar lahko odpremo z dvojnim klikom, vključno s programom, datoteko in spletno stranjo.

Za dodajanje ukazov je potrebna mapa Speakable Items (~/Library/Speech/Speakable Items), ki jo lahko odpremo tudi z govornim ukazom Open Speakable Items. Vanjo prenesemo alias (bližnjico) programa, datoteke, spletne strani ali skripto. Ime bližnjice je ime ukaza s katerim jo odpremo, zato je smiselno uporabiti kratka in razumljiva imena. Ko postavko dodamo, je potrebno počakati cca 20 sekund, da jo program SR zazna. Obstaja pa tudi naprednejši način s katerim lahko dodamo kompleksnejša opravila. Tu si pomagamo z AppleScript, ki ga lahko koristimo za upravljanje skoraj vseh programov. Skoraj vseh vključuje tudi tiste programe, ki niso del OS X sistema, saj mnogi podpirajo komunikacijo z AppleScript. Tako je možno v iTunes izbrati želenega izvajalca in zaigrati katerokoli od njegovih pesmi iz domače zbirke. Možnosti je nešteto in iTunes je tu zaveden le kot primer.

Kje zaženem Speech Recognition?

V System Preferences se v kategoriji System nahaja Speech, ki omogoča zagon in nastavitve. V Speech se nahaja zavihek Speech Recognition, kjer z izbiro gumba On funkcijo zaženemo.

Kaj vse je potrebno nastaviti?

Na nivoju zavihka Speech Recognition sta na voljo še dva podzavihka: Settings, ki služi za nastavitve in Commands, kjer vključimo/izključimo že pripravljene skupine ukazov, ki jih kasneje lahko preplonkamo iz okna Speech Commands. V Settings se nahaja nastavitev mikrofona in možnost njegove kalibracije, možnost nastavitev metode zagona govornega ukaza, ki je lahko s pomočjo tipke (lahko tudi kombinacije tipk), ali pa besede, ki jo je potrebno izgovoriti pred vsakim ukazom. V zadnjem je beseda tista, ki namesto tipke sproži poslušanje ukaza. Primer: Siri, Log me out.

Če nam privzeto nastavljen zvok virtulane osebe ni všeč, ga lahko zamenjamo ali ponastavimo. To storimo v zavihku Text to Speech, ki je desno od Speech Recognition. V System Vice meniju izberemo glas virtulane osebe, drsni meni Speaking Rate pa služi za hitrost izgovorjave. S tipko Play lahko nastavitev poslušamo in si tako prilagodimo govor kot nam ustreza.

Tudi kalibracijo za mikrofon je smiselno uporabiti, saj s tem optimalno nastavimo zaznavanje našega glasu glede na njegovo moč in razdaljo ust od mikrofona.

Zaključek

Speech Recognition ni novost, a ta priročna tehnologija zagotovo JE uporabna in postaja splošno priljubljena na različnih področjih, za večino ljudi. V sistemu OS X omogoča, da lahko marsikaj naredimo prostoročno.

Če SR na hitro primerjam s Siri, ne ponuja lokacijskih storitev in razume le enostavne, neposredne ukaze, a glede na porodno omejenost programa Siri pri nas in tudi na splošno njeno omejenost na iPhonu 4S (določene omejitve so posledica varnosti), Speech Recognition v OS X, uporabniku omogoča dovolj. Lokacijskih storitev za namizni računalnik v celoti ni možno izkoristiti, a tudi če bi možnost obstajala, bi jo lahko po potrebi onemogočili. Siri v iOS, poleg ostalih omejitev glede na SR v OS X, nima pravic ugašanja programov in ne more (ne sme) upravljati z vsemi programi, kar pa bi v OS X moralo biti omogočeno tudi zato, ker SR to že omogoča. Upoštevati je potrebno tudi to, da Siri z vsakim ukazom komunicira z Applovim strežnikom in je povezava v internet pogoj, SR pa tega ne potrebuje, saj deluje lokalno in zato tudi neprimerljivo hitreje. Njuna združitev je zagotovo možna, a je vprašanje, če se bo to zgodilo kmalu.

Menim, da glasovni ukazi ne bodo nadomestili ročnega dela v celoti, vsaj v tistih področjih dela z računalnikom ne, kjer je miška nujna. Bi pa lahko vse ukaze kot so Select All Layers, Save, Move, Delete, … ali celo kombinacijo ukazov (Save to folder Projekti and tell Things.app that project Torta is complited), izrekali verbalno. Kombinacija obojega istočasno, bi pomenila čudovito delovno izkušnjo za uporabnika in zelo visok nivo prilagodljivosti dela ter upravljanja z računalnikom. Prihodnost dela v OS X-u bo vsekakor zabavna, a dobivam občutek, da bo nežnejši spol bolj izkoriščal vse ponujene funkcije hkrati, saj multitasking funkcije moški sistem ne pozna. Ne dela. Ni.


Posreduj članek naprej