On Tue, Aug 17, 2010 at 12:32:18AM +0200, David Klusacek wrote:
Jen abychom si rozumeli. Je to rozpoznani recnika (byl to on na ktereho jsme to trenovali nebo nebyl (vrati liklihood ratio, pro trenovani potrebujes aspon 30 sekund, pro rozpoznani 5 seknud -- to pak dostanes EER (=equal error rate) okolo 0.7%, kdyz se trening rozsiri na 5 minut a rozpoznava se z minuty tak jsme dosakovali EER 0.1% --- ovsem predpokladalo se ze uzivatele nepodvani, ze se nesnazi menit hlasy nebo nekoho napodobovat (takova data nebyla v trenovaci/testovaci databazi, takze nevime co to v takovem pripade udela))), ne prepis toho co rikal. To delam jako disrtaci, ale zatim to potrebuje enormni vykon (> 1TFLOPS) a velkou pamet a stejne to poradne nefunguje. Takze do robota to zatim neni.
Aha, pro nas je asi i tech 5 sekund docela dost, asi bychom vytradovali vyssi EER za 1 sekundu delay nebo neco takoveho. Potrebovali bychom recnika rozpoznavat realtime a v prvni iteraci nam vazne jde ciste o jeho rozpoznani.
Pocitam s tim, ze robot bude delat i vypocetne narocnejsi operace, proto planuji vetsinu (krome nejzakladnejsich "reflexu") offloadovat pres wifi na nejaky vykonnejsi strojek. Ale >1TFLOPS asi mit nebude, pokud tvuj algoritmus nejde snadno SIMD-paralelizovat. ;-)
Mimochodem, ve stredu bude prvni meetup kolem Tesla Coil, kdybys mel cas si odpocinout od disetracky. :)
Jo rad prijdu. Jen co mi prozradite adresu.
http://brmlab.cz/hackpoint/letnany :)