Ja chyba pozostanę przy swoim RPi Zero2W.
Z vosk działa sprawnie offline - oczywiście po polsku .
Wszystkiego Najlepszego w Nowym Roku
@darek może mały opis rozwiazania w osobnym wątku dla laików w tym temacie? Na forum jeszcze o tym nie było.
Muszę poszukać gdzie znalazłem opis - oczywiście sam tego nie wymyśliłem .
Znalazłem :
Z Whisper działało to ślamazarnie - polecam vosk . Reakcja natychmiastowa .
Będę ciągnąć temat: a jak tego “vosk” dodać/skonfigurować?
Jak jest ze zbieraniem dźwięku z pomieszczenia? Czy wystarczy normalna intonacja głosu? Nie wymaga jakiegoś specjalnego intonowania?
Tak jak słychać na filmiku . W pomieszczeniu raczej powinno być cicho . Zresztą kwestia w którą stronę są skierowane mikrofony
Na filmiku jesteś bardzo blisko mikrofonu, a mnie bardziej interesuje użytkowanie tego w normalnych warunkach. Zakładam np umieszczenie tego w salonie, w centralnym miejscu, powiedzmy szafka RTV. Do tego w tle gra muzyka lub oglądam telewizor. Czy takie naturalne środowisko nie jest przeszkodą dla funkcjonalnego użytkowania tego zbieracza komend. Czy może jesteś zmuszony do wcześniejszego wyciszenia innych dźwięków i podniesienia donośności swojego głosu. Ja osobiście używałem komend głosowych w połączeniu z Jolką ale na smart-zegarku gdzie wiadomo mówię do nadgarstka, więc tych problemów nie ma. Ale doświadczenia użytkowników bramek od AI-Speaker w połączeniu z mikrofonami z kamerki od PS3 były różne.
Tak dogłębnie nie testowałem
Ja właśnie siedzę nad kolejna wersją swojego voice asystenta ale działanie mikrofonów stereo na płytkach ESP to tylko mit. Praktycznie poza obudową nie udało mi się wprowadzić nic innego…
Również korzystałem z vosk i jestem bardzo zadowolony. Jakby udało się podłączyć do tego RPI płytkę 6+1 microphone array to byłby sztos.
Obecna płytka ma 2 mikrofony blisko siebie i zbierające dźwięk z tego samego kąta więc tutaj szału nie będzie. Nie miałem tego w rękach ale odpowiadając na pytanie @angler : nie poradzi sobie w warunkach o które pytasz. INMP411 radzi sobie bardzo dobrze w warunkach absolutnej ciszy, zbierało poprawny dźwięk nawet z 5 metrów ale wystarczą zakłócenia typu TV w tle to już się jest tak kolorowo. Ja do swojego głośnika mówię z odległości ok. 3m przy włączonym telewizorze ale robię to “donośnym” głosem
Wrzucisz foto?
do poczytania
Mówiłem o płytce z projektu o którym pisze @darek
A OK, nie wgłębiałem się, myślałem, że coś własnego zaprojektowałeś.
ReSpeaker 2-Mic Pi HAT jest świetnym przykładem najlepszego kompromisu jaki był do uzyskania przy tych założeniach projektowych - przy tych wymiarach płytki nie da się umieścić mikrofonów dalej od siebie.
Nie służą one do nagrywania basu, więc wydaje się to być najlepsze możliwe posunięcie z 2 mikrofonami MEMS na tak małej płytce.
Póki co mogę sobie tylko pomarzyć z moją “niewiedzą” na temat elektroniki
Ale w Home Assistant Voice Preview Edition jakoś sie udało:
W drugim filmie przetestowano to “bardziej” :
no dobra może wcześniej wyraziłem się niejasno. Chodziło mi o wprowadzenie trybu stereo dla mikrofonów wraz z aktualizacją [i2s_audio] Add more options to speakers and microphones by pyos · Pull Request #7306 · esphome/esphome · GitHub
PE ma swój kod stworzony pewnie przez kilka osób a ja jestem tylko szarym użytkownikiem który ucieszył się że zmiana trybu i2s_audio na channel: stereo rozwiąże jego dotychczasowe problemy z asystentem
Niestety nawet na zagranicznych forach nikt nie poruszał tematu stereo mikrofonów działających na ESP, więc poddałem się po kilku dniach walki. Pisanie swojego custom componentu to dla mnie wciąż za wysokie progi i dlatego zostałem sobie na pojedyńczym mikrofonie
OK, rozumiem dlatego na przyszlość nie używajmy żargonu informatycznego na profesjonalnym forum .
Post został scalony z istniejącym tematem: Voice assistant (hardware) od Nabu Casa
Dorzuce jeszcze do wątku swoje doświadczenia do których doszedłem w sumie przez przypadek. Vosk faktycznie działa szybko i dobrze rozpoznaje ale ma dla mnie jeden ogromny minus który go wyeliminował a którego do końca nie rozumiem:
Nie radzi sobie z rozpoznawaniem słów z daleka.
Dostałem informację od użytkownika który narzekał na działanie asystenta którego zbudował wg mojego projektu. Pochyliłem się nad tematem, przełączając asystenta między Nabu Casa Cloud a Vosk no i wyszło na to że między tymi silnikami jest również duża różnica w odległości działania (na korzyść Nabu). Sprzęt, komendy i odległość ta sama, dlaczego tak jest? Nie mam pojęcia, mówię to co udało mi się przetestować