Voice assistant (hardware) od Nabu Casa

Dołącz do:

aby zobaczyć sprzętowe rozwiązanie voice assistant od Nabu Casa czyli smart głośnik od twórców HA:
“It is no secret: our voice hardware will be revealed on 19 December 2024. Language leaders have already got their hands on the device, and are working extremely hard to polish support for their language.”

I będzie działał tylko przez NABU, tak luźna myśl.

Zgodnie z zapowiedzią sprzęt jest dziś w sprzedaży, ale w szczegóły techniczne nie wnikałem, sprzętowa baza to
ESP32-S3 w dość rozbudowanej wersji 16 MB flash i 8 MB octal (czyli dość szybkiej wersji, bo na SPI z 8bitowej szerokości magistralą) PSRAM
procesor audio XMOS XU316
DAC wyjściowy TI AIC3202

języka polskiego nie wspiera bez chmury (co raczej było do przewidzenia) podobnie jak francuskiego, duńskiego, rumuńskiego, chorwackiego i wielu innych (są i takie, które są oznaczone jako słabo wspierane lub w ogóle nie)
gama języków wspieranych lokalnie nie jest zaskakująca

W dziale dokumentacji technicznej i na wiki jeszcze nie ma żadnych informacji…

No i wykorzystany dual microphone więc jest progres :wink:

Jak na Botland będą na stocku to kupuje. Może ten nie będzie się wieszał. Zmontowałem sobie coś podobnego z RPi Zero2W z DAC i po paru dniach jest zwiecha. Myślałem, że może się przegrzewa ale radiatory też nic nie dają. Więc czekam na ten z HA :smiley:

Gdyby kogoś to interesowało - właśnie dostałem maila z Botland, że paczka została wysłana - zgodnie z terminem jaki był widoczny pierwotnie na stronie. Teraz kolejny restock mają na luty 2025.

1 polubienie

Można zamawiać też w Czechach, tam jest dostępność bodajże za parę dni albo z ChRL - bezpośrednio w seeedstudio (tam sprzęt jest dostępny cały czas).

Jeśli chodzi o mnie to poczekam, aż PL będzie wspierany lokalnie, bo sensu w używaniu chmury to nie widzę (nie po to nie używam asystentów głosowych dostarczanych od lat przez duże korporacje by nagle zmienić podejście).

1 polubienie

Pytanie czy będzie. Też dostałem emaila, że przesyłka w drodze i tak się zastanawiam czy się nie zależy w szufladzie :slight_smile:

Na streamie tłumaczyli, że to jest Preview w nazwie dlatego bo jeszcze nie wszystko jest od strony softu gotowe i będą dalej to rozwijali. Oczywistym jest, że musi być język PL.

Hmm, jak to mówią musi to na Rusi, polski jest jednym z trudniejszych języków dla rozpoznawania maszynowego, a hardware nie jest aż tak znowu mocny (jedynym plusem jest procesor audio dla mikrofonów, reszta jest porównywalna ze znanymi konstrukcjami DIY), więc zobaczymy…

O tym jak trudny jest język polski niech świadczy to

Przypierd@lanie się o głupi przecinek jest słabe.

Nie chodziło o przecinek, tylko o to że język polski jest trudny, ale nawet nie raczyłeś zajrzeć w linka…

3 posty zostały podzielonye na nowy temat: RPi Zero 2 W as a Wyoming Satellite

Dzisiaj odebrałem urządzenie i jestem po pierwszych testach. Podpięło się do HA bezproblemowo, użyłem do tego telefonu i aplikacji. To jest ok, co do działania, korzystam z chmury, więc jest język polski, ale na początek przy nie do końca zdefiniowanych aliasach częściej słyszę, że mnie nie rozumie, niż cokolwiek wykonuje. Definicja aliasów też do końca nie rozwiązuje problemów. Pierwsze wrażenie bardziej gadzet niż urządzenie do komunikacji z HA. Ale może ja też muszę się jeszcze nauczyć korzystac z niego.
Takie pierwsze wrażenia na gorąco.

2 polubienia

Dlatego ja przede wszystkim korzystam z komend głosowych jako wyzwalaczy automatyzacji które np. podają mi temperaturę, włączają/wyłączają urządzenia itp. Rozumiem że niektórzy wymagają od asystenta żeby był na tyle inteligentny żeby sam wszystko interpretował i wykonywał ale ja akurat jestem po tej stronie barykady w której decyduje gdzie inteligencja domu ma się kończyć :smile: dodatkowym utrudnieniem jest nasz język ojczysty który jest mega trudny dla ludzi a co dopiero dla maszyny :face_with_peeking_eye:

Mam to od piątku i póki co jest ok. Wakeword nie zawsze łapie. Oprócz tego to działa pod spodem tak samo jak miałem do tej pory z malinką do sterowania wszystkim co się da przez Extended OpenAI Conversation.

Proszę opisz swoje doświadczenia w tym temacie w osobnym wątku. Namawiam użytkowników forum aby opisywali swoje projekty, doświadczenia a nie tylko prosili o pomoc w rozwiązaniu problemów.

Po tygodniu zabawy z tym urządzeniem (VPE) mogę to potwierdzić. Na pewno łapie z drugiego końca pokoju ~3m. Przy włączonej muzyce potrafi prawidłowo zbierać to co mówię.
Największy problem jest z samym wakewordem bo nie zawsze to złapie.

1 polubienie

VA działa u mnie z chmurą Nabu Casa, jednak całość przypomina “kierunkowskaz” - raz rozpoznaje wakeword, a raz nie, raz rozpozna komendę, a za chwilę podobna komenda nie wywołuje żadnego efektu.

To gadżet, będący ew. elementem badania rynku. Po 3 dniach testowania postanowiłem go zwrócić.

Edit:
Po obejrzeniu filmu z innego wątku na forum, postanowiłem zrobić podobny test w mniejszych pomieszczeniach. W najmniejszym tj. 11 m2 ze skośnym sufitem, skuteczność rozpoznawania języka polskiego jest o wiele lepsza. VA sprawdzi się więc w małych pomieszczeniach ale musi leżeć “na widoku”. Postawienie przed urządzeniem nawet niewielkiej doniczki z kwiatkiem znacznie pogarsza jego działanie.

Raczej to nie dziwi, skoro tam jest preprocesor dźwięku wystrojony zapewne do normalnych warunków, w których fale audio docierają bez dziwnych rozpraszaczy po drodze (taka doniczka totalnie zmienia pole akustyczne).

Stawianie przeszkód przed mikrofonami to jak chodzenie do gęstego lasu by oglądać gwiazdy nocą…