Sterowanie głosem bez dostępu do chmury

Jestem świeżym użytkownikiem Home Assistant-a i chciałbym dowiedzieć się, czy obecnie jest możliwe bezdotykowe (wyłącznie głos) sterowanie urządzeniami bez dostępu do chmury / WANu.

Dotychczas korzystałem z bramki AIS DEV3, na której na start miałem wbudowany tunel Cloudflare, więc najprostszym rozwiązaniem spełniającym warunek sterowania wyłącznie głosem była integracja z Google Home. Dzięki niej mój głośnik Google Nest Audio miał dostęp do wszystkich urządzeń z bramki, lecz oczywiście rozwiązanie to jest oparte o chmurę.

Przed założeniem tego temat przeszukałem wcześniejsze dyskusje z forum i najbardziej zaintrygował mnie poniższy wpis użytkownika @szopen.

Czy ktoś z Was korzystał z tego rozwiązania? Mnie najbardziej interesowałoby podpięcie tego do głośnika Google, ale podejrzewam, że on “nie potrafi” działać lokalnie. Z kolei sterowanie głosowe z telefonu odpada, ponieważ chcąc aktywować wyzwalacz należy najpierw fizycznie odblokować / wzbudzić telefon.

Od powyższego wpisu minął rok czasu, więc być może pojawiły się inne rozwiązania.

Z góry dziękuję

Pojawiły się, ale rozwiązania sprzętowe nie są dostępne “z pudełka” przynajmniej w tej chwili

W moim przypadku w zupełności wystarczyłby M5Stack Atom Echo. Zastanawia mnie tylko, czy przypadkiem nie ma różnic w czułości mikrofonu pomiędzy np. ESP32-S3-BOX-3, gdyż to jest bardzo istotny aspekt.

@szopen Orientujesz się czy ktoś z forumowiczów z tego korzysta? :slightly_smiling_face:

Czyli docelowo wystarczy zasilić np. M5Stack Atom Echo jako hardware, a obsługę najlepiej konfigurować w poniższy sposób?

Nie jestem fanem asystentów głosowych, ale poszukaj tam
asystent-głosowy

Też mam przyzwyczajenia z AIS dlatego dalej steruje głosem niektóre urządzenia/automatyzacje w domu. Wg mnie wszyscy asystenci bazujący na rozwiązaniach ESP mają dokładnie taka sama czułość mikrofonu (może poza wyjątkiem projektu onju voice którego nie testowałem). Poszperasz na forum to wygrzebiesz moje projekty asystentów z których korzystam do teraz. W AIS mówiliśmy do pilota więc odległość do miktofonu była mała i w takim przypadku zawsze działa fajnie. Tacy asystenci nie mają nawet podejścia do czułości np. google mini. Wprowadzono teraz możliwość mikrofonów stereo co może znacznie poprawić zasięg odbioru dźwięku ale jeszcze nie zdążyłem tego wytresować.
Od pewnego czasu chodzi mi po głowie jeszcze jedna kombinacja z asystentem ale brakuje takiej funkcji lub mojej wiedzy z tego zakresu. Myślałem o połączeniu aystenta DIY typu esp+ asystenta androida np. z tabletu. ESP po wykryciu wake worda uruchamiał by asystenta androida.

Czyli zdecydowanie inaczej (zdecydowanie lepsze warunki) niż do asystentów opartych na ESPHome :wink:

Na tablecie z Androidem można podmienić asystenta na asystenta Home Assistant, właczyć nasłuch na słowo wake word i powinno działać.

Mam podmienionego ale w opcjach androida nasłuch działa ale włącza asystenta googlowskiego a nie Assist. Na razie jedyne co mi przychodzi na myśl to zewnętrzny mikrofon/słuchawka z przyciskiem którego przytrzymanie wywołuje asystenta który jest ustawiony jako domyślny (w moim przypadku Assist z HA).

@boskikak Pomimo iż do teraz korzystałem z bramki od AI-Speaker to nigdy nie korzystałem z asystenta AIS ani pilota, ponieważ to wymaga fizycznej interakcji.

Jako że jestem niepełnosprawny to w sytuacjach kiedy nie mam dostępu do komputera z eyetrackerem pozostaje tylko obsługa głosem. Ale właśnie z naciskiem na słowo WYŁĄCZNIE głosem. Dlatego też korzystam z integracji Google Home, która podpina wszystkie urządzenia z HA do chmury i wówczas są one dostępne w głośniku Google po wywołaniu “Okey Google”.

Jednak gdy przepada połączenie z Internetem, a jest to częsta sytuacja, wówczas nie jestem w stanie nawet nikogo zawołać, korzystając z komendy “broadcast”, czy po prostu włączając urządzenia alarmujące. Stąd też tak zależy mi na bezdotykowym asystencie lokalnym. :slightly_smiling_face:

Przed tym częściowo można się zabezpieczyć, np. w przypadku awarii łącza podstawowego, router przełącza sie na połączenie mobilne.

To faktycznie spore wyzwanie. Moim zadaniem jeszcze trochę i bedzie to w HA całkowicie możliwe, oczywiście bez dostepu do internetu.

Powiem Ci, że nawet o tym nie pomyślałem, ale rzeczywiście jest to do ogarnięcia w mojej sytuacji. Korzystam z routera Mikrotik, który po podłączeniu modemu LTE daje takie możliwości. :wink:

Musiałbym tylko mądrze pokombinować, aby podczas przełączenia na GSM dać dostęp do danych jedynie dla HA i głośnika Google. Nie mieszkam sam, więc zaraz by mi wyczerpali cały transfer. :stuck_out_tongue:

Takie rozwiązanie wykorzystuje w firmie, w dużej skali i działa bardzo dobrze, długie były poszukiwania wspieranego modemu USB aby działał z Mikrotikiem.

To też jest do zrobienia.

Jakiego języka używasz z urządzeniami Google Home?

Oto projekt, w którym system operacyjny został zastąpiony w Xiaomi Mi Smart Clock. Używa się LineageOS, czyli w zasadzie Androida na sterydach. Są też inne projekty, które pozwalają używać ich jako asystentów głosowych z Assist.

2 polubienia

Jaki zatem model polecasz? :wink:

W mikrotiku praktycznie na ma ograniczeń w porównaniu do innych routerów. :stuck_out_tongue: Ograniczeniem jest głównie wiedza użytkowników, gdyż jego konfiguracja nie należy do łatwych. :slightly_smiling_face:

Standardowo angielskiego.

@GSzabados W wolnej chwili poprzeglądam zaproponowane przez Ciebie rozwiązania i zobaczę, czy rzeczywiście radzą sobie z działaniem w obrębie sieci lokalnej.

Ok, then I will reply in English, because that is a bit easier for me, as I do not speak Polish, but used ChatGPT for translation, which I am not sure how correct is.

It worth to look at some of the Assist projects to have local wake word detection and voice control with Home Assistant. I was already thinking what other solution could be used for adding an AI rather locally, than going with the Gemini or ChatGPT way. And the Android table/display seems to be one of the easiest to get the wake word and command to HA. The only issue is the response, because that requires some Text-to-speech, which is usually cloud, like Amazon’s Polly or Google’s Home/Translate voices.

The Mi Smart Clock is around 200 PLN, or something similar on Allegro.

https://allegro.pl/oferta/inteligentny-glosnik-xiaomi-mi-smart-clock-asystent-google-cyfrowy-budzik-16363083825

It seems to be the right platform, as it originally has Google Home, then with the hack it has Android for further improvements.

I am tempted to go on a journey with it, but have not had the time for it yet to fully research the subject before purchasing one.

There is another device which has a similar hack, the Lenovo ThinkSmart View. That has a bigger display and a camera as well, but has some issues with the mic or audio as I remember.