Pytania ogólne dot. problemu Google Assystenta i kilka pomysłów

rm-rf · 27 Grudzień 2022 19:46

Cześć.
Mam szybkie pytanie i chciał bym by ktoś mi w tym przytaknął bądź wyprowadził z błędu, a mianowicie jak wszyscy wiemy wszystkie urzadzenia z asystentem google (google nest, lenovo smart speaker, xiaomi speaker) nie obsługują języka polskiego, natomiast telefony jak najbardziej sobie z nim radzą. Sądze, że problemem jest samo API Google, które nie pozwala na podpięcie w aplikacjach trzecich asystenta google w języku polskim. Gdyby tak zmienić firmware w urządzeniu typu głośnik na pełniejszego androida, mogło by się okazać, że asystent google działa na tej samej zasadzie co w telefonie (pewnie jakieś osobne API do obsługi telefonu/tabletu).
Dobrze myślę? Ktoś badał ten temat głębiej?

szopen · 27 Grudzień 2022 22:14

Nie badałem głęboko, bo jakoś nie marzę aby słuchały mnie takie urządzenia 24/7, ale jeśli chodzi o sprzęt zastosowany w urządzeniach, które wymieniłeś to nie ma szans na Androida, bo one mają za cienki hardware (i systemy na nich są zupełnie inne).

Jakkolwiek z tego co wiem nie ma PL również na urządzeniach, które nawet mają takiego “mniej lub bardziej okrojonego androida” jak wypusty a’la tablet np. Lenovo Smart Display czy Archos Hello.

rm-rf · 28 Grudzień 2022 14:49

Mam podobne odczucia, raczej zastanawiałem się nad rozwiązaniem problemu.
Chodzi głównie o to, że w tym momencie nie widze sensownego systemu głośników w języku PL. W teorii można sobie odpalić serwer rhasspy i spiąć to z satelitami na ESP32 - no ale tu przychodzi kolejny problem bo jak zaczniesz to składać z Matrix Voice czy respeaker to sam jeden moduł to grube $$ kosztuje, do tego obudowa, głośnik, zasilanie itd. i nagle się okazuje, że jeden głośnik kosztuje 800 PLN a potrzebował byś ich 10.
Zamiennikiem może być ESP32 Audio Kit (~ 80zł), no ale znów osprzęt kilkadziesiąt jak nie kilkaset kolejnych PLN i całkowity brak obudów
Dlatego też kombinuję jak to zrobić w rozsądnych pieniądzach z “dobrą” jakością dźwięku i wykonania.
Na ten moment najbardziej optymalnym rozwiązaniem wg. mnie jest zakup np. Lenovo Smart 2 (bo można w niego customowe apk wrzucić) i wrzucenie tam lekko pewnie ztuningowanego GitHub - razzo04/rhasspy-mobile-app: A simple mobile app for rhasspy..
W Teorii to chyba będzie jedno z tańszych rozwiązań. Drugą opcją jest wcześniejsza seria Lenovo Smart oparta na Mediatek MT8167S, gdzie są dostępne AVB by go odblokować, niestety nie wiem czy da radę wrzucić customowe aplikacje, póki co ROMu nie ma. Być może jakąś tanią sztukę gdzieś z allezło ogarnę to się wypowiem więcej.

artpc · 28 Grudzień 2022 20:02

Z głośnikami google to bym się wstrzymał jak na razie, bo nie widać tam świetlanej przyszłości, a o języku PL na głośnikach można zapomnieć . Rhasspy https://forum.arturhome.pl/t/home-assistant-lokalna-alternatywa-dla-asystenta-glosowego/7496?u=artpc

rm-rf · 29 Grudzień 2022 09:07

Cześć @artpc . Sądzę, że tak samo możemy się wstrzymać z cieszeniem się z natywnej integracji asystenta głosowego w HA.
Czuję, że to będzie po prostu bardziej dostosowany/natywny fork rhasspy wbudowany w HA. Jak by nie było to na ten moment żaden z producentów nie wyprodukował smart głośników na ESP32 by mogły służyć jako satelity do rhasspy i tak samo jak dla innych asystentów - żaden producent nie wyprodukuje tu dedykowanego głośnika za szybko a nawet jeśli to cena będzie bardzo zawyżona.
Druga sprawa to to, że mogę przypuszczać, że taki głośnik/satelita zrobiona dla rhasspy będzie kompatybilna z nowym asystentem w HA. HA nie ma bezpośredniego wsparcia dla głośników bluetooth i bez modułów ESP32 nie widze póki co jak to mogło by być rozwiązane. Niestety tu będzie ciężka bitwa by mieć sprzęt out-of-box do zabawy z HA.

szopen · 29 Grudzień 2022 13:17

W ogóle działająca i współczesna obsługa bluetooth w HAOS jest zaledwie od 2 czy 3 miesięcy, rozwój OS’a ciągnie do przodu kilka osób (na palcach jednej ręki da się policzyć) ale przy wsparciu ogromnej rzeszy użytkowników (liczonej w setkach czy może już tysiącach osób), no i nie jest to budowa czegoś od zera.
Natomiast Rhasspy z tego co widzę ciągnie jeden programista, a wsparcie użytkowników jest wręcz symboliczne.

Tu może mogłaby pomóc np. kwalifikacja projektu np. do GSoC (ale jakoś nie kojarzę na GSoC z ostatnich lat żadnego projektu powiązanego z HA… no jest też druga kwestia - nie jestem programistą, ale interesowało mnie wskrzeszenie BeOS’a i tam udział w GSoC znacząco przyspieszył rozwój, ale wciąż nie na tyle aby to mógł być system w pełni użytkowy na zabytkowy sprzęt).

Ktoś w którymś z ostatnich wątków związanych z tematem połączenia sił HA z Rhasspy porównywał pracę kliku korporacji do czegoś co dotąd ciągnął jeden człowiek, no więc moim zdaniem szanse są jakie są… (nie zapominajmy, że nad asystentami głosowymi pracowały nie tylko Google i Amazon, ale też Apple i Microsoft, swoją drogą niektóre z nich opracowały niezłe wsparcie dla języka polskiego, który do łatwych nie należy, a oprócz nich jeszcze całe mnóstwo pomniejszych firm, w tym niektóre powiązane z tematyką ID i IoT).

Natomiast jeśli chodzi o wsparcie sprzętowe - warto spojrzeć na HA Yellow - “na pniu” sprzedało się kilka tysięcy egzemplarzy (teraz już to podchodzi prawie pod 10k sztuk) mimo braku perspektyw na wyprodukowanie w ciągu jednego roku.
Więc podejrzewam, że gdyby powstała jakaś sensowna konstrukcja to odzew byłby podobny (a może i większy?), no nie zapomnijmy że obecnie jest już ponad 200k instalacji HA (~100% więcej niż równo rok temu), a jak patrzę po znajomych pracujących w branżach zaawansowanych technologii, to wciąż jest jeszcze szerokie miejsce na rynku dla HA i pochodnych, bo zainteresowanie poza ścisłymi grupami pasjonatów zaczęło rosnąć dzięki ogromnej popularyzacji IoT przez wytwórców “chińskich śmieci” (możliwość kupna namiastki ID w dyskoncie spożywczym jednak ma duży wpływ na tzw. szarych ludzi).

macek · 29 Grudzień 2022 16:48

Sorry ale nie wiem dlaczego tak “uczepiłeś się” tych satelit (bez obrazy), żadne obecne rozwiązanie nie opiera się o satelity, jest głośnik z mikrofonem i to będzie działać nawet w przypadku rhasspy, np. Hardware - Rhasspy dlatego zacznijmy od prostego rozwiązania a nie od największego wyzwania jak są satelity. Możliwości rhasspy i jego integracji z HA można już teraz poznać instalując GitHub - rhasspy/rhasspy-junior: Simplified voice control for Home Assistant, wiadomo po angielsku, próbuję to odpalić na NUC z wbudowaną kartą sieciową i mikrofonem.

Wydawanie poleceń po polsku jest już w projekcie https://ai-speaker.com/, zabrakło jednak najważniejszego - głośnika z mikrofonem, jednak wydawanie poleceń przez telefon lub ich pilota działa bardzo dobrze.

rm-rf · 29 Grudzień 2022 19:03

@macek Ja rozumiem o czym mówisz i jak najbardziej wiem, że pcham się na głęboką wodę
W systemie satelit plusem jest to, że mając 10 pomieszczeń i 10 głośników możesz sobie sterować wszystkim z dowolnego miejsca bez zastanawiania się czy głośnik nie słyszy czy nie. Druga sprawa odtwarzanie muzyki w jakimś stereo czy quadro na pewno też lepiej wyjdzie z serii takich głośników niż z jednego.
Ja Rhasspy u siebie odpaliłem z TTS podpiętym w google cloud - te 2$ miesięcznie mnie nie przerażają

macek · 29 Grudzień 2022 19:47

Rozwiniesz to. [uzupełnienie do 20 znaków]

rm-rf · 29 Grudzień 2022 20:08

W rhasspy możesz osobno zdefiniować TTS - tam użyłem googlowego Wavenet (użycie jest odpłatne) Text to Speech - Rhasspy , ale jakościowo mi odpowiada.
a w drugą stronę do SST deepspeach Speech to Text - Rhasspy . Nie wiem do końca też o co pytasz? Musisz konto na google cloud mieć i w konsoli developer odpalić sobie API dla TTS i podpiąć do konfiguracji tak jak tam w linku jest.