Voice assistant local

szopen · 12 Styczeń 2026 20:53

Już wyszły mocniejsze MCU od Espressif - jest to P4 ale wciąż daleko do przetwarzania wszystkiego w MCU.

Przy założeniach jakie masz, komputer musi być po prostu dość świeżej generacji, więc bądźmy realistami (wprawdzie przykładowo Openvino lata już na intelach 6 generacji z IGPU, ale wydajność ma sensowną gdzieś od 12 generacji i nie na najbiedniejszych konstrukcjach, no i oczywiście działa choć nieco nieoficjalnie na AMD).

Z innej beczki, ceny RAMu DDR5 oszalały podobno dlatego, że budują się centra danych pod AI… ja bym się spodziewał też nie za tanich ssd.
Wniosek - sprzęt należało kupić najnowocześniejszy jak się da w zeszłym roku, oczywiście możemy czekać aż bańka AI pęknie, ale to i tak odracza takie pomysły o ładnych kilka lat.

A tak odnośnie tematu który ruszyłeś - jeden z moich wujków poruszał się za życia Simsonem DUO, ale to chyba było >30 lat wstecz.

Allon · 12 Styczeń 2026 21:07

Jak masz trochę wolnej chwili to złożysz dobry sprzęt w budżecie 2000 trzeba będzie kupić tylko używaną grafikę, procesor i z 32gb ramu ddr4(bo na ddr5 nawet nie ma co się nastawiać). Ceny DDR5 oszalały przez to że budują centra pod AI i do tego OpenAi kupiło 40% płytek krzemowych do ramu.

szopen · 12 Styczeń 2026 23:26

Może ujmę to tak - ja sprzęt już mam, oczywiście na DDR4 (którą to pamięć i tak miałem w nadmiarze już wcześniej, a nadzieję na zmianę trendów cenowych ostatecznie straciłem w grudniu i dostosowałem do tego swoje plany zarówno zakupowe, jak i wykorzystania dotychczasowego sprzętu) i nie planuję już więcej zmian w najbliższym czasie - po najnowszych zmianach konfiguracja będzie wystarczająca na moje potrzeby na jakieś kolejne 10 lat.

Konkretniej tym co mnie zadowala (i trafiłem tanio) jest Asus NUC 13 Pro Tall Kit NUC13ANHI5, i5-1340P, 2x slot SODIMM DDR4, wysoka obudowa (miejsce na 3 dyski - 1x m.2 key M 2280 nvme + 1x m.2 key B 2242 sata +1x 2,5’ sata), można zdemontować kartę WiFi+BT/BLE m.2 2230 key E (czyli zamiast niej może wejść np. Google Coral m.2 w wersji Key A+E), co akurat uważam za ważne, bo spotkałem już konstrukcje z wlutowaną kartą m.2 WiFi+BT/BLE, czy lutowanym RAM.
Oraz ewentualne do zatoki rozszerzeń (i w większości wypadków równocześnie zamiast dysku m.2 sata) wchodzą jak dla mnie dziwaczne konstrukcje Gorite dedykowane głównie dla serii NUC11TNH/NUC12WSH/NUC13ANH, w tym chyba najciekawszy NUCIOALUWS dodający drugi Ethernet (2.5Gbps) + 2 porty USB2 (jakkolwiek żadnego z tych rozszerzeń nie planuję i w ogóle są absurdalnie drogie).

Jakkolwiek jeśli masz jakieś swoje typy, to załóż stosownie zatytułowany wątek wspominając, że chodzi o rok 2026 (a w sumie nie wiem czy masz na myśli hosta pod HAOS czy proxmoxa, czy cokolwiek innego, a jednak wymagania są różne) tam

oczywiście bez spamu, reflinków, czy linków do sklepów
(najlepiej producenci i modele + linki do oficjalnej dokumentacji producentów).
Z pewnością wielu czytelników ucieszy się z odświeżenia takich zagadnień w obecnej sytuacji rynkowej.

Romek_Z · 14 Styczeń 2026 05:24

Ktoś tutaj wcześniej pisał o bańce AI. Coś zaczyna się dziać: “Apple zawiązuje współpracę z Google”

Allon · 14 Styczeń 2026 05:51

Chodzi o to że Gemini będzie na iphonah zamiast Siri. Bo Apple ż AI zostało w tyle ich najnowszym wynalazkiem jest nowy kalkulator.

artpc · 14 Styczeń 2026 23:22

Nigdy nie wiedziałem do czego ten twór służy/ł, zainstalowany chociaż go nie chciałeś, pewnie tylko po to by zbierać dane z twojego telefonu, mikrofonu, nawet po zatrzymaniu usługi Siri i tak po chwili sama się uruchamiała. AI przez lata wykradali co się dało po to żeby teraz sprzedawać to w postaci abonamentu. Przypomina mi się historia AI które potrafiło napisać aplikację na podstawie promptów, nie pamiętam już kto to kupił, ale w efekcie końcowym okazało się że za ścianą siedzi grupka indyjskich programistów i piszę ci aplikację

Allon · 15 Styczeń 2026 05:54

Wszyscy cię podsłuchują ile razy miałeś tak że rozmawiałeś z kimś i mówisz “przydał by mi się nowy telefon” a na drugi dzień powiadomienia ci przychodzą żebyś telefon kupił bo jest na “promocji”

Romek_Z · 16 Styczeń 2026 06:52

Ok, temat zjechał na AI, ale to właśnie pokazuje, że system local, bez łączności z zewnętrznymi podmiotami ma jak najbardziej sens. Na githubie gdy ogląda się sentencje w PL widać jak na dłoni dlaczego w PL lokalny asystent konwersacji działa miernie. Tam prawie nic nie ma (dobrze rozumuje, że HA korzysta z tych zasobów?). Ja się nie poddaje, będę dawał znać. Na razie uruchomiłem zmianę programów w moim LG za pomocą VA, bo to ma sens. Teraz pracuje na wpisywaniem zdarzeń do kalendarza. Jako, że programista ze mnie żaden i czasu mało, idzie mi to słabo, ale bawi mnie to samo w sobie, wiec OK.

angler · 16 Styczeń 2026 10:12

Taki świeży pomysł, według autowa 100% lokalnie. Tylko, że nadal nie mamy globalnego gracza, który udostępnił by obsługę w języku polskim.

https://www.smarthomejunkie.net/control-home-assistant-with-google-home-via-matter-100-local-no-subscription/

Allon · 16 Styczeń 2026 11:29

Ale to można przecież podpiąć asystenta google do HA

Romek_Z · 16 Styczeń 2026 12:17

Ale to już nie lokalne przetwarzanie

angler · 16 Styczeń 2026 12:35

Tak sobie myślę, że to duże uproszczenie autora, bo nie wyobrażam sobie jak niby ma się to odbywać lokalnie (“Hey Google…”). Moim zdaniem rozpoznawanie i przetwarzanie komend głosowych nadal leci do chmury Google. Zgodzę się, że kontrola urządzeń odbywa się lokalnie via Matter, ale nie rozpoznawanie głosu.

Romek_Z · 16 Styczeń 2026 13:01

Tutaj nie ma uproszczenia. STT może działać lokalnie, jest kilka opcji. Mamy Whisper, Vosk i pewnie kilka innych. Problem taki, że one dobrze działają z EN, a z PL radzą sobie różnie. Dlatego ważne są w lokalnym przetwarzaniu słowa klucze.

Allon · 16 Styczeń 2026 13:14

sorry za tamtą odpowiedź trochę sie zapomniałem. Ale do rzeczy czy testowałeś takie rozwiązanie Whisper-VOSK Loop. A czy możesz mi powiedzieć @Romek_Z jaki masz sprzęt bo nie widziałem w wątku.

maciej1 · 16 Styczeń 2026 13:17

Dorzucam offtop na temat iphone/siri, dla zainteresowanych

(Temat zgłębiałem jakiś czas temu, ale ztcw nic się od tej pory nie zmieniło)

Zaawansowane funkcje głosowe w iphone (tylko ten sprzęt Apple mam) realizowane są poprzez Siri, która nie obsługuje języka polskiego. W przeciwieństwie do samego urządzenia/systemu: mogę np. stworzyć komendę głosową (skrót), która odpali automatyzację i ta automatyzacja będzie zadawać pytania, przetworzy odpowiedź, a na koniec opowie co zrobiła - cała komunikacja po polsku. W tym celu używam w automatyzacji magicznego polecenia “przestań korzystać z Siri”

I teraz najlepsze:

sam skrót/komenda jest częścią Siri, więc nie może być polskim słowem czy zdaniem
przy zablokowanym ekranie (czyli w typowych okolicznościach, gdy chcesz wydać komendę głosową) mogą działać tylko rzeczy w 100% korzystające z Siri.

Szach-mat

Romek_Z · 16 Styczeń 2026 14:05

Mam HP T630. Testowałem Whisper i Vosk. Vosk słabo robi radzi z PL. Whisper zdecydowanie lepie, ale na moim sprzęcie długo trwa przetwarzanie. Póki co to przerzuciłem STT w chmurę, aby dalej testować sentencje. STT to problem sprzętu - czyli kasy. Jak już będę zadowolony w lokalnego asystenta to przyjdzie tylko wydać kasę na lepszy sprzęt. Zastanawiam się. czy nie lepiej mieć STT na całkowicie osobnej maszynie, ale to sprawa przyszłości. Odkąd pojawił się Raspberry 5, jest sporo prób do wykorzystania jego jako maszyny STT.
A można już kupić RPi w wersji 16GB RAM
Mamy jeszcze projekty czystko polskie, może cos z nich będzie w przyszłości.

Allon · 16 Styczeń 2026 14:13

To bez RPI się nie obędzie ale nie kupuj samej raspberry bo też tego nie uciągnie jak już chcesz to zrobić na RPI to dokup jeszcze AI HAT+ 2 chwilę temu wypuścili ma wbudowane 8gb ramu. HA zostaw na T630 i połącz z RPI przez Wyoming. Nawet możesz z tego zrobić satelitę z głośnikami i mikrofonem.

angler · 16 Styczeń 2026 14:28

Allon · 16 Styczeń 2026 14:48

Ale jak tak nadtym się zastanowić to w tym samym budżecie masz mini PC z N100/N150 który jest jeszcze lepszy pod whisper choć zużywa troszkę więcej prądu.

szopen · 16 Styczeń 2026 15:14

@Allon @Romek_Z
Fundacja Raspberry jest zarządzana przez tych samych ludzi, którzy prowadzą Raspberry Trading, więc ideały trafił szlag - teraz kasa się liczy…
Druga ważna kwestia to kurczowe trzymanie się konstrukcji Broadcom, który sam w sobie jest anty-otwarto-źródłowy…
I trzecia - maliny to pajęczarstwo, a konstrukcje które mają jakiś sens czynią hosta opartego na malinie znacznie droższym od peceta o porównywalnej wydajności…

TLDR
malina nie jest dobrym wyborem, sensowniejszy jest mądry wybór jakiejś konstrukcji PC (@Allon tam proponowałeś dobór jakiegoś sensownego sprzętu na 2026 rok, więc zgodnie założeniami forum skrobnij na ten temat osobny wątek - czytelnicy na 100% się ucieszą).

Sam nie doradzę jednak co wybrać, bo osobiście jestem fanem wypustów Pegatron, a one tanie nie są (za to wiem, że wybitnie trwałe, a to jest jedno z kluczowych założeń dla hosta automatyki domowej).