Wywaliło mi wszystkie routery zigbee - przyczyna?

Co może być przyczyną, że wywaliło mi z sieci Zigbee wszystkie routery (widzę stan “poza siecią”) a zostawiło tylko urządzenia końcowe??

Chociaż… wygenerowałem teraz mapę sieci Zigbee i widzę, że czujniki temperatury mimo, że ich stan to “w sieci”, nie są do żadnego routera podłączone (muszę zrobić rundkę i sparować ponownie :smirk: )

W tym czasie ustawiałem prostą automatyzację (czujka ruchu odpala światło) z poziomu HA oraz wyłączyłem taką samą w Node Red (staram się konfigurować wszystko w czystym HA o ile jest taka możliwość).

Nigdy wcześniej nie miałem takiej sytuacji :expressionless:

Home Assistant 2023.3.4
Supervisor 2023.03.1
Operating System 9.5
Interfejs użytkownika: 20230309.0 - latest

Zigbee2MQTT 1.30.2-1

CC2652P

Dlaczego zakładasz, że coś “wywaliło” wszystkie(!) routery z sieci, przecież to sytuacja skrajnie nieprawdopodobna.

Mapa sieci w wielu sytuacjach (również nie związanych z jakaś konkretną awarią) potrafi pokazywać zupełne bzdury.

Ja bym założył, że koordynator się np. zawiesił lub wysypała się integracja i zaczął od najprostszego kroku - zamknięcia systemu “po bożemu” oraz ewentualnie odłączenia koordynatora z USB na paręnaście sekund (jeśli nie masz pewności, że porty USB w stanie standby mają odcięte zasilanie, bo na niektórych platformach mimo zamkniętego systemu zasilanie może na nich pozostawać - prawdopodobnie stąd powstał mit, że tzw. “ruski reset” może pomóc, a potrafi zaszkodzić bardziej, a tymczasem zwykle wystarcza odpowiednia konfiguracja BIOSa by porty miały odcinane zasilanie, no są takie konstrukcje gdzie to awykonalne, ale to głównie egzotyka w rodzaju tv-boxów).

PS Jaką masz wersję firmware w tym koordynatorze?

Zgadza się. Ale jak nie “coś” to co? :smiley: :wink: Zawsze jest “coś” co zawiniło, pytanie tylko co :stuck_out_tongue:

To zrobiłem, nie pomogło.

Tego nie zrobiłem. Może kiedyś (oby nie :wink: ). Zasilanie nie było na bank odcięte bo serwer chodzi ponad 2 lata bezawaryjnie.

Typ koordynatora: zStack3x0
Wersja oprogramowania koordynatora: 20220219

BTW przeszedłem się i sparowałem wszystko ponownie.

Więc mogłeś odłączyć dongla i już, nie mam szklanej kuli by wyczytać, że to jakaś wirtualizacja “na bogato” i nie możesz tego zamknąć.

możesz śmiało podnieść wersję na 20221226 (ma poprawki dla dużych sieci)

PS ostatni dobry backup sieci Zigbee prawdopodobnie by przywrócił całość sieci do działania bez konieczności poprawnego parowania, ale skoro już sparowałeś to zapomnij o starych backupach i zabezpiecz backup po parowaniu.

HA stoi na Proxmoksie. Po rundzie po całym domu i parowaniu wszystkiego od nowa stwierdziłem że “wyciągnę sobie sticka i włożę ponownie”… Efekt: znów wywaliło wszystko :expressionless: Dziwne, bo wiele razy był on przeze mnie już wyciągany. Może w najnowszej wersji HA coś jest nie halo?

Dzięki, zaktualizowałem do polecanej przez Ciebie wersji.

Nie wiedziałem, że tak można. Znalazłem tutorial:

i na jego podstawie jutro podejdę do tematu.

@szopen Hmm… wyjąłem z ciekawości sticka, włożyłem ponownie i znów wszystko się wysypało :expressionless:

Warning 2023-03-16 01:45:06Failed to ping 'Żarówka biurko' (attempt 1/1, Read 0x14fffe8ac4a2/1 genBasic(["zclVersion"], {"sendWhen":"immediate","timeout":10000,"disableResponse":false,"disableRecovery":true,"disableDefaultResponse":true,"direction":0,"srcEndpoint":null,"reservedBits":0,"manufacturerCode":null,"transactionSequenceNumber":null,"writeUndiv":false}) failed (Data request failed with error: 'No network route' (205)))
Debug 2023-03-16 01:45:09Active device 'Żarówka biurko' was last seen '89.74' minutes ago.
Warning 2023-03-16 01:45:12Failed to ping 'ZBMINI Kotlownia' (attempt 1/1, Read 0x27fffe28094a/1 genBasic(["zclVersion"], {"sendWhen":"immediate","timeout":10000,"disableResponse":false,"disableRecovery":true,"disableDefaultResponse":true,"direction":0,"srcEndpoint":null,"reservedBits":0,"manufacturerCode":null,"transactionSequenceNumber":null,"writeUndiv":false}) failed (Data request failed with error: 'No network route' (205)))
Debug 2023-03-16 01:45:15Active device 'ZBMINI Kotlownia' was last seen '83.21' minutes ago.
Warning 2023-03-16 01:45:19Failed to ping 'SWI_Rafal' (attempt 1/1, Read 0x14fffe9af66c/1 genBasic(["zclVersion"], {"sendWhen":"immediate","timeout":10000,"disableResponse":false,"disableRecovery":true,"disableDefaultResponse":true,"direction":0,"srcEndpoint":null,"reservedBits":0,"manufacturerCode":null,"transactionSequenceNumber":null,"writeUndiv":false}) failed (Data request failed with error: 'No network route' (205)))
Debug 2023-03-16 01:45:22Active device 'SWI_Rafal' was last seen '84.63' minutes ago.
Warning 2023-03-16 01:45:25Failed to ping 'ZBMINI Rozdzielnia' (attempt 1/1, Read 0x50fffeab6fcd/1 genBasic(["zclVersion"], {"sendWhen":"immediate","timeout":10000,"disableResponse":false,"disableRecovery":true,"disableDefaultResponse":true,"direction":0,"srcEndpoint":null,"reservedBits":0,"manufacturerCode":null,"transactionSequenceNumber":null,"writeUndiv":false}) failed (Data request failed with error: 'No network route' (205)))
Debug 2023-03-16 01:45:28Active device 'ZBMINI Rozdzielnia' was last seen '83.42' minutes ago.

A zatrzymałeś Z2M przed wyjęciem sticka?

Nie, wcześniej zdarzyło mi się wyjąć sticka i tego typu problemu nie było. Być może to był błąd.

Zweryfikuję to jak ponownie sparuję urządzenia i wykonam backup sieci Zigbee. Dam znać w ciągu dnia, teraz czas na sen :wink:

Skoro i tak się wysypało to zaktualizuj mu firmware przed kolejnym parowaniem.
Oprócz tego pewnie warto usunąć stary backup sieci.

Można spróbować zweryfikować czy np. flash się nie sypie, jakkolwiek wydaje mi się, że narzędzie do flashowania jest w stanie dokładnie sprawdzić tylko obszar firmware (zapisując i odczytując go ponownie - zaznaczony readback), ale sądzę, że w przypadku uszkodzenia kości flash błędy powinny wystąpić nawet podczas kasowania (wszystkich nieprotektowanych stron), no nie miałem jeszcze w ręce koordynatora z ewidentnie uszkodzonym flashem…

Trochę OFF TOPIC
W przypadku CC2531 zdarzały się przypadki napisania obszaru firmware danymi które powinny się znaleźć w obszarze NVRAM, co było i jest spowodowane błędami w firmware (obecnie już nienaprawialnymi z powodu wycofania wsparcia przez producenta - CC2531 jest konstrukcją sprzed grubo ponad 10 lat), tak przynajmniej twierdzili mądrzejsi i istotnie powtórne flashowanie naprawiało sticka.
W przypadku CC2652 i pochodnych TI nadal wspiera rozwój FW (i najświeższa wersja jest na bazie nowszego SDK niż poprzednie).

Tak przy okazji ZigStar Multi Tool ma oddzielne opcje umożliwiające zrobienie backupu czy skasowanie samego obszaru NVRAM.

tutaj masz link jak zachować stary adres koordynatora przy fashowaniu Copying the ieee address of an adapter | Zigbee2MQTT

Fabryczny adres ieee koordynatora zachowany jest na zawsze w nim samym (załatwiają to protektowane obszary jednokrotnego zapisu - efuse) i nie ma szans by go skasować (to informacja odnośnie CC2652 i pochodnych, adres BLE też jest w nich zapisany na stałe, być może są jakieś koordynatory które mają te kluczowe adresy nieprotektowane, ale ja nie słyszałem o takich).

Ba w normalnej sytuacji jest przewidziany drugi obszar efuse (fabrycznie zawiera same FF gdy jest pusty), na tzw. secondary ieee oraz secondary BLE - one umożliwiają jednokrotny zapis adresów pobranych z innego dongla np. w wypadku awarii tego starego i konieczności transferu sieci na inny koordynator.

Nie wiem czy i jak obecnie to rozwiązanie jest wykorzystywane w Z2M, ale z pewnością nie dotyczy sytuacji kasowania czy upgrade firmware.

1 polubienie

Zaktualizowałem, obecna specyfikacja:

Wersja Zigbee2MQTT 1.30.2 commit: unknown
Typ koordynatora zStack3x0
Wersja oprogramowania koordynatora 20221226

Naprowadzisz mnie jak go usunąć? To co teraz zrobiłem to pobrałem backup Z2M przez Ustawienia / Narzędzia / Request z2m backup i zapisałem w bezpiecznej lokalizacji.

Dzięki. Jak będę migrował na innego sticka to będzie to przydatna informacja. Natomiast obecnie z tego CC2652P jestem BARDZO zadowolony. Dobry zasięg i stabilność od 2-3 lat (tyle co go posiadam). Kolejnym pewnie będzie ten wspierający Thread i Matter.

@szopen @Primo w jaki sposób przywraca się backup wygenerowany przez Ustawienia/Narzędzia/Request z2m backup?

  1. Backup usuwasz FAQ | Zigbee2MQTT punkt 3

  1. przywracania nigdy sam nie robiłem. Samo się odtwarzało z tych plików w tej lokalizacji

Jak po każdym sparowaniu zrobisz backup w z2m to nie musisz przegrywać tych plików w inną lokalizację. To już ogarnie backup z HA lub przez addon google drive backup

Dzięk, to bardzo przydatne informacje.

Zagłębiłem się bardziej i znalazłem to:

If after some uptime Zigbee2MQTT crashes with errors like: SRSP - AF - dataRequest after 6000ms or SRSP - ZDO - mgmtPermitJoinReq after 6000ms it means the adapter has crashed.

źródło: Zigbee2MQTT crashes after some time

Kojarzę wczoraj czerwone dymki/komunikaty z tego typu błędem. Szukałem w logach ale już wyparowały.

Prawdopodobnie musiałem ruszyć koordynatorem (wpięty jest bezpośrednio do serwera) gdy konfigurowałem nowe urządzenie po RS485.

@szopen miałem odtworzyć mój problem jak wykonam backup ale… wybacz, nie chcę ryzykować. Już 2x wszystko parowałem na nowo więc odpuszczę sobie (mimo, że mam backup i jestem przygotowany jak nigdy :wink: ).

@szopen @Primo bardzo dziękuję Wam za pomoc. Mając backup i wiedząc jak go użyć jestem spokojniejszy o przyszłość :smiley: