Zigbee2mqtt problem z wieszaniem się

Mam w swoim HA zainstalowany dodatek ZigBEE2MQTT w wersji 1.34.0-1
do tego koordynator w postaci dongla usb-ITEAD_SONOFF_Zigbee_3.0_USB_Dongle_Plus_V2_20221031172315-if00
Mój problem to ciągłe wieszanie się dodatku Zigbee2MQTT - przynajmniej raz dziennie muszę go zrestartować bo inaczej nie przesyła ustawień do urzadzeń

No i co??? Może jakieś logi?

OFF Topic: Widzę, że powoli też już tracisz cierpliwość na takie posty :grin:.

W tym problem ze poza informacjami o odczycie stanu

Zigbee2MQTT:info  2023-12-14 11:53:38: MQTT publish: topic 'zigbee2mqtt/Temperatura Wojtek', payload '{"child_lock":"UNLOCK","current_heating_setpoint":18,"deadzone_temperature":null,"heat":"OFF","linkquality":132,"local_temperature":20,"local_temperature_calibration":-3,"max_temperature":45,"max_temperature_limit":null,"min_temperature_limit":3,"preset":"program","preset_mode":"program","program":{"saturday_p1_hour":7,"saturday_p1_minute":0,"saturday_p1_temperature":18.5,"saturday_p2_hour":13,"saturday_p2_minute":0,"saturday_p2_temperature":18,"saturday_p3_hour":15,"saturday_p3_minute":30,"saturday_p3_temperature":18.5,"saturday_p4_hour":20,"saturday_p4_minute":30,"saturday_p4_temperature":17,"sunday_p1_hour":6,"sunday_p1_minute":0,"sunday_p1_temperature":18.5,"sunday_p2_hour":13,"sunday_p2_minute":30,"sunday_p2_temperature":18.5,"sunday_p3_hour":16,"sunday_p3_minute":30,"sunday_p3_temperature":19,"sunday_p4_hour":20,"sunday_p4_minute":30,"sunday_p4_temperature":17,"weekdays_p1_hour":5,"weekdays_p1_minute":0,"weekdays_p1_temperature":18,"weekdays_p2_hour":6,"weekdays_p2_minute":30,"weekdays_p2_temperature":17,"weekdays_p3_hour":16,"weekdays_p3_minute":30,"weekdays_p3_temperature":18.5,"weekdays_p4_hour":20,"weekdays_p4_minute":30,"weekdays_p4_temperature":17},"running_state":"idle","sensor":"IN","system_mode":"heat"}'

Nie widzę żadnych błedów

A co można odpowiedzieć do beztreściowego sformułowania problemu?

@Wojtek_13
Mówisz, że Dodatek się wiesza, więc nie interesują nikogo logi sprzed chwili, tylko z momentu gdy stwierdziłeś zawieszenie, a konkretniej sprzed zawieszenia (najlepiej gdy tylko widać cokolwiek podejrzanego i oczywiście trochę przed), aż do chwili gdy będziesz je zbierał (przed zrestartowaniem zawieszonego Dodatku, ponadto drugi log świeżo po starcie też z pewnością nie zaszkodzi).

Oprócz tego (wszytko poniższe możesz zrobić teraz bez czekania, aż się ponownie zawiesi)

  1. Podziel się z nami podstawowymi informacjami diagnostycznymi
    Ustawienia → System → Naprawy → “hamburger menu” → Informacje o systemie → (popup) Informacje o systemie → KOPIUJ
    i wklej ze schowka do posta tak jak jest (ten tekst jest już prawidłowo sformatowany dla githuba lub naszego forum)

  2. dodatkowe info w jakiej sytuacji problem wystąpił pierwszy raz (np.po aktualizacji Dodatku), czy próbowałeś coś z tym robić (np. przez cofnięcie wersji Dodatku przez przywrócenie poprzedniej z backupu) itd.
    Skoro wklejasz tylko linijkę z prawidłowym telegramem to może okraś ją informacją co nie zadziałało…

  3. konfiguracja?

W sumie macie rację za mało informacji - na usprawiedliwienie to nadal raczkuje w HA
Poniżej więcej info

System Information

version core-2023.12.2
installation_type Home Assistant OS
dev false
hassio true
docker true
user root
virtualenv false
python_version 3.11.6
os_name Linux
os_version 6.1.63-haos
arch x86_64
timezone Europe/Warsaw
config_dir /config
Home Assistant Community Store
GitHub API ok
GitHub Content ok
GitHub Web ok
GitHub API Calls Remaining 5000
Installed Version 1.33.0
Stage running
Available Repositories 1421
Downloaded Repositories 4
HACS Data ok
Home Assistant Cloud
logged_in false
can_reach_cert_server ok
can_reach_cloud_auth ok
can_reach_cloud ok
Home Assistant Supervisor
host_os Home Assistant OS 11.2
update_channel stable
supervisor_version supervisor-2023.11.6
agent_version 1.6.0
docker_version 24.0.7
disk_total 234.0 GB
disk_used 23.7 GB
healthy true
supported true
board generic-x86-64
supervisor_api ok
version_api ok
installed_addons Mosquitto broker (6.4.0), File editor (5.7.0), OpenZWave (0.9.1), FTP (4.7.3), Advanced SSH & Web Terminal (17.0.0), Home Panel (2.7.0), InfluxDB (4.8.0), Grafana (9.1.1), eWeLink Smart Home (1.4.3), Zigbee2MQTT (1.34.0-1), Studio Code Server (5.14.2), motionEye (0.19.1), Node-RED (16.0.2)
Dashboards
dashboards 1
resources 0
views 3
mode storage
Recorder
oldest_recorder_run 5 grudnia 2023 13:18
current_recorder_run 14 grudnia 2023 11:21
estimated_db_size 3625.17 MiB
database_engine sqlite
database_version 3.41.2

W sumie nie wiem w jakiej sytuacji problem wystąpił pierwszy raz, jestem na etapie konfiguracji i zauważyłem po dodaniu urządzenia - termostatu , ze nie przyjmuje nastaw z Zigbee2mqtt->urządzenie->eksponuje
Chodzi o takie ustawienia jak korekcja temperatury czy ustawienia harmonogramu
Ale jak zrobię restart Z2M->ustawienia->narzędzia to przez jakiś czas mogę przesyłać ustawienia
Co do konfiguracji Z2M

data_path: /config/zigbee2mqtt
socat:
  enabled: false
  master: pty,raw,echo=0,link=/tmp/ttyZ2M,mode=777
  slave: tcp-listen:8485,keepalive,nodelay,reuseaddr,keepidle=1,keepintvl=1,keepcnt=5
  options: "-d -d"
  log: false
mqtt:
  server: mqtt://192.168.2.4
serial:
  port: /dev/ttyACM0
  adapter: ezsp

A masz jakiekolwiek inne proste urządzenia Zigbee, które mogłyby być dla nas jakimkolwiek wyznacznikiem działania Z2M (coś prostego to np. żarówka czy moduł przekaźnika, bo czymś takim nie jest termostat - gdzie problemy z działaniem mogą mieć setki innych źródeł).

Przepraszam ale chwilę mnie nie było
Wracając do mojego problemu
Mam wyłącznik ale jak to na zielonego przystało nie mogę znaleźć żadnych logów poza dziennikiem - ale nie wiem jak skopiować tekstowo

I z tego co widzę to mam ciągłe utratę komunikacji z urządzeniami , w Zigbee2QTT niby widzę stany i jakość połączenia ale… Stąd moje podejrzenie że nie chodzi o termostaty czy inne elementy wykonawcze , a raczej o coś skopanego przeze mnie w konfiguracji
Restart Z2M na chwile pomaga i znowu po jakimś czasie przestaje działać, czasami po kilku minutach a czasami po kilku godzinach.

Dodaj w ustawieniach → Dodatki -

Zigbee2MQTT

zigbee_herdsman_debug: true

Logi ustaw na debug

RESTART Z2M

Dziękuje
Ustawiłem i mam takie oto logi dla bridge

debug <small>2024-01-04 13:56:21</small>`Received MQTT message on 'zigbee2mqtt/bridge/request/options' with data '{"options":{"advanced":{"log_level":"error"}},"transaction":"yqzc6-7"}'`

info <small>2024-01-04 13:57:55</small>`MQTT publish: topic 'zigbee2mqtt/bridge/response/options', payload '{"data":{"restart_required":false},"status":"ok","transaction":"yqzc6-13"}'`

Dla przełącznika :


slight_smile: info <small>2024-01-04 13:59:42</small>`MQTT publish: topic 'zigbee2mqtt/Wentylator Garaż',
 payload 
'{"current":0,"energy":4.4,"linkquality":76,"power":0,"power_outage_memory":"restore","state":"OFF","switch_type":"toggle","voltage":226}'`

info <small>2024-01-04 13:59:45</small>`MQTT publish: topic 'zigbee2mqtt/Garaz
 - Blaszkax2', payload 
'{"indicator_mode":null,"linkquality":112,"power_on_behavior":null,"power_on_behavior_l1":"previous","state_l1":"OFF","state_l2":"OFF","state_l3":"ON","switch_type":"momentary"}'`

info <small>2024-01-04 13:59:45</small>`MQTT publish: topic 'zigbee2mqtt/Garaz
 - Blaszkax2', payload 
'{"indicator_mode":null,"linkquality":112,"power_on_behavior":null,"power_on_behavior_l1":"previous","state_l1":"OFF","state_l2":"OFF","state_l3":"ON","switch_type":"momentary"}'`

Zauważyłem jeszcze że jak się zawiesi Z2M to przy próbie wyświetleniu mapy komunikat

error <small>2024-01-10 20:29:11</small>`Failed to execute LQI for 'Coordinator'`

A sam dodatek Z2M zwalnia zużycie procesora z około 20% do 1-2%
I nadal nie wiem co i gdzie szukać
Zacznę od przebudowy sieci , planuje zmienić kanał z 11 na 25 - gdzieś wyczytałem że to może pomóc , ale czy pomoże?

może nie równa się musi
nie wiem co się tak uparłeś na to zawieszanie
pokaż nam logi które o tym świadczą
jaką masz wersję firmware na koordynatorze?

Wersja kordynatora

SONOFF_Zigbee_3.0_USB_Dongle_Plus_V2_20221031172315-if00

A dlaczego się uparłem na zawieszanie - bo przestaje działać , nie widzi urządzeń , nie odbiera informacji z termostatów , nie da się wysłć komend do urządzeń- nawet switchy a jak zrestartuje dodatek ZigBee2MQTT to cudownie zaczyna działać.
Co do logów to właśnie jest problem bo jak się zawiesi to nie zapisuje mi żadnych logów - restart i logi się pojawiają

Równie dobrze możesz mieć problem z brokerem MQTT i też objawy będą w Twoim odczuciu “zawieszaniem się Z2M”. Bez logów, to tylko Twoje obserwacje i domysły i nie prowadzą do diagnozy przyczyny problemu.

1 polubienie

Fajnie już wiemy, że na stacku

ezsp

a wersja firmware?

hint - to ta wartość przy trójce w kółku

Jeśli chodzi o broker MQTT to zdefiniowałeś go tak

Nie wiemy jednak czy twój HA (jak rozumiem tożsamy z maszyną na której pracuje broker) jest zawsze pod IP 192.168.2.4

W pewnych przypadkach (standardowa instalacja HAOS z Dodatkami Mosquitto i Z2M) nawet nie jest wymagane definiowanie brokera na IP w LAN - to gwarantuje działanie bez łączenia się z zewnętrznym interfejsem Ethernet, więc będzie działać nawet jeśli masz konflikty IP w swojej sieci LAN

mqtt: {}

Swoją drogą Z2M od pewnego czasu Z2M konfiguruje się w GUI i dla takiego szczególnego przypadku adres brokera może tam wyglądać tak

mqtt://core-mosquitto:1883


Mały wtręt - widziałem w innych wątkach, że masz/miałeś problemy z NR.
A jak pracuje Z2M jeśli zatrzymasz na stałe dodatek NR?
Bo tak się składa, że NR to jeden z najniebezpieczniejszych dodatków - można w nim uruchomić niezweryfikowany kod i doprowadzić system do braku zasobów, co ostatecznie powoduje zupełnie “bez przyczyny” awarie innych dodatków.


Pewnie szukasz nie w tym miejscu
Logi Dodatków i innych komponentów systemu znajdziesz np. tu
Ustawienia → System → Logi → drop down list (w prawym górnym rogu)

Jeśli nie zgromadzisz logu z momentu przed zawieszeniem to nigdy się nie dowiesz jaka jest przyczyna zwisu.

Objaw już znamy brak działania Z2M (tzn.takie jest podejrzenie), ale równie dobrze problem może dotyczyć czegokolwiek innego.

Hmm

20% użycia procesora przez Z2M brzmi co najmniej podejrzanie, tyle to może być podczas jego startu, ale raczej nie podczas normalnej pracy, wtedy to bym się spodziewał okolic 0%.

Może ktoś z bardzo rozbudowaną instalacją Z2M się pochwali jaki ma procek (jeśli VM to co dedykuje dla VM) i się pochwali jakie obciążenie procka generuje Z2M podczas normalnej pracy?

Screenshot - 11.01.2024 , 01_21_15
Piki to restarty HA po aktualizacjach dodatków.

1 polubienie

Szopen dziękuję za obszerny opis - tak jak pisałem wcześniej jestem mocno początkującym w HA.
Wersja koordynatora - 6.10.3.0 build 297

Adres serwera jest zawsze stały - nie korzystam z DHCP, więc ten problem chyba nie dotyczy mojego przypadku , ale jak najbardziej mogę spróbować zmienić konfigurację.
Co do NR to nie tyle miałem problem z samym NR co po prostu popełniłem błąd w tworzeniu reguły - robiłem kopiuj wklej i kliknęło mi się 2 razy wklej . Teraz nauczony tym moim błędem dokładnie sprawdzam każdy diagram zanim go uruchomię.

Co do zajętości procesora to przyznaje sprawdzałem go tylko po samym starcie i rzeczywiście po chwili spada do około 5% - teraz sprawdzałem po czasie

I pozostaje sprawa logów - szukałem rzeczywiści ew innym miejscu dokładnie w samym Z2M → logi
Teraz zajrzałem w System->logi z tym że logi się tak na pierwszy rzut oka pokrywają z tymi z Z2M. I w obu przypadkach nie wiem jak je stronicować . Wyświetlane są tylko bieżące , dlatego aby zebrać logi tuż przed “zawieszeniem” będę musiał trafić w moment, chyb aże jest jakis sposób aby stronicowac dziennik.

Jeśli Dodatek się zawiesi, to o ile tylko go nie zrestartujesz ostatnie dostępne logi powinny być sprzed zawieszenia.
Zrób jednak też eksperyment z wyłączeniem NR i wtedy zobacz czy Z2M się zawiesi.

Można użyć zewnętrznego syslog (Windows) wtedy logi będziesz miał na bieżąco.

https://maxbelkov.github.io/visualsyslog/

1 polubienie

@artpc Wielkie dzięki za podpowiedź - tak zrobię