Problem z zawieszaniem się HA

Cześć od miesiąca mam problem z HA. System mi się zawiesza coraz częściej co dzienne resety nic nie pomagają. Zawieszanie jest nie systematyczne i w logach wyskakuje mi ciągle bład Error doing job: Exception in callback _SelectorDatagramTransport._read_ready(). Proszę o pomoc w czym może być problem. Komputer na serwer to Wyse 5070 z proxmox


To jest przydzielona moc

Co to jest Shelly SHCB-1 ? Generalnie problem z Shelly, coś dodawałeś ostatnio ?

Po kodach udało mi się znaleźć że są to żarówki shelly

Shelly Colour bulb 1

Witamy na forum.
Na początek kilka uwag aby komunikacja była skuteczna i Twoje wpisy nie zniechęcały potencjalnie chcących pomóc.

Zamiast wklejać obrazki, zaznacz logi i wklej sformatowany tekst. Należy to zrobić w nasypujący sposób jak wskazał kolega @szopen (dodatkowo kilka innych uwag):

I tu coś leszcze ode mnie:

ten log wygląda tak

Logger: homeassistant
Source: components/shelly/coordinator.py:219
First occurred: 15:13:43 (150 occurrences)
Last logged: 15:50:04

Error doing job: Exception in callback _SelectorDatagramTransport._read_ready()
Traceback (most recent call last):
  File "/usr/local/lib/python3.11/asyncio/events.py", line 80, in _run
    self._context.run(self._callback, *self._args)
  File "/usr/local/lib/python3.11/asyncio/selector_events.py", line 1163, in _read_ready
    self._protocol.datagram_received(data, addr)
  File "/usr/local/lib/python3.11/site-packages/aioshelly/block_device/coap.py", line 185, in datagram_received
    self.subscriptions[device_id](msg)
  File "/usr/local/lib/python3.11/site-packages/aioshelly/block_device/device.py", line 195, in _coap_message_received
    self._update_s(msg.payload, msg.coap_type)
  File "/usr/local/lib/python3.11/site-packages/aioshelly/block_device/device.py", line 247, in _update_s
    self._update_listener(self, BlockUpdateType.COAP_PERIODIC)
  File "/usr/src/homeassistant/homeassistant/components/shelly/coordinator.py", line 335, in _async_handle_update
    self.async_set_updated_data(None)
  File "/usr/src/homeassistant/homeassistant/helpers/update_coordinator.py", line 426, in async_set_updated_data
    self.async_update_listeners()
  File "/usr/src/homeassistant/homeassistant/helpers/update_coordinator.py", line 182, in async_update_listeners
    update_callback()
  File "/usr/src/homeassistant/homeassistant/components/shelly/coordinator.py", line 219, in _async_device_updates_handler
    cfg_changed = block.cfgChanged
                  ^^^^^^^^^^^^^^^^
  File "/usr/local/lib/python3.11/site-packages/aioshelly/block_device/device.py", line 521, in __getattr__
    raise AttributeError(
AttributeError: Device SHCB-1 with firmware 20201008-085327/master@a3d98bb0 has no attribute 'cfgChanged' in block device

I jak go wiążesz ze zwisami HA?
HA zawisł o 15:13:43?
Bo jest taka sprawa:

przez poprzednie 149 wystąpień tego błędu jednak na 100% nie zawisł, więc chyba szukasz w nienajwłaściwszym miejscu

teraz coś nowego:
Ustawienia → System → Naprawy → “hamburger menu” → Informacje o systemie → (popup) Informacje o systemie → KOPIUJ
i wklej ze schowka do posta tak jak jest (ten tekst jest już prawidłowo sformatowany dla githuba lub naszego forum)

  1. dodatkowe info w jakiej sytuacji problem wystąpił pierwszy raz (np.po aktualizacji czegoś), czy próbowałeś coś z tym robić (np. przez cofnięcie wersji czegoś np. przez przywrócenie poprzedniej z backupu) itd.

  2. masz jakieś sensory zasobów HA?
    coś w guście tego
    Wyciągnięcie danych z sensorów z raspberry PI do HA - #2 przez szopen
    tylko oczywiście dostosowane do twojej instalacji
    jeśli nie to je stwórz, bo wykresiki by się przydały

Nie wiem jestem w tym nowy. Problem wygląda tak że tak co 24 godziny zawiesi system. Zanim dodałem system automatycznego resetu pokazywało mi że zajmuje mi 6,8 gb ramu na 7 i myślę czy coś mi ramu nie zasyfia przez to mogły by być zawieszenia?

Edit:

@szopen

System Information

version core-2023.12.3
installation_type Home Assistant OS
dev false
hassio true
docker true
user root
virtualenv false
python_version 3.11.6
os_name Linux
os_version 6.1.63-haos
arch x86_64
timezone Europe/Warsaw
config_dir /config
Home Assistant Cloud
logged_in false
can_reach_cert_server ok
can_reach_cloud_auth ok
can_reach_cloud ok
Home Assistant Supervisor
host_os Home Assistant OS 11.2
update_channel stable
supervisor_version supervisor-2023.11.6
agent_version 1.6.0
docker_version 24.0.7
disk_total 62.3 GB
disk_used 9.1 GB
healthy true
supported true
board ova
supervisor_api ok
version_api ok
installed_addons Spotify Connect (0.12.6), UniFi Network Application (3.0.0), Node-RED (16.0.2), Grafana (9.1.1), File editor (5.7.0)
Dashboards
dashboards 1
resources 0
views 5
mode storage
Recorder
oldest_recorder_run 6 grudnia 2023 07:58
current_recorder_run 16 grudnia 2023 15:13
estimated_db_size 32.65 MiB
database_engine sqlite
database_version 3.41.2

jedyne wykresy jakie mam to z proxmox z tygodnia


to moim skromnym zdaniem może być źródło problemu z wywrotkami systemu, ale musimy ustalić czy to faktycznie ma miejsce, czy masz tylko takie wrażenie oglądając VM od zewnątrz… (a nie od środka)

nas nie interesuje jak widać VM od zewnątrz, więc stwórz sensory z posta wyżej

Moja propozycja prostego testu - wyłącz Node Red na 3 dni, bo tak naprawdę na pierwszy rzut oka masz prawie “pustą instalację”, więc podejrzany na “pierwszy ogień” jest kod uruchomiony w NR.

Dodałem system monitorowania zasobów i na chwilę obecna pokazuje 24% zajęcia pamięci ram i miałem do zrobienia aktualizację jednej żarówki. To dam znać jak znów by się zawiesiło. Bardzo dziękuje za pomoc :grin:

Jeśli masz proxmox ver 7 to zaktualizuj sterowniki karty sieciowej.
Dell 5070 ma właśnie kartę Realtek

2 Likes

Na RPI4B z 4 GB ramu też zaobserwowałem wyciek pamięci: przez pół doby z 26% do 42%. Zaczęło się to 15-12, prawdopodobnie po aktualizacji Core do v.2023.12.3.
Przywróciłem v 2023.12.1 i będę obserwował.
Edit: Niestety to nie pomogło. Wyłączałem dodatki, integrację ale bez sukcesu. Pomogła wczorajsza aktualizacja Esphome do v.2023.12.1. A już jest nowa v.3. , ale już jej nie aktualizuję, bo znów coś się schrzani.

1 Like