Ostrzeżenie przed aktualizcją HAOS 12.2

Aktualizacja może prowadzić do nieoczekiwanych poważnych problemów, na chwilę obecną odradzam aktualizację na wszystkich platformach, brak czasu nie pozwala mi na monitorowanie sytuacji na bieżąco.

Najprawdopodobniej niebezpieczeństwo dotyczy tylko platformy x86-64, co by wskazywało na bootloader

Nieopatrznie zaktualizowałem. Na razie zero problemów. HAOS na RPi 4.

Ostrzeżenie napisałem na podstawie wiedzy co ostatnio zaktualizowano i jakie to niesie ryzyko, tego, że jest ruch w issue związanym z aktualizacją HAOS oraz wątku u nas na forum, w którym wątkotwórca napisał wstępnie coś zupełnie" z czapy", czyli po prostu jego informacje były totalnie nieprecyzyjne.

To, że akurat u mnie wszystkie aktualizacje się powiodły (po przyjrzeniu się sytuacji zdecydowałem o aktualizacji również instalacji zdalnych - łącznie: 1x testowa x64, 2x produkcyjne x64, 1x produkcyjna RPi4) jest oczywiście jeszcze niewystarczające do ogłoszenia sukcesu, ale jak się okazuje nawet w issue związanym z aktualizacją HAOS 12.2 też ludzie piszą zupełnie od rzeczy i realne poprawne zgłoszenia problemu są może ze 2. ALE sam fakt że ktokolwiek zgłosił realny problem oznacza potencjalne ryzyko, jak na razie nie wiadomo czy to były jakieś nietypowe konfiguracje (kilka było wybitnie nietypowych i się ludzie popodpinali w niewłaściwym issue zamiast założyć odrębne).

W większości opisywanych przypadków ratunkiem było wybranie slotu z systemem w wersji 12.1 niestety do tego jest potrzebna lokalna konsola (klawiatura + monitor).


Dzisiaj (w drugim dniu od publikacji update OSa) w statystykach jest już 33 896 instalacji działających na HAOS 12.2 (co stanowi 16.14% instalacji raportujących dane analityczne), a skoro są w statystykach, to znaczy, że te instalacje po prostu działają… więc realny problem najprawdopodobniej występuje w bardzo niewielkim odsetku instalacji (jak zgaduję w raczej nietypowych konfiguracjach).

Nie wiem czy to błąd związany z wadą tej wersji czy po prostu coś się poważnego zmieniło w związku nową wersją. U mnie Core marcowy i do tego aktualizacja HAOS do 12.2. Wszystko ładnie wstało i działało za wyjątkiem jednej integracji akurat dla mnie dość ważnej związanej z pracą falownika - integracją Solarman. I tak się zastanawiam czy to błąd w wersji HAOS czy po prostu integracja nie nadąża za zmianą HAOS. Po powrocie do wersji 12.1 wszystko działa. Albo słabo szukam albo nigdzie w sieci nie znalazłem nic być może za świeża sprawa.
Zastanawia mnie jeszcze jedna rzecz dotycząca kolejności aktualizowania Core i HAOS - czy ma to większe znaczenie czy też nie do końca. Generalnie staram się aktualizować w kolejności ukazywania się aktualizacji oczywiście z pewnym opóźnieniem ale zastanawiam się co się dzieje, jeżeli ta kolejność nie zostaje zachowana, Niestety moja wiedza trochę za mala w tym zakresie.

1 polubienie

Współpracą między HAOS a HA zajmuje się Supervisor, którego teoretycznie nigdy nie można mieć w nieaktualnej wersji i powinien obsługiwać wszelkie kombinacje HA i HAOS, ale w praktyce nie powinno się liczyć na dobrą kompatybilność wersji wydawanych w dużym odstępie czasowym, więc aktualizacje OS i core powinno się robić w miarę systematycznie.

Główna różnica HAOS 12.2 względem wcześniejszych wersji to obsługa MPTCP, już z tego powodu moim skromnym zdaniem numeracja tej wersji powinna być w rodzaju 13.0, a nie 12.x bo ta zmiana jest znacząca.

1 polubienie

Dzięki Szopen za podstawy.
Znalazłem wątek dla tych co mają problemy podobne do moich niekoniecznie takie same chodzi o tworzenie terminali, które supervisor blokuje przy połączeniu core 2024.3 i haos 12.2. Podobno rozwiązaniem na to jest aktualizacja do wersji core 2024.4 - na razie poczekam - za dużo urządzeń ( zaczynam powoli myśleć o czymś do testowania).

Są błędy i problemy, sam widzę, że są na moich instalacjach, a konkretnie na jednej (wręcz sytuacja jest dość krytyczna, w dodatku to instalacja zdalna, jakkolwiek tylko dzięki temu, że mam backup backupu tunelu dla połączenia zdalnego nie utraciłem możliwości kontroli, de facto obecnie zerotier jest tam zapasowym tunelem więc problemu nie zauważyłem od razu), konfiguracja jest tam dość specyficzna: sieć tylko IPv4 ze statycznym adresem na którym pracuje HAOS.


Generalnie wygląda na to, że źródłem wielu problemów była niewłaściwa kolejność publikacji aktualizacji - pierwszy powinien wyjść Supervisor 2024.04.0 który był zbyt długo trzymany na kanale beta… (albo wręcz jego następca), a dopiero potem aktualizacje OS i core, z dostatecznym opóźnieniem by Supervisor został wprowadzony do użytku przed pozostałymi aktualizacjami…


To akurat problem dotyczący Dodatku ZeroTier One istniał najwyraźniej wcześniej (bo błędy mam też w 12.1) tylko musiałem go przeoczyć, bo nie dawał żadnych objawów… (mimo błędów na 12.1 tunel działa normalnie, a na 12.2 wcale).
Póki co nie zgłaszam issue, bo muszę zidentyfikować kiedy w ogóle problem się pojawił (więc będę cofał wersje HAOS głębiej niż do 12.1).
edit - nie dokopałem się do przyczyny, ale uzyskałem zadowalający efekt w postaci przywrócenia działania tunelu mimo błędów również na 12.2


update 15 kwiecień 2024, skoro już co trzecia instalacja pracuje na HAOS 12.2 to ostrzeżenie można uznać za nieaktualne

W przypadku błędów manifestujących się w logach brakiem uprawnień do zapisu (jeśli dobrze zrozumiałem to skutki używania zbyt starej wersji supervisora z HAOS 12.2) można spróbować odbudowy HA core
ha core rebuild

A jednak pojawiły się problemy tak około tygodnia temu z wejściem na HA, czy to lokalnie, czy zdalnie.
Dziś zaktualizowałem core (nic do stracenia) i od kilku godzin problem zniknął. Chyba mam nauczkę, że jak działa, to daj spokój aktualizacji…

Nie możesz nie aktualizować, bo doprowadzisz sobie system do sytuacji w której nie dasz rady ogarnąć zaległości.

Przez czas od momentu gdy napisałem ten wątek wyszło już kilka aktualizacji core i kilka Supervisora, w tym aktualizacje zawierające patche na błędy.

1 polubienie

Ok. Czyli jak po aktualizacji będzie coś nie tak, to zacisnąć zęby i czekać na poprawkę?
Bo teraz tak szczerze, to już nie wiedziałem, co jest nie tak… Obstawiałem router, a po aktualizacji core jest ok. W każdym razie dzięki za info.

Nie śpiesz się z aktualizacjami - core zwykle najlepiej aktualizować pod koniec miesiąca, gdy już wyjdą wszystkie patche do danej “dużej” wersji.

Supervisor jest i tak aktualizowany automatycznie, więc jeśli wychodzą w nim jakieś rollbacki, to wejdą samorzutnie do użytku.

Wersje systemu i core można cofać bez przywracania backupów, więc jeśli trafisz na problem to zgłaszasz błędy (issue - bez tego nikt nie naprawi błędów), a następnie cofasz wersję.


Ten wątek z ostrzeżeniem powstał w związku wręcz niespotykanym zdarzeniem, gdy błąd dotyczył bootowania systemu, jak się okazało tylko na wybranych specyficznych konstrukcjach sprzętowych i o wręcz marginalnej skali (kilka zgłoszonych przypadków na kilkadziesiąt tysięcy instalacji raportujących anonimowe dane).
W dodatku część z użytkowników niepoprawnie identyfikowała problemy…

Dlatego zachęcam by włączyć wysyłanie tych anonimowych danych statystycznych
Ustawienia → System → Dane analityczne


Natomiast same błędy są nieuniknionym kosztem postępu i są nie do uniknięcia w żadnym oprogramowaniu (a już tym bardziej darmowym, gdzie nie ma budżetu na testy, więc to że istnieje ekipa betatesterów, to tylko ich dobra wola, ale ilość betatesterów mających dodatkowe instalacje tylko dla celów eksperymentalnych jest kroplą w skali potrzeb).

Może nieco światła na tym, że błędy są nieuniknione da taki przykład - występują one też w oprogramowaniu, którego licencja na pojedyncze stanowisko kosztuje nawet po kilkadziesiąt tysięcy €… tylko wtedy z tych sporych pieniędzy jest budżet na wsparcie 24/7.

“Dlatego zachęcam by włączyć wysyłanie tych anonimowych danych statystycznych”
Mam włączone… Całkowicie to rozumiem.
Udzieliłem się w tym wątku, bo po przypadkowej aktualizacji(patrz wyżej) wszystko działało ok, ale jak się okazało do czasu. Pewno za parę dni napiszę, czy ta poprawa po teraźniejszej aktualizacji jest stabilna.

Hmm, jest taka kwestia - błędy oraz ogólnie informacje zwrotne (o tym, że np. poprawki pomogły) trzeba zgłaszać deweloperom bezpośrednio w issues dotyczących tego co akurat nie działa, fajnie że coś napiszesz na niszowym polskim forum, ale to ziarenko piasku nie posłuży do budowy całej piramidy.

Na forum co najwyżej możemy spróbować zidentyfikować źródło problemu, ale resztę musisz już ogarnąć we właściwym miejscu.

I na taką okoliczność proponuję osobny wątek.

HAOS 12.2 nie był problemem na żadnej instalacji z tych do których mam dostęp (w ogóle to problem przed którym ostrzegałem dotyczył tylko wybranych konstrukcji x86-64, a nie dotknął żadnej z platform SBC).

Dla tych nielicznych których tu na wstępie opisany problem faktycznie dotyczy wydano wersję HAOS 12.3.rc1 (dla eksperymentatorów jest dostępna jako update na kanale beta i w kwestii opisywanego tu problemu zawiera po prostu rollback bootloadera, więc można przeczekać ten problem na wersji sprzed 12.2 i zaktualizować OSa dopiero gdy 12.3 wyjdzie na kanale stabilnym, bo oczywiście rc1 to jest wersja beta i używanie jej na systemach produkcyjnych jest ryzykowne)

Postaram się to ogarnąć👍

Takie jeszcze tylko przemyślenie…
Instalując po raz pierwszy HAOS, pewnie jest to przy pobieraniu najnowsza wersja, chyba, że się mylę.
Jak tu ustrzec się błędów…