[HAOS-generic][2025] Problem instalacją, budową skryptu

Witam Wszystkich,
Dopiero zaczynam przygodę z HA, dlatego proszę o wyrozumiałość.

Zmagam się z problemem inicjalnej instalacji HAOS na NUCu. Realizuje instalacje zgodnie z oficjalnym manualem, wykorzystując Ubuntu live, realizujać restora obrazu.

Problemy pojawiają się w czasie budowania HA.
Sypie bardzo różnymi błędami, jednak wszystkie wyglądają jak problem z dostępem / działaniem dysku.

Chyba najcenniejszy będzie załączony log:

Nuc - Dell OptiPlex7050 - testowałem diagnostyką z BIOS, jak i narzędziami dostępnymi w Ubuntu. Niby wszystko w OK.
Konfig BIOSu, trzy razy sprawdzony.

Z góry dzięki za wsparcie,
z pozdrowieniami,
Marcin

Dell OptiPlex7050 to NIE jest NUC
(NUC to marka handlowa należąca do intela i częściowo użyczona Asusowi)

w/g tego loga najprawdopodobniej masz uszkodzony ssd
przejrzyj wątki dotyczące smart

Jeśli używasz windowsa na co dzień to kluczowe narzędzia

Chwilowo zapomnij o instalacji HAOS
Podłącz ten dysk bezpośrednio do windowsowej maszyny i…
tym pierwszym odczytaj parametry S.M.A.R.T. samego dysku, jeśli to nie jest chinol noname, to po zdarzeniach z logów powinny być ślady w logach S.M.A.R.T.
załóż partycję wielkości całego dysku (po nieudanej instalacji HAOS musisz usunąć wszystkie istniejące partycje! możesz to zrobić teraz spod ubuntu używając gparted) i uruchom przetestowanie całej powierzchni zapisu/odczytu tym drugim (to potrwa klika godzin), zrób zrzuty ekranu.

Zrób screenshoty (i pobierz logi) wrzuć do posta


Dla windowsa jest też świetne linuxowe narzędzie do dogłębnego przetestowania hdd/ssd bazując na funkcjach wbudowanych w firmware samego dysku


obsługę nvme mają tylko stosunkowo najświeższe wersje - mój dysk pamięta jeszcze nieudane testy wykonane starymi wersjami, które sobie nie radziły z nvme

(ale nie mam weny na opisywanie jak to zainstalować… wymagane https://www.smartmontools.org/)
Jeśli dasz radę zainstalować i uruchomić, użyj Extended self-test
(być może w świeżym Ubuntu będzie Ci łatwiej z takimi narzędziami)

Jeśli dysk jest jakiegoś znanego producenta, to zazwyczaj istnieją też jakieś dedykowane narzędzia producenta (ale nie zawsze, przykładowo Samsung nie daje takich narzędzi dla modeli OEM, jedynie modele znajdujące się w sprzedaży detalicznej z oficjalnych kanałów sprzedaży mają dostępne te narzędzia)
Wniosek - w opisie problemu jest zdecydowanie za mało informacji o sprzęcie.

1 polubienie

Dziękuje bardzo. Wyczerpujące wskazówki.

Dysk to M.2, także nie miałem go do czego wpiąć. Wolnego Windows też nie miałem.
Testy przeprowadzałem przez Ubuntu. Mimo, że nvme, ma słabe wsparcie w narzędziach do diagnostyki pod linux, wszystkie testy przechodziły poprawnie.

Mimo że w miedzy czasie już kupiłem nowy dysk ;-), okazało się że na dysku tkwi partycja EFI dla Windows. Z poziomu linuxa nie widoczna. Byłem przekonany, że restore, instalacja z obrazu wszystko wyczyści.
W tej maszynie jest dość rozbudowany BIOS, i tam mogłem usunąć.
Logo HA, pojawiło się po 40 sekundach :wink:

Jeszcze raz dzięki za wsparcie!

1 polubienie

Nie ma takich partycji, których nie widać spod linuxa tzn. może nie wszystko się da podmontować, ale w graficznym narzędziu gparted zobaczysz wszystko (a już w szczególności partycję EFI, bo to zwyczajny FAT).
Tym samym narzędziem jednym ruchem palca możesz wyczyścić cały dysk i wszystkie partycje (nie kasując ich po jednej, tylko tworząc nową tablicę partycji typu msdos).

Na nowym dysku nie ma prawa być żadnych partycji (żaden producent ssd nie sprzedaje dysków m.2 z jakimkolwiek systemem plików), wciąż nie wiemy jaki producent i model tego dysku.

W tamtym starym wątku są już opisane niemal wszelkie potencjalne problemy i ich rozwiązania
Instalacja natywna (bare-metal, “golas”) Home Assistant OS (HAOS-generic) końcówka 2022

GsmartControl to jest natywne narzędzie w linuxie (właściwie to tylko graficzna nakładka na smartmontools), więc możesz przeprowadzić dokładnie taki test jak pokazałem na obrazku na przeportowanej wersji na windowsie (myślę że jakieś >90% użytkowników na forum jako swój podstawowy system operacyjny ma windows).

smartmontools opiera się w swoim działaniu na funkcjach które oferuje firmware kontrolera flash w dysku ssd, więc dlatego jest ważne jaki to dysk
(w chinolach spotkałem się z tak bezczelnymi rozwiązaniami, że się to w głowie nie mieści - tak zmodyfikowane firmware, że nawet na ewidentnie uwalonym ssd wewnętrzne testy przechodziły poprawnie i co bardzo charakterystyczne w praktycznie zerowym czasie, gdy w normalnych warunkach krótki test trwa od kilkunastu do kilkuset sekund, a długi test to często czas mierzony w godzinach, ale zwykle nie krótszy niż kilkanaście minut).

Może po prostu ujmę to w paru słowach - błędy które widać na zdjęciu, to błędy na poziomie fizycznym i są one charakterystyczne dla zaledwie kilku sytuacji

  • umierający ssd
  • niekompatybilność z płytą główną
  • problemy z zasilaniem
  • problemy z obsługą tego dysku w jakimś konkretnym systemie operacyjnym (np. dyski na kontrolerach Phison swego czasu “nie lubiły” się z linuxami)

Wiedząc jaki masz dysk można szukać podobnych problemów dotyczących właśnie takiej konstrukcji.

Więc moim zdaniem decyzja o zakupie INNEGO dysku nie była zła, a ten egzemplarz poddałbym głębszej diagnostyce (a jeśli to był zakup konsumencki, to radzę skorzystać z praw konsumenckich).
Tu się posłużę innym obrazkiem tego samego dysku - sprawny dysk ma w tym miejscu raportować zero błędów

Swoją drogą jest jeszcze jedna potencjalna przyczyna błędów - wadliwy RAM, co się czasem manifestuje uszkodzeniem danych na dysku.
Jeśli sprzęt jest z trzeciej ręki (a raczej jest) to warto przetestować RAM (większość dystrybucji linuxa w postaci live ma to narzędzie dostępne z menu bootloadera)

Natomiast obecność “obcej” partycji raczej nie mogła wywołać tego rodzaju błędów.

1 polubienie

Jeszcze raz dziękuje za wyczerpujące odpowiedzi i wsparcie.
Tak dysk to chinol. Stacja, OptiPlex, to używka, kupiona już jakiś czas temu, oczekująca na moment gdy zajmę się mym HA :wink:

Niestety rozszerzone testy nie mogłem uruchomić. Wskazywało brak wsparcia dla dysku.
Prosty check dawał wynik poprawny:

Rzucałem okiem na wątek … [(HAOS-generic) końcówka 2022], niestety nieznalezieniem odpowiedzi na moje problemy.

Odpukać aktualnie HA działa. Będę obserwował co się z tą maszyną dzieje.
Jeszcze raz dzięki za wsparcie i inspiracje!
Biorąc pod uwagę początek ścieżki, będę go jeszcze nie raz potrzebował :wink:

Polecam na dzień dobry scrutiny oraz ewentualnie hdd-tools (tu można ręcznie zdefiniować sensory jeśli sensory S.M.A.R.T. byłyby błędnie identyfikowane w Scrutiny).

Oraz oczywiście należy sobie stworzyć zasady backupowania poza maszyną HAOS tu nadal polecam google-drive-backup (mimo, że najnowsze wersje HA mają w końcu jakoś rozsądniej potraktowany automatyczny backup, to coś nie do końca jestem jeszcze przekonany do nowego rozwiązania).

I biorąc od uwagę pochodzenie sprzętu poświęciłbym jeszcze te kilka godzin na pełny memtest tj. minimum jedna pętla wszystkich testów, a jeśli nie mam zaufania do sprzętu to 4 (on ujawnia w sumie problemy nie tylko z RAM - sporadyczne błędy mogą mieć inne źródła), w końcu HA jest serwerem który z założenia ma służyć niezawodnie 24/7 przez minimum kilka lat (do tej pory wychodziłem z założenia 10 lat bez wymiany sprzętu, ale ssd chyba jednak będę wymieniał częściej) - to jest ssd w malutkiej instalacji która pracuje w tej konfiguracji prawie 5 lat a ssd był zamontowany nowy (była dość długa przerwa z powodu remontu, bo pierwotnie uruchomione chyba pod koniec 2019)


w innej instalacji wymieniłem ssd zaledwie po 2 latach pracy (nie miałem zaufania do chinola AData, teraz jest tam też niezbyt wiodący Goodram który syn uważał za uszkodzony, bo pracował kilka miesięcy z uszkodzonym kablem - to te 2 ostatnie rzędy w tabelce, od czasu użycia w HA liczby nie wzrosły nawet o 1)

Oczywiście to dyski sata, bo NUCe mam dość starej generacji.

To brzmi pozytywnie, a jak wygląda zakładka NVMe Attributes?

Tak swoją drogą Patriot to nawet nie jest jakiś ostatni złom, ale istotnie szału nie ma.

Jestem zaskoczony ale dostarczają nawet własne oprogramowanie do odczytu parametrów S.M.A.R.T. pod Windowsem (normalny użytkownik to się chyba nogą przeżegna próbując to uruchomić, bo mocno pachnące chińskością, ale jednak z Tajwanu)

do pobrania ze strony produktu