나름대로 유용

N100 우분투 서버 설치 후 접속 불가

조~~ 아 2025. 11. 29. 09:39
반응형

 

서버 켜 놓은 뒤 몇 일 뒤 TCP 접속이 안됨

1. 증상

  • 서버가 외부 접속(SSH, HTTP 등)에 전혀 응답하지 않음.
  • Ping도 나가지 않음.
  • 강제로 전원을 껐다 켜야(Hard Reboot) 다시 접속 가능.

2. 원인 분석 (로그 확인)

재부팅 직후, 시스템이 멈췄던 시점의 로그를 확인하기 위해 journalctl 명령어를 사용

Bash
 
# 직전 부팅(-b -1)의 로그 끝부분(-e) 확인
sudo journalctl -b -1 -e

발견된 핵심 에러 로그:

Plaintext
 
ubuntu kernel: EDAC igen6 MC0: HANDLING IBECC MEMORY ERROR
  • 분석 결과: N100 CPU(Alder Lake-N)의 IBECC(In-Band ECC) 기능이 일반 램(Non-ECC)과 충돌하거나, 리눅스 커널의 igen6_edac 드라이버가 과민 반응하여 시스템을 패닉 상태로 만든 것이 원인이라고 함

3. 해결 과정

시도 1: 하드웨어 점검 (램 재장착)

물리적인 접촉 불량일 가능성을 배제하기 위해 램을 탈착 후 지우개로 닦고 재장착했습니다. 하지만 미니 PC 특성상 BIOS(CMOS) 설정 메뉴가 제한적이어서, 근본적인 원인인 IBECC 기능을 BIOS에서 끄는 옵션이 없었음

시도 2: OS 레벨에서 드라이버 차단 (최종 해결책)

BIOS에서 제어가 불가능하므로, 우분투에서 문제를 일으키는 커널 모듈(igen6_edac)을 로드하지 않도록 블랙리스트 처리

 

설정 방법:

  1. 블랙리스트 파일 생성
  2. Bash
     
    echo "blacklist igen6_edac" | sudo tee /etc/modprobe.d/igen6_edac-blacklist.conf
    
  3. 부팅 이미지(initramfs) 갱신
  4. Bash
     
    sudo update-initramfs -u
    
  5. 재부팅이 설정을 통해 시스템이 불필요한 메모리 에러 감지 기능을 끄게 되어, 프리징 현상을 방지할 수 있음
  6. Bash
     
    sudo reboot
    

4. 함께 설치한 유용한 관리 도구

서버 안정성을 점검하기 위해 추가로 설치한 패키지

A. 하드웨어 온도 모니터링 (lm-sensors)

미니 PC의 발열 상태를 확인하기 위해 설치

  • 설치: sudo apt install lm-sensors
  • 사용: sudo sensors (CPU 및 보드 온도 실시간 확인)

 

 

그 외 설치한 프로그램들

반응형

'나름대로 유용' 카테고리의 다른 글

스트라이다 볼소켓 교체  (0) 2024.11.28
잉카솔루션 체크텝  (0) 2024.03.02
윈도우 11 인터넷 연결 없이 설치  (0) 2023.12.20