반응형
서버 켜 놓은 뒤 몇 일 뒤 TCP 접속이 안됨
1. 증상
- 서버가 외부 접속(SSH, HTTP 등)에 전혀 응답하지 않음.
- Ping도 나가지 않음.
- 강제로 전원을 껐다 켜야(Hard Reboot) 다시 접속 가능.
2. 원인 분석 (로그 확인)
재부팅 직후, 시스템이 멈췄던 시점의 로그를 확인하기 위해 journalctl 명령어를 사용
Bash
# 직전 부팅(-b -1)의 로그 끝부분(-e) 확인
sudo journalctl -b -1 -e
발견된 핵심 에러 로그:
Plaintext
ubuntu kernel: EDAC igen6 MC0: HANDLING IBECC MEMORY ERROR
- 분석 결과: N100 CPU(Alder Lake-N)의 IBECC(In-Band ECC) 기능이 일반 램(Non-ECC)과 충돌하거나, 리눅스 커널의 igen6_edac 드라이버가 과민 반응하여 시스템을 패닉 상태로 만든 것이 원인이라고 함
3. 해결 과정
시도 1: 하드웨어 점검 (램 재장착)
물리적인 접촉 불량일 가능성을 배제하기 위해 램을 탈착 후 지우개로 닦고 재장착했습니다. 하지만 미니 PC 특성상 BIOS(CMOS) 설정 메뉴가 제한적이어서, 근본적인 원인인 IBECC 기능을 BIOS에서 끄는 옵션이 없었음
시도 2: OS 레벨에서 드라이버 차단 (최종 해결책)
BIOS에서 제어가 불가능하므로, 우분투에서 문제를 일으키는 커널 모듈(igen6_edac)을 로드하지 않도록 블랙리스트 처리
설정 방법:
- 블랙리스트 파일 생성
-
Bash
echo "blacklist igen6_edac" | sudo tee /etc/modprobe.d/igen6_edac-blacklist.conf - 부팅 이미지(initramfs) 갱신
-
Bash
sudo update-initramfs -u - 재부팅이 설정을 통해 시스템이 불필요한 메모리 에러 감지 기능을 끄게 되어, 프리징 현상을 방지할 수 있음
-
Bash
sudo reboot
4. 함께 설치한 유용한 관리 도구
서버 안정성을 점검하기 위해 추가로 설치한 패키지
A. 하드웨어 온도 모니터링 (lm-sensors)
미니 PC의 발열 상태를 확인하기 위해 설치
- 설치: sudo apt install lm-sensors
- 사용: sudo sensors (CPU 및 보드 온도 실시간 확인)
그 외 설치한 프로그램들

반응형
'나름대로 유용' 카테고리의 다른 글
| 스트라이다 볼소켓 교체 (0) | 2024.11.28 |
|---|---|
| 잉카솔루션 체크텝 (0) | 2024.03.02 |
| 윈도우 11 인터넷 연결 없이 설치 (0) | 2023.12.20 |