안녕하세요... 작년 12월 AIX주말반 유영관 입니다. ^^
요새좀 바빠서 카페에 글 잘 못올렸네요...
다음주 부터 리눅스 주말과정 다시 등록하였습니다. 주말에 뵈면 인사함 드릴께요..^^
다름이 아니라 저희 IBM P-740 ( SAN 구성 )가 2주전 부터 아래처럼
DCB47997 0506001014 T H hdisk7 DISK OPERATION ERROR
4B436A3D 0506001014 T H fscsi3 LINK ERROR
이 메세지가 1주일 단위로 계속 나오고 있습니다. 특정시간에 1번만 발생을 하네요... 저희 유지보수 업체에 문의를 해보니
서버와 SAN간 광케이블 신호가 불특정하게 나와서 그렇다고 해서 1주일 지났는데 어제 다시 발생을 했네요..
저희 부장님 과 팀장님이 절 잡아 먹으려 하시네요..ㅋㅋ ㅠ.ㅠ
정확한 원인과 해결책을 제시하라고 ㅠㅠ..
계속 일시적인 패킷오류라고 애기를 하네요... 그렇긴 한데 저희회사에서는 1분도 죽으면 않되는 서버라 넘 민감하네요..
참 서버는 아래 기종입니다. ( prtconf ) 2대를 GPFS 구성이 되어있구요...
강사님 도와주세요...
다른 고수님들고 혹시 경험이 있으신 분 계시면 답글 부탁드립니다.
사실 로그를 바서는 일시적인 에러라 넘어 가도 되지만 저희 회사 특성상 일시적이라도 왜 이런 에러가 나는지 원인을 파악 해야 되서요
넘넘 스트레스 받습니다. 도움 부탁 드립니다.
아래 errpt 로그와 errpt -aj 화면 입니다.
[NEWONLINE1:/dev/pts/18]/
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
DCB47997 0506001014 T H hdisk7 DISK OPERATION ERROR
4B436A3D 0506001014 T H fscsi3 LINK ERROR
[NEWONLINE1:/dev/pts/18]/
------------------------------
LABEL: SC_DISK_ERR4
IDENTIFIER: DCB47997
Date/Time: Tue May 6 00:10:01 KST 2014
Sequence Number: 161683
Machine Id: 00F7F1384C00
Node Id: NEWONLINE1
Class: H
Type: TEMP
WPAR: Global
Resource Name: hdisk7
Resource Class: disk
Resource Type: 2145
Location: U78AA.001.WZSHXNV-P1-C2-T1-
VPD:
Manufacturer................
Machine Type and Model......2145
ROS Level and ID............0000
Device Specific.(Z0)........
Device Specific.(Z1)........0200a04
Serial Number...............
Description
DISK OPERATION ERROR
Probable Causes
MEDIA
DASD DEVICE
User Causes
MEDIA DEFECTIVE
Recommended Actions
FOR REMOVABLE MEDIA, CHANGE MEDIA AND RETRY
PERFORM PROBLEM DETERMINATION PROCEDURES
Failure Causes
MEDIA
DISK DRIVE
Recommended Actions
FOR REMOVABLE MEDIA, CHANGE MEDIA AND RETRY
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
PATH ID
0
SENSE DATA
0A00 2800 0160 7A00 0002 0004 0000 0000 0000 0000 0000 0000 0200 0200 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0007 68A8 0001 2400 0000 0000 0000 0000 0000 0000 0000 0003 0000
0000 0000 001D
------------------------------
[NEWONLINE1:/dev/pts/18]/
------------------------------
LABEL: FCP_ERR4
IDENTIFIER: 4B436A3D
Date/Time: Tue May 6 00:10:00 KST 2014
Sequence Number: 161682
Machine Id: 00F7F1384C00
Node Id: NEWONLINE1
Class: H
Type: TEMP
WPAR: Global
Resource Name: fscsi3
Resource Class: driver
Resource Type: efscsi
Location: U78AA.001.WZSHXNV-P1-C3-T2
Description
LINK ERROR
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
SENSE DATA
0000 0010 0000 004A 0000 0000 0201 0000 0000 0000 0005 0000 0000 0000 0000 0002
2800 0160 7A00 0002 0004 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0004 0000 0000 000A 0000 0000 0001 0600 0000 0000 0001 0000 0000 0000 0000 0000
5005 0768 0216 09D1 5005 0768 0206 09D1 0000 0000 0000 0000 0000 0000 0000 0000
0001 0000 0000 0000 0000 0000 000E 0001 0000 0000 0000 0001 0000 0000 0000 0000
0000 036F 0000 0002 0000 0200 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0020 0000 0001 0000 0000 0000 0032 0000 0000 0000 0000 8071 E000
2400 0040 0040 0800 0000 0000 000E 0001 0000 0400 0000 0000 1000 0200 069A 2200
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
2400 0040 0040 0800 0000 0000 000E 0001 0F00 0000 0000 0000 1000 2608 369B 22E0
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
2400 0040 0040 0800 0000 0000 000E 0001 0000 0400 0000 0000 1000 0200 069A 2200
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
2000 0000 0000 0800 0000 0000 1801 0000 00D0 0500 0000 0000 6000 0040 782C 0500
0000 0000 0000 0000 0000 1000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
1000 0090 FA2D C115 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
댓글
댓글 리스트-
작성자백승찬 작성시간 14.05.08 이것에 대한 APAR 존재하기는 합니다만... 우선 oslevel 출력 결과 좀
-
작성자보물섬 작성자 본인 여부 작성자 작성시간 14.05.12 안녕하십니까. 강사님 답변 늦게 봤네요... oslevel -s 아래와 같습니다.
root@NEWONLINE1:[/]#>oslevel -s
6100-07-08-1339 -
작성자보물섬 작성자 본인 여부 작성자 작성시간 14.05.12 지난주 부터 리눅스강좌 주말반 6강의장에서 시작하였습니다.
주말엔 강의 않하시는것 같던데요.. ^^ 지나 다니다 않계셔서...
암튼 이것때문에 지금 죽겠습니다. 어제 그제도 발생을 하였네요... 그래서 내일 새벽에 광케이블 교체 해볼려고 합니다. ㅠ.ㅠ... -
작성자보물섬 작성자 본인 여부 작성자 작성시간 14.05.12 어제 그제 토요일 발생 errpt
root@NEWONLINE1:[/]#>errpt
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
DCB47997 0510063014 T H hdisk14 DISK OPERATION ERROR
4B436A3D 0510063014 T H fscsi3 LINK ERROR -
작성자보물섬 작성자 본인 여부 작성자 작성시간 14.05.12 현재 errpt상 동일하게 fscsi3 광케이블 쪽에서 발생을 하고있고. 구간은 SAN <-> 서버간 구간으로 추측하고 있으며, SAN / Storage(V7000) 로그도 에러가 발생을 하지 않았습니다.
그래서 SAN <-> 서버 광케이블 fscsi3번을 교체 하고 각 광모듈도 교체 해볼려고 합니다.
이유는 계속 동일하게 광케이블 fscsi3번이 오류가 뜬후 디스크 오류가 발생을 하고, 디스크는 오류는 계속 변경이 되는데 fscsi3번 오류는 계속 발생을 하고있습니다.
발생은 현재까지 3회 발생을 하였습니다. 우선 해볼수 있는건 광케이블 교체 밖에 없는것 같아서요...ㅠ.ㅠ...