CAFE

AIX 질문&답변

2013년12월 주말반 유영관 입니다.!^^ 도와주세요..ㅠ.ㅠ..

작성자보물섬|작성시간14.05.07|조회수1,082 목록 댓글 7

안녕하세요... 작년 12월 AIX주말반  유영관 입니다. ^^

요새좀 바빠서 카페에 글 잘 못올렸네요...

 

다음주 부터 리눅스 주말과정 다시 등록하였습니다.  주말에 뵈면 인사함 드릴께요..^^

 

다름이 아니라 저희 IBM P-740 ( SAN 구성 )가  2주전 부터  아래처럼

DCB47997 0506001014 T H hdisk7 DISK OPERATION ERROR

4B436A3D 0506001014 T H fscsi3 LINK ERROR

이 메세지가 1주일 단위로 계속 나오고 있습니다.  특정시간에 1번만 발생을 하네요... 저희 유지보수 업체에 문의를 해보니

서버와 SAN간 광케이블 신호가 불특정하게 나와서 그렇다고 해서 1주일 지났는데  어제 다시 발생을 했네요..

 

저희 부장님 과 팀장님이  절 잡아 먹으려 하시네요..ㅋㅋ ㅠ.ㅠ

정확한 원인과 해결책을 제시하라고 ㅠㅠ..  

 

계속 일시적인 패킷오류라고 애기를 하네요...  그렇긴 한데 저희회사에서는 1분도 죽으면 않되는 서버라 넘 민감하네요..

참 서버는  아래 기종입니다. ( prtconf ) 2대를  GPFS 구성이 되어있구요...

System Model: IBM,8205-E6C
Machine Serial Number: 06F138R
Processor Type: PowerPC_POWER7
Processor Implementation Mode: POWER 7
Processor Version: PV_7_Compat
Number Of Processors: 8
Processor Clock Speed: 3300 MHz
CPU Type: 64-bit
Kernel Type: 64-bit
LPAR Info: 1 aix_gold
Memory Size: 31488 MB
Good Memory Size: 31488 MB
Platform Firmware level: AL740_112
Firmware Version: IBM,AL740_112
Console Login: enable
Auto Restart: true

 

강사님 도와주세요...

다른 고수님들고  혹시 경험이 있으신 분 계시면 답글 부탁드립니다.

 

사실 로그를 바서는 일시적인 에러라 넘어 가도 되지만   저희 회사 특성상  일시적이라도 왜 이런 에러가 나는지 원인을 파악 해야 되서요

 

넘넘 스트레스 받습니다.  도움 부탁 드립니다.

 

아래 errpt 로그와   errpt -aj 화면 입니다.

 

 

[NEWONLINE1:/dev/pts/18]/elcas/logfile[175]% errpt

IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION

DCB47997   0506001014 T H hdisk7         DISK OPERATION ERROR

4B436A3D   0506001014 T H fscsi3         LINK ERROR

 

[NEWONLINE1:/dev/pts/18]/elcas/logfile[176]% errpt -aj DCB47997

---------------------------------------------------------------------------

LABEL:          SC_DISK_ERR4

IDENTIFIER:     DCB47997

 

Date/Time:       Tue May  6 00:10:01 KST 2014

Sequence Number: 161683

Machine Id:      00F7F1384C00

Node Id:         NEWONLINE1

Class:           H

Type:            TEMP

WPAR:            Global

Resource Name:   hdisk7

Resource Class:  disk

Resource Type:   2145

Location:        U78AA.001.WZSHXNV-P1-C2-T1-W50050768021609D1-L5000000000000

 

VPD:

        Manufacturer................IBM

        Machine Type and Model......2145

        ROS Level and ID............0000

        Device Specific.(Z0)........0000063268181002

        Device Specific.(Z1)........0200a04

        Serial Number...............6005076802810D773000000000000042

 

Description

DISK OPERATION ERROR

 

Probable Causes

MEDIA

DASD DEVICE

 

User Causes

MEDIA DEFECTIVE

 

        Recommended Actions

        FOR REMOVABLE MEDIA, CHANGE MEDIA AND RETRY

        PERFORM PROBLEM DETERMINATION PROCEDURES

 

Failure Causes

MEDIA

DISK DRIVE

 

        Recommended Actions

        FOR REMOVABLE MEDIA, CHANGE MEDIA AND RETRY

        PERFORM PROBLEM DETERMINATION PROCEDURES

 

Detail Data

PATH ID

           0

SENSE DATA

0A00 2800 0160 7A00 0002 0004 0000 0000 0000 0000 0000 0000 0200 0200 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0007 68A8 0001 2400 0000 0000 0000 0000 0000 0000 0000 0003 0000

0000 0000 001D

 

-------------------------------------------------------------------------------------------------------------------------

 

 

[NEWONLINE1:/dev/pts/18]/elcas/logfile[178]% errpt -aj 4B436A3D

---------------------------------------------------------------------------

LABEL:          FCP_ERR4

IDENTIFIER:     4B436A3D

 

Date/Time:       Tue May  6 00:10:00 KST 2014

Sequence Number: 161682

Machine Id:      00F7F1384C00

Node Id:         NEWONLINE1

Class:           H

Type:            TEMP

WPAR:            Global

Resource Name:   fscsi3

Resource Class:  driver

Resource Type:   efscsi

Location:        U78AA.001.WZSHXNV-P1-C3-T2

 

 

Description

LINK ERROR

 

        Recommended Actions

        PERFORM PROBLEM DETERMINATION PROCEDURES

 

Detail Data

SENSE DATA

0000 0010 0000 004A 0000 0000 0201 0000 0000 0000 0005 0000 0000 0000 0000 0002

2800 0160 7A00 0002 0004 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0004 0000 0000 000A 0000 0000 0001 0600 0000 0000 0001 0000 0000 0000 0000 0000

5005 0768 0216 09D1 5005 0768 0206 09D1 0000 0000 0000 0000 0000 0000 0000 0000

0001 0000 0000 0000 0000 0000 000E 0001 0000 0000 0000 0001 0000 0000 0000 0000

0000 036F 0000 0002 0000 0200 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0020 0000 0001 0000 0000 0000 0032 0000 0000 0000 0000 8071 E000

2400 0040 0040 0800 0000 0000 000E 0001 0000 0400 0000 0000 1000 0200 069A 2200

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

2400 0040 0040 0800 0000 0000 000E 0001 0F00 0000 0000 0000 1000 2608 369B 22E0

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

2400 0040 0040 0800 0000 0000 000E 0001 0000 0400 0000 0000 1000 0200 069A 2200

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

2000 0000 0000 0800 0000 0000 1801 0000 00D0 0500 0000 0000 6000 0040 782C 0500

0000 0000 0000 0000 0000 1000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

1000 0090 FA2D C115 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

 

다음검색
현재 게시글 추가 기능 열기

댓글

댓글 리스트
  • 작성자백승찬 | 작성시간 14.05.08 이것에 대한 APAR 존재하기는 합니다만... 우선 oslevel 출력 결과 좀
  • 작성자보물섬 작성자 본인 여부 작성자 | 작성시간 14.05.12 안녕하십니까. 강사님 답변 늦게 봤네요... oslevel -s 아래와 같습니다.

    root@NEWONLINE1:[/]#>oslevel -s
    6100-07-08-1339
  • 작성자보물섬 작성자 본인 여부 작성자 | 작성시간 14.05.12 지난주 부터 리눅스강좌 주말반 6강의장에서 시작하였습니다.
    주말엔 강의 않하시는것 같던데요.. ^^ 지나 다니다 않계셔서...
    암튼 이것때문에 지금 죽겠습니다. 어제 그제도 발생을 하였네요... 그래서 내일 새벽에 광케이블 교체 해볼려고 합니다. ㅠ.ㅠ...
  • 작성자보물섬 작성자 본인 여부 작성자 | 작성시간 14.05.12 어제 그제 토요일 발생 errpt
    root@NEWONLINE1:[/]#>errpt
    IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
    DCB47997 0510063014 T H hdisk14 DISK OPERATION ERROR
    4B436A3D 0510063014 T H fscsi3 LINK ERROR
  • 작성자보물섬 작성자 본인 여부 작성자 | 작성시간 14.05.12 현재 errpt상 동일하게 fscsi3 광케이블 쪽에서 발생을 하고있고. 구간은 SAN <-> 서버간 구간으로 추측하고 있으며, SAN / Storage(V7000) 로그도 에러가 발생을 하지 않았습니다.
    그래서 SAN <-> 서버 광케이블 fscsi3번을 교체 하고 각 광모듈도 교체 해볼려고 합니다.
    이유는 계속 동일하게 광케이블 fscsi3번이 오류가 뜬후 디스크 오류가 발생을 하고, 디스크는 오류는 계속 변경이 되는데 fscsi3번 오류는 계속 발생을 하고있습니다.
    발생은 현재까지 3회 발생을 하였습니다. 우선 해볼수 있는건 광케이블 교체 밖에 없는것 같아서요...ㅠ.ㅠ...
댓글 전체보기
맨위로

카페 검색

카페 검색어 입력폼