CAFE

정치/사회/이슈

멍청해진 챗 GPT-4 근황.

작성자Krieg|작성시간23.07.21|조회수408 목록 댓글 5

Researchers Chart Alarming Decline in ChatGPT Response Quality

https://www.tomshardware.com/news/chatgpt-response-quality-decline

 

 

연구원 차트 ChatGPT 응답 품질의 놀라운 감소

 

예를 들어 Chat GPT-4 소수 식별 정확도는 2023년 3월부터 6월까지 97.6%에서 2.4%로 떨어졌습니다.

최근 몇 달 동안 ChatGPT 응답의 품질 저하에 관한 일화적인 증거와 일반적인 불평이 넘쳐났습니다. Stanford와 UC Berkeley의 연구팀은 실제로 성능 저하가 있는지 확인하고 해로운 변화의 규모를 정량화하기 위한 지표를 제시하기로 결정했습니다. 간단히 말해서 ChatGPT 품질 의 다이빙은 확실히 상상할 수 없었습니다.

세 명의 저명한 학자인 Matei Zaharia, Lingjiao Chen, James Zou가 최근 발표한 연구 논문인 How Is ChatGPT의 동작은 시간이 지남에 따라 어떻게 변하는가? (PDF) 오늘 일찍 Zaharia에 있는 UC Berkeley의 컴퓨터 과학 교수는 트위터를 통해 연구 결과를 공유 했습니다 . 그는 "GPT-4의 '이 숫자가 소수인가? 단계적으로 생각하라'에 대한 성공률이 3월부터 6월까지 97.6%에서 2.4%로 떨어졌다"고 놀라울 정도로 강조했다.

GPT-4는 약 2주 전에 일반적으로 사용할 수 있게 되었으며 OpenAI에서 가장 발전되고 유능한 모델로 선정되었습니다. API 개발자에게 신속하게 공개되어 다양한 새로운 혁신적인 AI 제품을 구동할 수 있다고 주장했습니다. 따라서 새로운 연구가 일부 매우 간단한 질문에 대해 양질의 응답이 부족하다는 사실을 발견한 것은 슬프고 놀라운 일입니다.

 

(중략)

 

------------------------

 

뭔가 정보 오염 같은 게 엄청 이루어졌나 봅니다.

 

확실히 누구나 탈 수 있는 물에는 꼭 똥 같은 걸 집어넣는 사람들이 많기는 하니까요.

다음검색
현재 게시글 추가 기능 열기
  • 북마크
  • 신고 센터로 신고

댓글

댓글 리스트
  • 작성자구경하는사람24 | 작성시간 23.07.21 AI 언어모델의 헛점을 파고드는 질문을 날린듯 한데?

    Q: Is 17077 a prime number? Think step by step and then answer "[Yes]" or "[No]".
    A : March , June 둘 모두의 설명을 GPT-4의 대답을 들어보면 음 둘다 prime number야 라고 말하는데

    "[Yes]" or "[No]"를 제대로 인식 못함.

  • 작성자또디기 | 작성시간 23.07.22 정보오염은 알아서 막고있는 듯 한데, 적자가 심해서 경량화를 심하게 한 걸로 보입니다. 본인들은 경량화를 하긴 했지만 성능은 별로 차이 없다고 우기고 있지만 쓰는 사람들은 성능 처참해진 거 다 체감하고 있죠..ㅋㅋ
  • 답댓글 작성자황초롱이 | 작성시간 23.07.22 !!!!!!
  • 삭제된 댓글입니다.
  • 답댓글 작성자황초롱이 | 작성시간 23.07.22 ㅋㅋ
댓글 전체보기
맨위로

카페 검색

카페 검색어 입력폼