본문 바로가기
주식

오픈AI GPT-4 출시, 기존 ChatGPT(GPT-3.5)에 비교해서 성능이 얼마나 더 향상됐을까?

by 지식 대장장이 2023. 3. 15.
728x90
728x90

GPT-4의 향상된 성능


폭넓은 일반 지식과 문제 해결 능력 덕분에 어려운 문제를 더 정확하게 해결할 수 있습니다.

1. 창의성

GPT-4는 그 어느 때보다 더 창의적이고 협업적입니다. 노래 작곡, 시나리오 작성, 사용자의 글쓰기 스타일 학습 등 창의적이고 기술적인 글쓰기 작업을 사용자와 함께 생성, 편집, 반복할 수 있습니다.
 

  • 입력 :
    신데렐라의 줄거리를 문장으로 설명하세요. 각 단어는 반복되는 글자 없이 알파벳 A부터 Z까지 다음 글자로 시작해야 합니다.
    Explain the plot of Cinderella in a sentence where each word has to begin with the next letter in the alphabet from A to Z, without repeating any letters.

  • 출력 :
    아름다운 신데렐라가 열심히 살고 마침내 행복을 얻고, 질투심 많은 친척을 고무시키고, 사랑은 부유 한 왕자를 마술처럼 키우고, 조용히 구출하고, 슬리퍼가 승리하고, 매우 놀랍게도 이질적인 젊은이들을 열렬히 단결시킵니다.
    A beautiful Cinderella, dwelling eagerly, finally gains happiness; inspiring jealous kin, love magically nurtures opulent prince; quietly rescues, slipper triumphs, uniting very wondrously, xenial youth zealously.

※ 이 예시는 영문으로 봐야 실감을 할 수 있기 때문에 영문을 첨부하였습니다.

728x90
728x90

2. 시각적 입력

GPT-4는 이미지를 입력으로 받아 캡션, 분류 및 분석을 생성할 수 있습니다.
 

  • 입력 :
    이 재료로 무엇을 만들 수 있나요?

계란, 밀가루, 우유 등 재료 사진
계란, 밀가루, 우유 등 재료 사진

  • 출력 :
    이 재료로 만들 수 있는 음식에는 다양한 옵션이 있습니다! 몇 가지 가능성은 다음과 같습니다:
    - 팬케이크 또는 와플
    - 크레페
    - 프렌치토스트
    - 오믈렛 또는 프리타타
    - 키슈- 커스터드 또는 푸딩
    - 케이크 또는 컵케이크
    - 머핀 또는 빵
    - 쿠키 또는 비스킷

    이는 몇 가지 예에 불과하지만 가능성은 무궁무진합니다!

※ 사진을 분석하여 사진에 있는 재료들을 파악한 후 결과를 도출해 냅니다.

 

3. 더 긴 맥락

GPT-4는 25,000 단어 이상의 텍스트를 처리할 수 있어 긴 형식의 콘텐츠 제작, 확장된 대화, 문서 검색 및 분석과 같은 사용 사례를 지원합니다.
 

  • 입력 : 
    [Text from: https://en.wikipedia.org/wiki/Rihanna]
    그녀의 슈퍼볼 공연과 그 공연이 특별했던 이유에 대해 설명하세요.

  • 출력 : 
    리한나의 슈퍼볼 LVII 하프타임 쇼 공연은 여러 가지 이유로 특별했습니다. 우선 5년 만에 처음으로 라이브 공연을 펼쳤고, 슈퍼볼 하프타임 쇼의 헤드라이너를 맡은 것은 이번이 처음이었기 때문입니다. 또한, 그녀는 임신 중에 슈퍼볼에서 공연한 최초의 인물이 되어 역사를 새로 썼습니다. 공연 자체는 비평가들의 호평을 받았으며, 많은 사람들이 그녀의 에너지 넘치는 공연과 인상적인 보컬에 찬사를 보냈습니다. 또한 엄청난 시청률을 기록하여 역사상 두 번째로 가장 많이 시청한 하프타임 쇼가 되었습니다.

 

※ 리한나의 위키피디아에 있는 모든 글을 읽고, 슈퍼볼 공연에 관한 내용만 도출해 냅니다.


GPT-4는 고급 추론 기능에서 ChatGPT를 능가합니다.

1. ChatGPT

  • 입력 : 
    앤드류는 오전 11시부터 오후 3시까지, 조앤은 정오부터 오후 2시까지, 오후 3시 30분부터 오후 5시까지 무료입니다.
    한나는 정오부터 30분간, 그리고 오후 4시부터 오후 6시까지 이용 가능합니다.
    앤드류, 한나, 조앤의 30분 미팅 시작 시간에는 어떤 옵션이 있나요?

  • 출력 : 
    다음은 이용 가능 시간 목록입니다:
    - 앤드류 : 오전 11시부터 오후 3시까지
    - 조앤 : 정오부터 오후 2시까지, 오후 3시 30분부터 오후 5시까지
    - 한나 : 정오~오후 12시 30분, 오후 4시~오후 6시

    이용 가능 여부에 따라 세 사람 모두 이용 가능한 시간은 오후 4시부터 오후 4시 30분까지 30분간입니다. 
    따라서 오후 4시에 미팅을 예약할 수 있습니다.

※ ChatGPT는 부정확한 답을 내놨습니다.

 

2. GPT-4

  • 입력 : 
    앤드류는 오전 11시부터 오후 3시까지, 조앤은 정오부터 오후 2시까지, 오후 3시 30분부터 오후 5시까지 무료입니다.
    한나는 정오부터 30분간, 그리고 오후 4시부터 오후 6시까지 이용 가능합니다.
    앤드류, 한나, 조앤의 30분 미팅 시작 시간에는 어떤 옵션이 있나요?

  • 출력 : 
    앤드류 : 오전 11시 - 오후 3시
    조앤 : 오후 12시 - 오후 2시, 오후 3시 30분 - 오후 5시
    한나 : 오후 12시 - 오후 12시 30분, 오후 4시 - 오후 6시

    30분 회의에 공통적으로 이용 가능합니다 : 오후 12시 - 오후 12시 30분

※ GPT-4는 정확한 답을 내놨습니다.


GPT-4는 응시자의 대략적인 백분위 수에서 더 높은 점수를 획득하여 ChatGPT를 능가합니다.

1. 변호사 시험

  • ChatGPT : 하위 10%
  • GPT-4 : 상위 10%

2. 생물학 올림피아드

  • ChatGPT : 하위 31%
  • GPT-4 : 상위 1%

※ ChatGPT에 비해서 GPT-4가 더 높은 점수를 획득하였습니다.


해당 글이 도움이 되었다면,

광고 한 번 눌러주세요^^


 

테슬라 소식 2023년 3월 15일 오늘은 어떤 흥미로운 뉴스가?

테슬라 소식 2023년 3월 15일 S&P500 MAP 테슬라 주가 테슬라 재고 테슬라 재무 - 분기 테슬라 재무 - 연간 테슬라 1. 테슬라는 캘리포니아에 총 428개의 스톨을 제공하는 4개의 대형 수퍼차저 스테이션

share1.tistory.com

728x90
728x90

댓글