AI

o3-mini는 o1을 대체 가능할까? (o3-mini vs o1)

Nhahan 2025. 2. 2. 14:14

 

ChatGPT

주의) o3-mini-high가 아니라, o3-mini에 대한 비교입니다!

 

o3-mini-high는 당연히 o1보다 성능이 좋은데, 이용 한도가 50 per week기 때문에 이용에 불편함이 크다.

하지만 o3-mini는 이용 한도가 150 per day로 사실상 일반 사용자라면 무제한 이용과 다를 바 없어 만약 o3-mini가 o1과 성능이 좋거나 혹은 대등하다면, DeepSeek-R1이 무료로 풀린 이 시점에서 ChatGPT 과금을 할만한 충분한 사유가 된다.

OpenAI에게 좋은 자극을 준 DeepSeek

 

결론부터 말하자면, 성능은 대체가 가능하다!

(이제 뒤로가기를 누르셔도 됩니다 😄)

 


 

https://www.youtube.com/watch?v=e-647TxSIz4

 

감사하게도 이 영상에서 o3-mini와 o1의 성능을 비교해주고 있는데, 어떠한 부분은 o3-mini가 우세했고 o1이 나았다.

사실상 동급의 성능을 보이고 있는 것이다.

 

 

테스트 결과

  1. 추론 능력
    • o3-mini는 좌석 배치 문제를 완벽히 해결하지는 못했지만, o1보다 더 나은 답변은 제공
    • 여러 번 테스트한 결과, o1은 몇 번의 시도 후 같은 결론에 도달하는 반면 o3-mini는 더 나은 논리적 접근을 보임
    • o1도 o3-mini와 같은 답변을 내놓았음
  2. 수학 성능
    • 어려운 수학 문제에서는 o3-mini와 o1 모두 실패
    • 중간 난이도 문제에서는 o3-mini가 정답을 도출했지만, o1은 엉뚱한 결과를 냄
  3. 코딩 성능
    • 유명한 삼각형 문제에서는 o3-mini가 정답을 맞혔으나, o1은 완전히 실패
    • 어려운 Codeforces 문제에서는 두 모델 모두 실패
    • Pac-Man 문제에서는 o3-mini가 실패했지만, o1이 의외로 가장 좋은 답변을 제공
  1.  
728x90