테스트 방법
이번 벤치마크에서는 실무에서 자주 발생하는 3가지 글쓰기 시나리오를 기준으로 각 AI의 성능을 평가했습니다.
시나리오 1: 블로그 포스트 작성
SEO를 고려한 기술 블로그 포스트를 작성하도록 했습니다. 키워드 밀도, 구조화, 가독성을 종합 평가합니다.
시나리오 2: 비즈니스 이메일 작성
해외 파트너에게 보내는 공식 비즈니스 이메일을 한영 모두 작성하도록 했습니다.
시나리오 3: 마케팅 카피 작성
신제품 런칭을 위한 SNS 마케팅 카피 5종을 작성하도록 했습니다. 톤앤매너 일관성과 매력도를 평가합니다.
평가 기준
각 시나리오에서 동일한 3가지 평가 항목(정확도, 창의성, 자연스러움)으로 100점 만점 채점을 진행했습니다.