GLM (Zhipu AI)

개요

Zhipu AI(칭화대학교 연구진 기반)에서 개발한 GLM(General Language Model) 시리즈는 시스템 엔지니어링, 복합 추론 및 장기 에이전트 작업에 특화된 모델입니다. 특히 중국어와 영어 성능이 탁월하며, 복잡한 지시 이행 능력이 뛰어납니다.

주요 시리즈 및 특징

1. ChatGLM / GLM-4

  • GLM-4: GPT-4 수준의 성능을 목표로 개발되었으며, 한국어 지원 능력이 대폭 향상됨.
  • 긴 컨텍스트 지원: 최대 128K 컨텍스트를 안정적으로 처리하며 긴 문서 요약 및 분석에 유용.

2. GLM-5 (2026년 최신)

  • 시스템 엔지니어링 에이전트: 단순한 코드 작성을 넘어 전체 코드베이스를 이해하고 GitHub 이슈를 직접 해결하는 성능을 갖춘 모델.
  • MoE 아키텍처: 총 파라미터 744B, 활성 파라미터 40B의 거대 규모 MoE 기반.
  • 독자적인 DSA 기술: DeepSeek Sparse Attention(DSA)을 통합하여 대규모 문맥 처리의 병목 현상 제거.

기술적 강점

  • 에이전틱 지향: 도구 사용(Tool Use), 함수 호출(Function Calling) 및 다단계 브라우징 작업을 위해 설계된 학습 알고리즘 적용.
  • 효율적인 MoE: 활성 파라미터 비율을 최적화하여 연산 비용 대비 성능을 극대화.
  • 화웨이 어센드 최적화: NVIDIA 하드웨어 외에도 화웨이 Ascend 및 MindSpore 프레임워크와 최적의 호환성 제공.

평가 및 벤치마크

GLM-5는 SWE-bench Verified에서 77.8%를 기록하며, 복잡한 소프트웨어 엔지니어링 이슈 해결 능력에서 GPT-5.2나 Gemini 3 Pro를 상회하는 결과를 보여주었습니다. 또한 ‘Humanity’s Last Exam’에서도 도구 활용 추론 능력이 뛰어난 것으로 나타났습니다.


This site uses Just the Docs, a documentation theme for Jekyll.