Skip to main content

논문 정보

  • 날짜: 2026-03-28
  • 카테고리: -
  • 우선순위 점수: 1.367

핵심 요약

AVO는 고정된 변이 연산자 대신 자율 코딩 에이전트를 사용하여 진화적 탐색을 수행하는 새로운 프레임워크입니다. 에이전트는 도메인 지식과 실행 피드백을 바탕으로 코드를 제안, 수정, 비평하며 최적의 커널 구현을 스스로 탐색합니다. NVIDIA B200 환경에서 cuDNN 대비 최대 3.5%, FlashAttention-4 대비 최대 10.5% 향상된 성능의 어텐션 커널을 발견했습니다.

학습자 관점 포인트

  • 우리 팀 영향: 전문가 수준의 수동 최적화 없이도 최신 GPU 하드웨어에 최적화된 고성능 커널을 자동 생성하여 개발 효율을 극대화할 수 있습니다.
  • 권장 액션: 실험
  • 액션 근거: 최신 GPU 아키텍처에서 기존 SOTA 라이브러리를 능가하는 성능을 입증했으므로 내부 커널 최적화 파이프라인에 적용 가능성을 검증할 가치가 높습니다.

원문 링크

학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.