Skip to main content

논문 정보

  • 날짜: 2026-03-03
  • 카테고리: -
  • 우선순위 점수: 2.067

핵심 요약

SWE-rebench V2는 20개 언어와 3,600개 이상의 저장소를 아우르는 32,000개 이상의 실행 가능한 소프트웨어 엔지니어링(SWE) 작업 데이터셋을 제공합니다. 대규모 강화학습(RL) 학습을 위해 자동화된 파이프라인을 통해 설치 및 테스트 절차를 생성하고 LLM 앙상블로 검증된 인스턴스를 필터링합니다. 추가적으로 120,000개 이상의 작업 메타데이터를 공개하여 다양한 언어 환경에서 SWE 에이전트의 성능을 높일 수 있도록 설계되었습니다.

학습자 관점 포인트

  • 우리 팀 영향: 다양한 프로그래밍 언어에 대응하는 대규모 SWE 에이전트 학습 데이터 확보 및 벤치마크 환경 구축에 기여할 수 있습니다.
  • 권장 액션: 도입 검토
  • 액션 근거: 기존 SWE-bench 대비 데이터 규모와 언어 다양성이 크게 확장되어 에이전트의 범용성 학습에 유용하기 때문입니다.

원문 링크

학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.