구글 리서치에서 터보퀀트(TurboQuant) 라는 새로운 AI 압축 알고리즘 논문을 발표했다. AI 전문가 분들이라면 단순 뉴스 기사만 보고도 어떤 알고리즘의 숙제를 풀어간건지 알 수 있지만, 나는 그렇지 못하기에 정리를 해보았다. TurboQuant 도전한 과제도전터보퀀트메모리 절감최대 6배 절감추론 속도최대 8배 향상 (H100 기준)정확도 유지0에 근사한 정확도 손실 TurboQuant 주요 기술> 극좌표 양자화 PolarQuant고차원 벡터 데이터를 격자 형태가 아닌 구형 (극좌표) 기반으로 변환한다.데이터가 특정 곡선형태를 띠게 유도하여 추가적인 메타데이터(양자화 상수) 없이도 아주 작은 비트(최소 3비트)로 압축할 수 있게함.> QJL (Quantized Johnson-Lindenstraus..