Blogger API 일괄 삭제 시 pagination 누락과 분류 실패 해결기

#081

2 min read · 552 words

Blogger API 일괄 삭제 작업을 진행하며 API 호출 제한과 분류 필터 오류로 인해 전체 데이터를 유실할 뻔한 문제를 해결한 운영 기록이다. 사장님의 과감한 스키마 재정의 지시를 수행하며 내가 직접 겪고 해결한 디버깅 과정을 공유한다.

문제 상황

사장님이 '초창기니까 과감하게 지울 글들 지워'라는 지시를 내렸다. 이에 따라 SaaS 비교, 리뷰, 뉴스, 포르투갈어 번역본(PT fanout), mojibake(깨진 문자), 테스트 포스트 등 fake EEAT 글들을 정리하고 순수 활용 팁 운영 기록만 남기기로 결정했다. 자본주의 사회에서 사장님의 지시는 곧 코드의 실행 기준이기에 내가 운영하는 자동화 모듈을 즉시 가동했다. 하지만 내가 작성한 웹앱 엔드포인트인 /api/posts/list?status=LIVE&limit=50으로 조회했을 때 130편 중 50편만 반환되어 전체 인벤토리를 파악할 수 없는 문제가 발생했다.

에러 증상

초반 분류 결과가 50/50 KEEP으로 나왔다. 지워야 할 SaaS 마케팅 글들이 전혀 걸러지지 않고 모두 'KEEP' 상태로 유지되는 기이한 현상이었다. 정확한 원인은 추가 확인이 필요하지만, 현재 확인된 원인은 실제 삭제 대상인 SaaS 글들이 페이지 2~3에 몰려 있었고, Blogger 자동 라벨의 mojibake 현상 때문에 기존 PowerShell 스타일의 단순 분류 함수가 'vs/comparison/best/alternatives' 등의 패턴을 제대로 매칭하지 못했기 때문이다.

환경

운영 환경은 Python 3.12를 기반으로 하며, Blogger v3 API(googleapiclient.discovery.build)를 사용했다. 인증은 auth.py의 build_blogger_service를 통해 수행했고, 대상 블로그 ID는 config.json의 blogger_blog_id를 참조했다.

시도했지만 실패한 방법

첫째, 웹앱 엔드포인트 단일 fetch를 시도했다. 그러나 limit 50 cap에 막혀 50개 이후의 글은 아예 조회하지 못하고 누락되었다. 둘째, 1차 단순 패턴 classify를 적용했다. SaaS 마케팅 패턴 중 복수형 단어(예: 'Tools')나 변형된 비교 키워드를 잡지 못해 대량의 fake 글이 필터를 통과했다. 본문 분석 없이 제목과 라벨만으로 분류하려다 실패한 것이다.

Every incident in this archive was lived through by the operator. We document the exact error, the failed attempts, the final fix, and the verification step — across Claude, GPT, Google Antigravity, and Cursor AI workflows. AI polishes the prose, but the operator ran every line of code that appears here.

input token (PowerShell error)

↓

encoder L1 — self-attention

↓

encoder L2 — feed-forward

↓

encoder L3 — residual

↓

output (fix suggestion)

Spotted an inaccuracy? Tell us — we update articles when the underlying tools change.

↓