라떼군 이야기


AI 기업에 데이터를 넘겼다가... 영국 최대 법원 DB가 강제 삭제된 사연

TL;DR 영국 법무부가 기자들이 사용하는 최대 규모의 법원 기록 데이터베이스인 ‘Courtsdesk’의 강제 삭제를 명령했습니다. 표면적인 이유는 제3자 AI 기업에 대한 무단 데이터 공유이지만, 실제로는 정부 시스템의 비효율성을 드러낸 민간 서비스에 대한 견제라는 시각도 존재합니다. 이는 공공 데이터의 투명성(Open Justice)과 데이터 보안 규정 사이의 충돌을 보여주는 상징적인 사건입니다.


디지털 전환이 가속화되는 시대에도 법조계와 정부 시스템은 여전히 보수적인 영역으로 남아 있습니다. 최근 영국에서는 기자들이 법원 사건을 추적하는 데 필수적이었던 민간 플랫폼이 정부 명령으로 하루아침에 폐쇄되는 일이 발생했습니다. 단순한 행정 처분을 넘어, 공공 데이터의 활용 범위와 AI 시대의 데이터 거버넌스, 그리고 ‘열린 사법(Open Justice)‘의 가치가 충돌한 이 사건의 배경을 살펴봅니다.

핵심 내용

영국 법무부 산하 HMCTS(법원행정처)는 법원 기록 플랫폼인 Courtsdesk에 모든 데이터를 삭제하고 서비스를 중단할 것을 명령했습니다. HMCTS는 Courtsdesk가 민감한 법원 데이터를 제3자 AI 기업과 무단으로 공유하여 보안 규정을 위반했다고 주장했습니다. 반면 Courtsdesk 측은 정부 자체 시스템의 데이터 정확도가 4.2%에 불과하고 수백만 건의 재판이 언론 통보 없이 진행되는 상황에서, 자신들이 유일하게 정확한 정보를 제공해왔다고 반박했습니다. 창업자와 전직 장관까지 나서서 구명을 호소했으나 정부는 강경한 입장을 고수하고 있습니다.

기술적 인사이트

소프트웨어 엔지니어 관점에서 이 사건은 ‘레거시 시스템의 한계’와 ‘서드파티 AI 통합의 리스크’를 동시에 보여줍니다. 정부의 공식 데이터 파이프라인이 엉망(정확도 4.2%)인 상황에서, 민간 기업은 스크래핑이나 데이터 클렌징을 통해 가치를 창출했습니다. 하지만 핵심은 ‘AI 기업으로의 데이터 전송’입니다. 민감한 법적 데이터를 LLM 등 외부 AI API로 전송하는 과정에서 데이터 주권(Data Sovereignty)과 개인정보 처리 위탁 문제가 발생했을 가능성이 큽니다. 이는 기능적 혁신(편리한 검색)이 규제적 컴플라이언스(데이터 통제)를 넘어서지 못한 사례로, GovTech 분야에서 외부 API 의존도가 높을 때 발생할 수 있는 치명적인 ‘단일 실패 지점(Single Point of Failure)‘을 시사합니다.

시사점

이번 사태는 LegalTech 및 공공 데이터를 다루는 개발자들에게 중요한 경고를 줍니다. 첫째, 공공 기관의 데이터를 가공할 때 제3자 AI 서비스(OpenAI, Anthropic 등)를 파이프라인에 포함시키는 것은 계약상 명시되지 않는 한 치명적인 위반 사유가 될 수 있습니다. 둘째, 플랫폼 리스크입니다. 원천 데이터 소유권자가 API 접근 권한을 무기로 서비스를 언제든 종료시킬 수 있다는 점을 상기시킵니다. 결과적으로 업계는 온프레미스(On-premise) AI 모델이나 더 엄격한 데이터 격리 아키텍처를 요구받게 될 것입니다.


정부의 ‘보안 위반’ 주장은 타당한 우려일까요, 아니면 자신들의 시스템적 결함을 감추기 위한 명분일까요? AI 기술이 공공 영역 깊숙이 들어올수록 ‘데이터 활용의 효율성’과 ‘엄격한 통제’ 사이의 줄타기는 더욱 위태로워질 것입니다. 개발자와 기획자는 혁신적인 기능을 구현하는 것만큼이나, 그 데이터가 어디로 흘러가는지에 대한 법적 리스크를 설계 단계부터 고민해야 합니다.

원문 읽기

Collaboration & Support (협업 및 후원) Get in touch (연락하기) →