공시 데이터 파이프라인
OpenDART, corp_code, 공시 원문, XBRL을 실제 수집기 구조로 연결하는 시리즈입니다.
DartLab은 공시를 읽는 법을 넘어서, 반복 가능한 수집기와 분석 파이프라인으로 연결하는 방법까지 다룹니다.

파이썬으로 재무제표 분석하기 — 코드 한 줄로 2,700개 기업을 비교한다
파이썬으로 상장기업 재무제표를 분석하는 방법을 처음부터 끝까지 정리한다. 데이터 수집, 계정 표준화, 분기별 시계열, 재무비율, 섹터 분류, 인사이트 등급, 기업 간 비교까지 — 엑셀로는 며칠 걸릴 작업을 코드 몇 줄로 끝내는 방법.
읽기
OpenDART로 주요사항보고서 읽는 법
OpenDART 주요사항보고서 API를 이용해 어떤 이벤트를 구조적으로 모니터링할 수 있는지 정리한다. 자산 양수도, 타법인 주식 취득, 유상증자, 전환사채, 소송, 공급계약 같은 사건을 API와 원문 공시를 연결해 읽는 실전 흐름을 설명한다.
읽기
XBRL 재무제표 원문과 주석 다운로드 파이프라인
OpenDART에서 재무제표를 제대로 수집하려면 JSON API만 보면 안 된다. corp_code, 접수번호, 공시서류원본파일, XBRL 원문, 주석 일괄다운로드를 어떤 순서로 연결해야 하는지 실전 파이프라인 기준으로 정리한다.
읽기
corp_code부터 filing 원문까지 DART 수집 파이프라인 설계
OpenDART 수집기는 endpoint 몇 개를 호출한다고 끝나지 않는다. corp_code, 공시검색, 접수번호(rcept_no), 원문 파일, 정정공시를 어떤 순서로 묶어야 안정적인 DART 수집 파이프라인이 되는지 실전 기준으로 정리한다.
읽기
DART 정정공시를 파이프라인에서 다루는 법
정정공시는 수집기를 가장 쉽게 망가뜨리는 영역이다. 검색 결과, 접수번호, 원문, 최종 유효본을 어떤 구조로 묶어야 안정적인 DART 파이프라인이 되는지 실전 기준으로 정리한다.
읽기
전자공시 문서를 기간별로 비교하는 법 — DART와 EDGAR의 sections 구조
DART 사업보고서와 EDGAR 10-K를 기간별로 나란히 비교하려면 보통 수십 개 파일을 뒤져야 한다. sections는 이 작업을 topic x period 매트릭스 하나로 끝낸다. 구조, 코드, 실전 활용을 정리한다.
읽기
show(topic) — 공시 데이터를 한 줄로 꺼내는 구조와 실전 활용
DartLab의 show()는 수백 페이지 공시 문서에서 원하는 주제를 한 줄로 꺼낸다. 블록 목차, 텍스트·테이블 분리, 기간 필터, 세로 뷰까지 — 구조와 실전 코드를 정리한다.
읽기
XBRL 파싱과 계정 매핑은 왜 어렵고 어떻게 풀어야 하나
회사마다 다른 XBRL 계정 ID와 한글명을 하나의 표준 체계로 매핑하는 전체 파이프라인을 정리한다. prefix 정규화, 동의어 사전, 학습 기반 매퍼, 매핑률 측정, BS 항등식 검증까지 실전 기준으로 다룬다.
읽기
전자공시 대량 수집은 왜 느리고 어디서 막히나
OpenDART와 EDGAR에서 수천 종목 데이터를 대량 수집할 때 부딪히는 rate limit, 네트워크 장애, 재시도 전략을 정리한다. 단순 반복 호출이 아닌 실전 파이프라인 설계 기준을 다룬다.
읽기
수집한 재무 데이터를 어떻게 자동으로 검증하나
수천 종목의 재무제표 데이터를 수집한 뒤, 매핑 오류·누락·이상치를 자동으로 잡아내는 검증 파이프라인을 설계한다. BS 항등식, 시계열 연속성, 업종별 기대값 검증까지 실전 전략을 다룬다.
읽기
한국 DART와 미국 EDGAR 데이터를 하나의 구조로 합치려면
K-IFRS 기반 DART와 US-GAAP 기반 EDGAR의 재무 데이터를 하나의 통합 스키마로 정규화하는 설계를 다룬다. 계정 매핑, 통화 변환, 회계 기준 차이, sections 수평화까지 실전 통합 구조를 정리한다.
읽기
dartlab ask — GPT 하나로 전자공시 AI 분석하는 법
dartlab ask는 종목 이름만 말하면 재무제표·사업보고서·감사보고서를 AI가 종합 분석한다. CLI, Python API, 스트리밍, 대화 연속, 보고서 모드까지 설정부터 실전까지.
읽기
dartlab MCP — Claude Desktop에서 전자공시 바로 조회하는 법
dartlab MCP 서버는 60개 도구를 Claude Desktop, Claude Code, Cursor에 노출한다. 재무제표·사업보고서를 IDE 안에서 직접 조회하는 설정부터 실전까지.
읽기
dartlab 재무제표 — 한 줄로 꺼내고 50개 비율까지 자동 계산
dartlab Company 하나면 BS·IS·CF를 Polars DataFrame으로 즉시 꺼내고, 50개 이상 재무비율(ROE, Altman Z-Score, Piotroski F-Score)을 자동 계산한다. 분기별 standalone 시계열 구축부터 섹터 비교까지.
읽기
dartlab 인사이트 — 7영역 등급으로 기업 건강 한눈에 체크
dartlab insights는 실적·수익성·건전성·현금흐름·지배구조·리스크·기회 7영역을 A-F 등급으로 자동 평가한다. 이상치 탐지, 프로파일 분류까지 한 줄로 끝낸다.
읽기
dartlab 스크리닝 — 2700개 종목을 8가지 프리셋으로 걸러내기
dartlab screen()은 8가지 프리셋(가치주·성장주·턴어라운드·현금부자 등)으로 전체 상장사를 필터링하고, benchmark()는 섹터별 P10~P90 비율 분포를 돌려준다.
읽기
dartlab signal — 48개 키워드로 시장 전체 공시 변화를 추적하다
dartlab signal()은 AI·ESG·탄소중립 등 48개 키워드의 연도별 공시 등장 빈도를 추적하고, digest()는 시장 전체 변화를 3줄로 요약한다.
읽기
dartlab network — 상장사 전체 관계망을 코드 한 줄로 시각화하기
dartlab network()는 한국 상장사 전체의 투자·주주·인적 관계를 그래프로 구축하고, 순환출자를 자동 감지한다. 그룹 지도, 에고 네트워크, 동종업계 비교까지.
읽기이 시리즈를 읽고 끝내지 말고 코드로 연결하기
DartLab은 전자공시를 수작업 메모에서 끝내지 않고, 재무 시계열과 공시 문서를 같은 흐름에서 다루도록 설계된 제품입니다.
