Data

Skill OS 흡수 규칙

1. 자동 파이프라인 — 핵심 데이터 워크플로우로 간다 기준을 확인한다.
수집 경로 (가벼움 vs 무거움) 기준을 확인한다.
1. Flow 1 — DART 수집 (dataSync.yml) 을 12h 주기로 돌린다 기준을 확인한다.
2-1. Flow 1B — KindList 신규 종목은 별도 bootstrap 으로 보장한다 기준을 확인한다.
1. Flow 2 — DART scan 프리빌드 (dataPrebuild.yml) 은 workflow_run 으로 이어진다 기준을 확인한다.
단일 책임: DART 수집(dataSync) · DART 프리빌드(dataPrebuild) · EDGAR 전체(edgarSync) · 감사(dataAudit) 독립.
직렬화: 모든 HF 업로드는 concurrency.group: hf-dataset-push 로 순차 처리 (sliding-window 429 회피).
workflow_run 체인: KindList 완료 → 신규 종목 bootstrap, DART 수집 완료 → 자동 프리빌드 트리거 (EDGAR 는 edgarSync 내부 end-to-end).
backup: dataSync.yml workflow_dispatch mode=full 로 88 분기 차집합 수동 실행.

Company, gather, scan이 사용할 원자료 위치와 freshness를 확인한다. 분석 결론보다 source table과 latestAsOf를 먼저 만든다.
실행 전에 target, period/date, metric, source 또는 universe를 확인한다.
데이터가 없거나 runtime 제한이 있으면 값을 추정하지 않고 한계와 필요한 다음 수집 경로를 말한다.

dataset/table ref 또는 DataFrame을 반환한다. 핵심 컬럼은 provider, dataset, entity, period/date, metric, value, latestAsOf다.
전체 세부 필드는 공개 docstring/capability와 동기화한다. 코드/API 변경으로 이 설명이 오래되면 skill 갱신 누락으로 본다.

환경	상태	비고 / 제한
Local Python	supported	—
Server	supported	—
MCP	supported	—
Web AI	supported	—
Pyodide	limited	실제 실행 가능 여부는 연결된 capability와 데이터 snapshot 범위를 따른다.

환경

상태

비고 / 제한

Local Python

supported

—

Server

supported

—

MCP

supported

—

Web AI

supported

—

Pyodide

limited