docling-pdf-extraction

name: docling-pdf-extraction description: "Extracao avancada de documentos via Docling (IBM Research)" user-invocable: true license: MIT compatibility: OpenCode, Claude Code, Cursor, Gemini CLI metadata: author: OpenCode Ecosystem version: "2.0.0" openclaw: emoji: "📄" homepage: https://github.com/anomalyco/opencode

allowed-tools: Read Edit Write Glob Grep Bash Pdf Docling

Visao Geral

Skill que utiliza Docling (IBM Research, LF AI and Data) para extracao avancada de documentos. Substitui o pipeline PDF legacy do ecossistema com capacidades superiores de entendimento de documento.

Quando Usar

Converter PDFs com extracao de layout e reading order
Extrair estrutura de tabelas de documentos
Processar PDFs escaneados via OCR nativo
Converter multi-formatos (DOCX, PPTX, XLSX, HTML, imagens)
Gerar skills automaticas a partir de conteudo extraido
Alimentar evolution loop com conhecimento rico

Formatos Suportados

PDF (com layout understanding via Heron model)
DOCX, PPTX, XLSX (Office documents)
HTML
Imagens: PNG, TIFF, JPEG

Outputs

Markdown (com estrutura preservada)
HTML
DocTag (formato Docling)
JSON estruturado (DoclingDocument schema)

Integracao com Ecossistema

Evolution Loop (fase INTEGRATE)
Context Offload (armazenamento de conhecimento)
Skill Generator (geracao automatica de skills)
Manus Evolve Bridge (feedback loop)

Uso via Python

from docling_adapter import DoclingAdapter, DoclingSkillGenerator adapter = DoclingAdapter(enable_ocr=True, enable_tables=True) extraction = adapter.extract_knowledge(documento.pdf) generator = DoclingSkillGenerator() skill_path = generator.generate_from_extraction(extraction, documento.pdf)

Arquitetura

DETECT: Detectar formato do documento
CONVERT: Docling converte com layout understanding
EXTRACT: Extrair topics, findings, citations, tables
INDEX: Indexar para evolution loop
OFFLOAD: Armazenar no context offload
GENERATE: Criar skills automaticas

Vantagens vs Pipeline Legacy

Layout understanding com modelo Heron
Extracao de estrutura de tabelas
OCR nativo (RapidOCR)
Multi-formato (nao apenas PDF)
DoclingDocument schema unificado