Insight
O que mudou no PDF pesquisavel
Antes, o PDF pesquisavel podia parecer apenas um arquivo com texto escondido anexado sobre a pagina. Isso ajudava na busca, mas nao explicava bem onde o OCR realmente encaixava dentro da imagem original.
Agora o fluxo trata cada regiao em imagem como uma area de layout. O OCR estruturado gera blocos formatados e o export tenta reencaixar esse texto dentro do mesmo espaco visual, mantendo o documento mais proximo do PDF original.
Insight
Como `PDF reorganizado` ficou diferente
O objetivo do PDF reorganizado continua sendo leitura melhor, mas ele deixa de ser um simples texto corrido. Em vez disso, passa a preservar agrupamentos por pagina e regiao, reconstruindo blocos com mais contexto visual.
Na pratica, isso significa que o arquivo continua mais limpo do que o original, mas sem perder tanto a nocao de onde cada bloco fazia parte do layout do PDF base.
Insight
Por que PDF continua no modo Texto formatado
PDF exige muito mais do que extrair texto puro. Mesmo quando ha texto nativo, o produto ainda precisa decidir quais paginas usar direto, quais regioes enviar para OCR e como devolver isso em um formato utilizavel depois.
Por isso PDFs ficam restritos a `Texto formatado`. `OCR simples` continua reservado para imagens, onde a proposta e velocidade e texto bruto, sem reconstruir estrutura e layout.
- OCR simples: imagens apenas.
- Texto formatado: imagens e PDF.
- PDF pesquisavel e PDF reorganizado saem do fluxo PDF formatado.
Insight
O que corrigimos nos limites para usuarios logados
Outra mudanca importante foi na experiencia de conta. O workspace e os componentes de conta agora voltam a buscar os limites depois de um OCR bem-sucedido, reduzindo a chance de mostrar creditos antigos na tela apos o consumo real ter mudado.
Isso vale especialmente para quem testa repetidamente OCR em imagem e PDF no mesmo dia e precisa confiar nos contadores para entender quanto ainda resta no plano atual.
