• ATS Tecnologia

Documentos Invisíveis

Atualizado: 28 de Fev de 2019



O mercado de ECM [Enterprise Content Management] é um dos setores que mais crescem no setor de TI. De acordo com o Gartner em 2017 ele valia US $ 8 bilhões e é definido da seguinte forma:

“O gerenciamento de conteúdo corporativo é usado para criar, armazenar, distribuir, localizar, arquivar e gerenciar conteúdo não estruturado (como documentos, e-mail, relatórios, entre outros os documentos do escritório) e, finalmente, analisar o uso para permitir que as organizações forneçam conteúdo relevante aos usuários onde e quando eles precisarem. ”

Gerenciando o dilúvio de informações

O acesso à informação é fundamental no mundo dos negócios de hoje. As decisões precisam ser tomadas rapidamente em resposta às necessidades de negócios, e as informações precisam estar prontamente disponíveis, precisas e completas. O problema é, no entanto, que há um dilúvio de informações que resulta em muito tempo gasto procurando arquivos em diferentes plataformas e sistemas.

Os sistemas ECM podem melhorar significativamente a eficiência e a produtividade ao gerenciar documentos. Os principais impulsionadores para investir em sistemas de ECM são:

● Melhorar a eficiência

● Otimizar processos de negócios

● Garantir a conformidade

● Reduzir de custos

● Reduzir de risco

● Potencializar a colaboração

● Melhorar o atendimento ao cliente

● Alcançar a vantagem competitiva

● Mitigar horas perdidas procurando documentos perdidos


O calcanhar de Aquiles do ECM

Apesar da indexação, do hardware e software OCR e da tecnologia de pesquisa avançada que muitas empresas têm à sua disposição, nem todos os documentos em um ECM são completa e totalmente pesquisáveis, as empresas investiram pesadamente em sistemas de ECM e em tecnologias de pesquisa ao longo dos anos para armazenar e gerenciar seus documentos.

OCR é um acrónimo para o inglês Optical Character Recognition, é uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem

Os documentos adicionados a um sistema ECM são indexados automaticamente ou manualmente para que haja um banco de dados de palavras ou termos de pesquisa. A ideia é que isso forneça eficiência e acesso completo a cada documento relacionado a uma pesquisa específica. Deve ser simplesmente uma questão de digitar uma série de palavras-chave no campo de consulta de pesquisa para obter todos os documentos que atendem aos critérios de pesquisa. Embora isso seja simples na teoria, não é frequentemente a realidade.


Documentos invisíveis

Pesquisas indicam que até 30% dos documentos em um repositório são invisíveis para a tecnologia de pesquisa. Isso significa que cerca de um terço dos documentos necessários para tomar uma decisão empresarial estão ausentes.

O principal culpado é o documento baseado em imagem. Documentos baseados em imagem são JPGs, TIFs, PNGs e PDFs de imagem. Enquanto muitos desses documentos passam por processamento OCR (Optical Character Recognition) antes de serem perfilados no sistema ECM, muitos não o fazem, e como são arquivos de imagem sem texto, eles não são indexados. Em vez disso, eles se tornam invisíveis à sua tecnologia de indexação e pesquisa.

Nenhum produto de ECM no mercado, por padrão, garantirá que todos os documentos

tenham sido tratados por OCR. Eles assumirão que o usuário executou um processo externo antes de criar o perfil dos documentos no sistema ECM.


E por que esses documentos ignoraram o processo de OCR? Primeiro, eles são indexados em um ECM de várias maneiras:


● Documentos em papel digitalizados e salvos como um PDF TIFF ou de imagem;

● E-mails com anexos PDF TIFF ou baseados em imagem;

● Imagens legadas, PDF ou documentos de e-mail de aquisições de empresas ou arquivos de litígio.


Uma vez que esses documentos são indexados, eles se tornam invisíveis para pesquisa

por não possuirem uma camada de texto.


Não encontrar documentos tem implicações e riscos claros para os negócios:

● Má tomada de decisão com base em informações incorretas;

● Custo de retrabalho para gerar informações;

● Penalidades e multas por não cumprimento;

● Danos à reputação do negócio



OCR - Quando e Onde utilizar

A solução para a busca de arquivos invisíveis é a tecnologia OCR - que converte documentos baseados em imagens em documentos pesquisáveis em texto, permitindo que eles sejam indexados quando inseridos no sistema EMC. Mas quando e onde o processo de OCR deve começar?

Dispositivos multifuncionais, scanners e software OCR são comuns nos dias atuais. A prática padrão para o OCR está no inicio do processo [ponto de entrada], ou seja, documentos impressos e eletrônicos recebem OCR assim que são recebidos pela empresa / escritório. Isso, no entanto, é ineficiente, caro e não confiável.

Pense em como os documentos ignoram o processo de OCR, incluindo documentos recebidos de aquisições e arquivos de litígio importados; documentos salvos no sistema usando captura via tecnologia móvel; e documentos legados importados em massa para esses sistemas.

Em vez de tratar os documentos com OCR no ponto de entrada, faça isso no

end point (ou seja, depois dos documentos forem salvos no sistema de gerenciamento de documentos).

Transferir o processo para o back-end em vez de para o front-end proporcionará enormes benefícios em termos de eficiência, produtividade, capacidade de pesquisa e redução de custos. Mais importante, uma abordagem de back-end para o OCR assegura que 100% dos documentos sejam pesquisados quando forem salvos no ECM, independentemente do ponto de entrada.


O significado de tratar OCR ao final do processo de indexação de documentos:


100% pesquisáveis: Todos os documentos baseados em imagem no ECM são OCR, adicionando uma camada invisível de texto aos documentos. Isso garantirá que o documento contenha conteúdo de texto disponível para indexação pelo sistema. As empresas podem ter certeza de que todos os documentos são completamente pesquisáveis.


Aumento da produtividade organizacional: Os membros da equipe não precisam gastar tempo tratando os documentos com OCR. Em vez disso, eles podem se concentrar em tarefas mais importantes. Ao garantir que todos os documentos sejam automaticamente pesquisáveis por texto, as empresas poderão eliminar as perdas de produtividade e o tempo de inatividade em busca de documentos perdidos ou arquivados incorretamente.


Maior eficiência através da automação: As empresas poderão automatizar todo o processo para que o processamento ocorra 24 horas por dia, sem intervenção do pessoal. Isso também se aplica ao processamento de documentos legados já armazenados.


Redução de Custos: As empresas poderão reduzir os requisitos de hardware e software do OCR.



A eficácia da ECM foi corroída por causa de documentos invisíveis no sistema. 30% dos documentos em um sistema ECM são invisíveis para a tecnologia de pesquisa porque são documentos baseados em imagem, sem texto para pesquisa.

Os administradores de TI foram induzidos a uma falsa sensação de segurança em relação à indexação e à pesquisa de documentos em um sistema ECM.

A mobilidade, a captura de documentos e as soluções alternativas para a equipe, criaram enormes lacunas nos processos e fluxos de trabalho de OCR. Isso tem enormes implicações para as empresas em termos de conformidade e produtividade.


Aplicar o OCR no back-end, em vez de uma abordagem front-end, garantirá que todos os documentos em um repositório de conteúdo são pesquisáveis quando são salvos no sistema, independentemente do ponto de entrada. Um sistema automatizado com total visibilidade e controle sobre documentos baseados em imagens proporcionará aos administradores de TI uma sensação renovada de segurança.


Gostaria de saber mais sobre? ​Entre em contato conosco!

ou acesse: http://www.atstecnologia.com.br/contentcrawler


© 2019 por ATS Tecnologia

Especialista em Tecnologia da Informação

  • LinkedIn - ATS Tecnologia
  • YouTube - ATS Tecnologia
  • Instagram - ATS Tecnologia
  • Twitter - ATS Tecnologia