La startup française Mistral AI a récemment dévoilé une nouvelle API de reconnaissance optique de caractères (OCR), baptisée Mistral OCR, qui ambitionne de redéfinir les standards mondiaux en matière de compréhension documentaire.
Des capacités avancées pour une compréhension documentaire approfondie
Mistral OCR se distingue par sa capacité à extraire avec une grande précision divers contenus issus de documents non structurés, tels que des notes manuscrites, du texte tapé, des images, des tableaux et des équations.
Ces éléments sont ensuite présentés sous une forme structurée, facilitant leur analyse et leur utilisation ultérieure.
Support multilingue et intégration aux grands modèles de langage
L’API offre un support multilingue, permettant aux organisations de traiter des documents dans diverses langues avec une efficacité accrue.
De plus, elle s’intègre aux grands modèles de langage (LLM) pour une compréhension contextuelle approfondie des documents, rendant les informations plus accessibles et exploitables.
Un atout majeur pour la gestion des données non structurées
Selon Mistral AI, environ 90 % des informations commerciales sont non structurées, englobant des éléments tels que des e-mails, des publications sur les réseaux sociaux, des vidéos, des images et des fichiers audio.
Mistral OCR vise à aider les organisations à numériser et cataloguer ces données, les rendant prêtes pour des applications d’intelligence artificielle ou des bases de connaissances internes et externes.
Une avancée notable dans le domaine de l’OCR
Contrairement aux solutions OCR traditionnelles centrées principalement sur l’extraction de texte, Mistral OCR est conçue pour interpréter divers éléments typographiques et caractères des documents, y compris les tableaux, les expressions mathématiques et les images imbriquées, tout en maintenant des sorties structurées.
Cette technologie représente une avancée significative vers une compréhension documentaire complète, selon Guillaume Lample, directeur scientifique de Mistral AI.
En lançant cette API, Mistral AI continue de renforcer sa position en tant que leader européen de l’intelligence artificielle, offrant des solutions innovantes pour répondre aux besoins complexes des entreprises en matière de gestion de l’information.