Categories: Інтернет

Amazon запускає хмарний сервіс для розпізнавання документів

Share
Час читання: 2 хв.

Вам потрібно швидко і автоматично витягти інформацію з безлічі документів? А вони, до того ж, зберігаються у вигляді сканів або фотографій? Вам пощастило, якщо ви є клієнтом Amazon Web Services (AWS). Amazon оголосила про відкриття доступу до Textract, хмарного і повністю керованого сервісу, який використовує машинне навчання для аналізу таблиць, текстових форм і цілих сторінок тексту в популярних електронних форматах. Поки що він буде доступний лише в деяких регіонах AWS, зокрема у східній частині США (Огайо і Північна Вірджинія), на заході США в штаті Орегон) і ЄС (Ірландія), а в наступному році Textract стане доступний для всіх бажаючих.
Textract — новий сервіс від AWS, який дозволить клієнтам Amazon ефективно розпізнавати і систематизувати колекції документів.

Як стверджує Amazon, Textract значно ефективніший, ніж звичайні оптичні системи розпізнавання символів. З файлів, що зберігаються в кошику Amazon S3, він може витягти вміст полів та таблиць з урахуванням контексту, в якому представлена ця інформація, наприклад, система автоматично виділяє імена та номери соціального страхування у податкових формах або підсумкові суми по сфотографованим квитанціям. Як зазначає Amazon в прес-релізі, Textract підтримує такі формати зображень, як скани, PDF-файли і фотографії, а також ефективно працює з контекстом у документах специфічних для фінансових послуг, страхування та охорони здоров’я.

Textract зберігає результати в форматі JSON, забезпеченого анотаціями з номерами сторінок, розділів, мітками форм і типів даних, і при бажанні інтегрується з сервісами баз даних і аналітики, такими як Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena, та продуктами для машинного навчання, такими як Amazon Comprehend, Amazon Comprehend Medical, Amazon Translate і Amazon SageMaker, для постобробки. В якості альтернативи отримані дані можуть бути передані безпосередньо в сторонні хмарні сервіси для цілей забезпечення відповідності в бухгалтерському обліку та аудиті або для підтримки інтелектуального пошуку в архівах документів. Як стверджує Amazon, Textract може “точно” обробити мільйони сторінок різних документів за «всього кілька годин».

Безліч клієнтів AWS вже використовують Textract, включаючи Globe and Mail, національну метеорологічну службу Великобританії, PricewaterhouseCoopers, некомерційну організацію керованої медичної допомоги Healthfirst і компанії по автоматизації роботизованих процесів UiPath, Ripcord і Blue Prism. Candor, стартап, метою якого є привнести прозорість в іпотечну галузь, використовує Textract, щоб витягувати дані з таких документів, як банківські виписки, платіжні квитанції і різні податкові документи, щоб прискорити процес схвалення кредиту для своїх клієнтів.

«Міць Amazon Textract полягає в тому, що він точно отримує текстові і структуровані дані практично з будь-якого документа без необхідності попереднього машинного навчання», — розповідає віце-президент Amazon Machine Learning Свамі Сивасубраманян (Swami Sivasubramanian). «На додаток до інтеграції з іншими сервісами AWS, велика спільнота, що розвивається навколо Amazon Textract, дозволяє нашим клієнтам отримувати реальну користь від своїх колекцій файлів, працювати більш ефективно, покращувати відповідність вимогам безпеки, автоматизувати введення даних і прискорювати прийняття бізнес-рішень».

Тетюшев Данило

Люблю Apple, розповідаю про гаджети, кіно і корисні речі зі світу IT.

Опублікував
Тетюшев Данило
Tags: Amazonукр
  • Останні записи

    Штучний інтелект Google Gemini вийшов на iPhone

    Google випустила безкоштовний застосунок чат-бота Gemini для користувачів iPhone - тепер його можна завантажити в…

    15.11.2024

    Наскільки безпечно спати зі смартфоном під подушкою

    Чесно кажучи, я теж час від часу беру телефон у ліжко, хоча знаю, що це…

    15.11.2024

    Компанія 01.ai анонсувала інноваційну ШІ-модель Yi-Lightning

    Компанія 01.ai представила нову модель ШІ Yi-Lightning, схожу з GPT-4. Для навчання моделі використовувалося 2000…

    15.11.2024

    Вийшов безкоштовний ChatGPT для Windows

    Стартап OpenAI офіційно оголосив про вихід загальнодоступної версії застосунку ChatGPT для користувачів ПК під управлінням…

    15.11.2024

    Дизайн Samsung Galaxy A26 показали на якісних рендерах

    Надійний інсайдер під ніком OnLeaks опублікував серію деталізованих зображень ще не анонсованого смартфона. Крім того,…

    15.11.2024

    iOS 18.1 змушує iPhone перезавантажуватися після трьох днів бездіяльності

    Коли вийшла iOS 18, Apple додала дуже цікаву фішку. Тепер iPhone автоматично перезавантажується кожні три…

    15.11.2024