В Adobe Acrobat Reader реализовано повышение доступности PDF при помощи машинного обучения

Дата:18.12.2020
Источник:Adobe Blog
Twitter Facebook Vkontakte

Корпорация Adobe расширила функциональность своего мобильного приложения Adobe Acrobat Reader, предназначенного для чтения, редактирования и прочего интерактивного взаимодействия с документами в формате PDF. В нём доработан недавно представленный инструмент Liquid Mode, который при помощи машинного обучения адаптирует просматриваемый PDF для более удобной работы на мобильном устройстве. Теперь в рамках Liquid Mode к прочим улучшениям PDF добавлено и автоматическое внедрение тегов, повышающих доступность документа для пользователей с ограниченными возможностями.

В 2020 году Adobe отметили кратный рост спроса на решения для работы с документами. По их оценкам на сегодняшний день в мире существует более 2,5 триллиона PDF-файлов. Вместе с этим, наблюдается тенденция всё более активного использования компактных мобильных устройств, в том числе для выполнения сложных профессиональных задач. Однако потребление контента на мобильных устройствах долгое время было болезненным занятием, особенно если документ длинный и многословный. Так, недавнее исследование Adobe показало, что 65% американцев считают свой опыт чтения документов на мобильном устройстве разочаровывающим; 45% перестали читать документы таким образом или даже не пытались; и 72% говорят, что они бы больше работали на своём мобильном устройстве, если бы на нём было легче читать документы.

Проблема связана с тем, что многие форматы электронных документов сильно привязаны к размеру страницы, поэтому когда размер экрана устройства меньше целевого размера листа, то просмотр файла становиться очень неудобным. Данная проблема в полной мере характерна и для формата PDF, который изначально разрабатывался для представления полиграфической продукции в электронном виде с целью сохранения всех особенностей отображения и размещения на листе для последующей печати. Способности корректного масштабирования, адаптивной вёрстки под разные размеры экрана и возможности интерактивного взаимодействия с документом для выборочного изменения отображения отдельных элементов в PDF изначально не закладывались. В той или иной степени эта функциональность была добавлена в PDF позже, но в большинстве случаев распространяемые документы до сих пор подготавливаются без поддержки этих возможностей.

Осознавая эти проблемы и исследуя пути их решения, корпорация Adobe в сентябре 2020 года представила новый инструмент Liquid Mode, внедрённый в их мобильное приложение для работы с PDF - Adobe Acrobat Reader. Название "жидкий режим" обозначает как бы текучесть и адаптивность документа под любые формы и размеры экрана.

Liquid Mode базируется на Adobe Sensei - технологии Adobe в области машинного обучения. Это принципиально новый режим отображения PDF, который анализирует содержимое файла, автоматически улучшая его оформление и добавляя функции прямо в процессе чтения. В результате, документ, ориентированный на определённый формат страницы, может быть легко просмотрен на экране меньшего размера. В частности, при помощи машинного обучения Liquid Mode может обеспечить даже для неподготовленного документа следующие возможности:

  • Перекомпонуемая структура документа, которая имитирует HTML-страницы в Интернете.
  • Увеличение масштаба изображений касанием.
  • Связанный просмотр структуры.
  • Сворачиваемые разделы содержимого (виджеты-гармошки).
  • И многое другое, так как функциональность непрерывно расширяется и улучшается за счёт обучения алгоритмов обработки.

Всё это позволяет обеспечить соответствие критериям успеха в отношении размера текста и интервала между строками из стандарта WCAG 2.1.

В декабре же 2020 года Liquid Mode в Adobe Acrobat Reader получил существенное обновление, связанное с обеспечением доступности просматриваемых PDF. Теперь алгоритмы на базе машинного обучения, помимо прочего, анализируют документ и распознают в нём различные структурные элементы, такие как заголовки, списки и абзацы, после чего добавляют соответствующие теги. В результате, даже плохо размеченный документ, не соответствующий стандарту доступности PDF/UA (ISO 14289), получает соответствующую разметку, которая сильно упрощает взаимодействие с контентом, в том числе пользователям программ экранного доступа.

Разумеется, слой доступности, добавляемый в PDF при помощи Liquid Mode далеко не всегда оказывается идеальным. Кроме того, ещё не все типы документов можно преобразовать, например, это касается интерактивных форм, а также нельзя сгенерировать альтернативный текст для изображений. Однако Liquid Mode уже сейчас вполне способен в большом числе случаев реально повысить доступность и удобство работы с документом, подготовленным без учёта стандарта PDF/UA, да и Adobe заявляет о намеренье развивать эту функциональность в том числе и в направлении совершенствования специальных возможностей.

Пока функциональность Liquid Mode реализована только в приложении Adobe Acrobat Reader для iOS/iPadOS и Android, включая устройства под управлением Chrome OS, поддерживающие запуск Android-приложений. Однако в будущем планируется внедрить этот режим просмотра PDF в приложения для персональных компьютеров и в их браузерные версии.

Также с сожалением приходится отметить отсутствие в Liquid Mode поддержки русского языка. Пока он доступен только на английском, испанском, французском, немецком, нидерландском, датском, финском, итальянском, норвежском, португальском, шведском, румынском и каталанском языках.

Ссылки:




Распространение материалов сайта означает, что распространитель принял условия лицензионного соглашения.
Идея и реализация: © Владимир Довыденков и Анатолий Камынин,  2004-2021