Google сделает Chrome удобным для слепых

Нарушения зрения — ещё не повод отказываться от работы за компьютером. Во-первых, так можно быть наверняка уверенным, что глаза вы уже не испортите. А, во-вторых, вспомогательные инструменты, встроенные в современные операционные системы, позволят без особого труда сориентироваться в незнакомых приложениях. Но если озвучивание названий элементов интерфейса и текста, в общем-то, — вполне обыденная функция и для мобильных, и для настольных устройств, то как быть с описаниями медиафайлов, встречающимися в интернете, не знал почти никто. Но Google нашла, как решить эту проблему.

Google работает над интеграцией в Chrome поддержки машинного обучения для формирования описаний элементов, которые могут встретиться пользователю. Начать было решено с изображений и фотографий, составляющих значимую часть всего интернет-контента. Но поскольку на них обычно изображается не какой-то конкретный объект, а присутствует ещё и фон, который имеет значение для точного восприятия, обойтись технологией Google Lens, определяющей названия объектов реального мира, было нельзя.

Судя по тому, что Chrome умеет уже сейчас, распознавание происходит довольно точно, хоть и не мгновенно. Например, эту фотографию браузер описал как “Фрукты или овощи на прилавке”.

Понятное дело, что овощей на снимке нет, а кокосы чисто технически всё-таки являются орехами, но, во-первых, алгоритмы оставили себе место для манёвра, использовав союз “или”, а, во-вторых, поняли, что перед ними именно рыночный прилавок, что довольно здорово, хотя под фруктами его практически не видно.

Читайте также: Чёрный экран в Google Chrome? Как исправить

Не ошибся Chrome и здесь. Браузер без труда понял не только то, что перед ним колесо обозрения, но и определил время суток — ночь.

Пожалуй, было бы не лишним уточнить, что колёс на самом деле два, а место действия является парк, но не будем придираться. В конце концов, пока это тестовая версия технологии, которая в дальнейшем будем только совершенствоваться, обучая саму себя.

Поскольку за определение отвечают нейронные сети, встроить их в Chrome в буквальном смысле было бы проблематично, если не сказать, невозможно. Поэтому разработчики решили проблему встраиванием механизма, который, определив присутствие на экране изображения, отправляет запрос на сервера Google, которые формируют его описание, а затем отправляют его браузеру. Отсюда и задержка в несколько секунд, которая может увеличиваться в зависимости от скорости подключения к интернету, а также от сложности самого изображения. При этом гарантий того, что распознавание вообще произойдёт, нет, поскольку алгоритмы пока могут формулировать описание только нескольких миллионов комбинаций.

Подпишись на наш чат в Telegram. Только там ты сможешь пообщаться с единомышленниками в уютной обстановке.

Источник

Следующая новость
Предыдущая новость

Huawei готовит к выпуску смартфон с выдвижной камерой Вы можете получать эмоции Доля Firefox на рынке десктопных браузеров продолжает сокращаться" Глава Ubisoft считает, что следующее поколение консолей станет последним" Western Digital анонсировала первые поставки клиентских SSD

Последние новости