Яндекс научил нейросети расшифровывать архивные записи

Создаем сайты, которые клиенты не забудут!

Яндекс научил нейросети расшифровывать архивные записи со сложной дореволюционной орфографией. Попробовать технологию в действии можно уже сейчас в сервисе «Поиск по архивам»: он открывает всем желающим доступ к более чем 2,5 миллионам страниц исторических документов с текстовой расшифровкой. Новый алгоритм, построенный на основе системы оптического распознавания символов, учитывает особенности почерка, узнает утратившие актуальность буквы и понимает особую структуру архивных документов.

Специалисты компании обучили нейросеть на массиве данных из сотен тысяч рукописных строк из реальных текстов XVIII–XIX веков и десятков миллионов сгенерированных примеров. Материалы для обучения размечали и расшифровывали эксперты, они же контролировали качество распознавания. Рукописи, которые неподготовленному человеку сложно разобрать, технология Яндекса почти мгновенно превращает в печатный текст. Благодаря этому в базе сервиса можно быстро находить документы с упоминанием фамилии, населенного пункта или любых других слов.

Елена Бубнова, руководитель Поиска Яндекса:

Увеличьте прибыль через SEO: больше посетителей, больше заказов!

«Для расшифровки одной страницы архивного рукописного текста профессионалу может потребоваться до получаса времени. Наш сервис справляется с этим за несколько секунд. В перспективе технологию можно использовать и для решения других задач в продуктах Яндекса».

«Поиск по архивам» повысит эффективность работы историков, социологов, демографов, генеалогов и поможет тем, кто ищет сведения о своей семье. Первым представленным в сервисе фондом стал Главархив Москвы — именно на его материалах разработчики обучали нейросеть. Теперь база пополнилась документами из архивов Оренбургской и Новгородской областей. Со временем количество хранилищ и доступных отсканированных файлов будет увеличиваться.

Искать можно по материалам XVIII — начала XX веков, которые больше всего пользуются популярностью у пользователей. Это метрические книги, исповедные ведомости и ревизские сказки с результатами переписи населения. Документы можно найти по каталогу или через строку поиска. Есть фильтры по годам, архивам, фондам и описям. Рядом со сканом каждой страницы отображается построчная расшифровка, сделанная нейросетями Яндекса. Если навести курсор на нужный фрагмент, он сразу подсветится и на цифровой копии.

  30% клиентов СберМаркета используют межретейлерный поиск

Разработка сайтов профессионально означает создание веб-ресурсов с соблюдением высоких стандартов качества, эффективности и современных технологий. Такой подход подразумевает использование передовых методик и инструментов, а также учет специфических потребностей бизнеса и целевой аудитории.

Профессиональная разработка включает использование актуальных технологий и фреймворков, таких как HTML5, CSS3, JavaScript, PHP, Python и других. Это обеспечивает безопасность, скорость и стабильность работы сайта.

Профессиональная разработка сайтов включает базовую SEO-оптимизацию, что позволяет улучшить видимость сайта в поисковых системах. Это может включать правильное использование ключевых слов, оптимизацию метатегов и структуры сайта.

Разработка сайтов профессионально — это комплексный и ответственный процесс, который требует участия высококвалифицированных специалистов и использования современных технологий. Это позволяет создать качественный продукт, который соответствует требованиям бизнеса и предоставляет положительный опыт для пользователей.

Добавить комментарий