Онлайн-архив газеты Советская Печенга

Материал из Никипедии
Перейти к: навигация, поиск

Предпринимаются попытки создать архив газеты Советская Печенга, по которому возможен текстовый поиск.

За основу взяты изображения отсканированных полос газеты. Объёмная работа по сканированию архивных номеров Советской Печенги была проведена несколько лет назад сотрудниками библиотеки. Всего, начиная с 1946 года, вышло почти 10000 номеров газет Советской Печенги и Печенги.

В новом проекте эти изображения проходят процесс распознавания текста (OCR), после чего генерируется pdf файл, в котором одновременно присутствует как изначальная картинка, так и распознанный текст. В итоге получается pdf-файл, который содержит в себе целый номер с 2, 4, 8 полосами, по которому также можно проводить поиск текста. С учётом того, что поисковые системы сейчас индексируют и файлы в pdf формате, станет возможным поиск статей в старых номерах Печенги по ключевым словам, например по определённой фамилии.

Проект осуществляется никельскими программистами.