Артур Скальский

© Би-Би-Си

ИнтернетМир

2782

19.08.2008, 15:04

Программы против спама помогут "отцифровать" книги

Компьютерные программы, защищающие от спама, сделали возможным с большей точностью перевести в электронную форму старинные книги и другие письменные источники.

Получить доступ ко многим сайтам можно лишь зарегистрировавшись на них, предварительно напечатав в специальном окошке набор символов, представленных в виде причудливой картинки. Владельцы интернет-ресурсов идут на это для противодействия натиску спам-сообщений.

Сейчас многие сайты вместо невнятной абракадабры используют для этих целей тексты из старинных письменных источников, которые были отсканированы и но не распознаны.

Куски текста, которые программы распознавания текста не осилили, как раз и предлагается расшифровать интернет-пользователям.

С учетом того, что около 100 млн. пользователей в день доказывают таким образом, что они не роботы, получается довольно внушительная армия потенциальных дешифровальщиков.

Объем нечитаемых слов в некоторых старинных документах может доходить до 20% из-за пожелтевшей бумаги или выцветших чернил.

Предельная точность

Специалисты из американского университета Карнеги-Меллон разработали систему под названием Recaptcha, которая собирает фрагменты сканированного текста, не поддавшиеся компьютерной программе, и затем рассылает их сайтам, которые подписаны на эту услугу.

Вместе с буквами, которые компьютер не узнал после сканирования, высылается и слово, уже внесенное в систему. Правильно распознав второе слово, пользователь получает доступ к сайту, а расшифровка первого слова дополняет базу данных, после того, как будет получено несколько подтверждающих ответов.

В материале, опубликованном в журнале Science, говорится, что такой подход позволяет добиться почти стопроцентной точности, что превосходит требования архивариусов.

В настоящее время около 40 тыс. сайтов предлагают своим пользователям решить такие простенькие задачки, и получают в день около 4 млн. ответов.

В прошлом году таким образом удалось расшифровать 440 млн. слов и перевести в цифровую форму весь архив газеты New York Times с 1908 года.

Артур Скальский

© Би-Би-Си

ИнтернетМир

2782

19.08.2008, 15:04

URL: https://babr24.news/?ADE=47073

Bytes: 2046 / 2039

Версия для печати

Скачать PDF

Поделиться в соцсетях:

Также читайте эксклюзивную информацию в соцсетях:
- Телеграм
- ВКонтакте

Связаться с редакцией Бабра:
[email protected]

Последние новости

03.10 08:20
Томская область на один пункт поднялась в национальном экологическом рейтинге

03.10 06:13
В Новосибирске назначили врио главы Ленинского района

03.10 05:18
В Новосибирске на Оби разлили масло

02.10 21:14
В Новосибирской области под домашний арест отправили замглавы округа по делу об обрушении школы

02.10 21:03
В Новосибирске трем мужчинам назначили срок в колонии за незаконный оборот табачных изделий

02.10 20:54
В Новосибирской области после проверки прокуратуры обновили тротуары

02.10 20:30
В Новосибирске мужчине назначили семь лет за покушение на сбыт наркотиков

02.10 20:22
В Новосибирске на бывшего замначальника Управления капитального строительства наложили запрет определенных действий

02.10 18:54
Фирма из Красноярска заплатила чиновнику за победу в аукционе и отделалась штрафом

02.10 18:16
В Бурятии ликвидировали нелегальную свалку на площади свыше пяти тысяч «квадратов»

Лица Сибири

Липунова Елена

Головных Иван

Лапшин Юрий

Трутнев Юрий

Хамаганов Михаил

Бубякин Александр

Ковалевский Валерий

Яковлев Владимир

Носовко Валерий

Букрей Юлия