MISPRINT - ОПЕЧАТКА
Главная arrow Блог arrow Как это работает?  
19.12.2017
Главная
Новости
Статьи
Программы
Pythoneer's Area
Experimental Vault
Humor
Блог
Чтиво
GuestBook
Advertisement
Как это работает?
 
Why? или История создания

Я сам активный пользователь Интернета, и как любой другой часто что-то ищу в Google. Так как я до сих пор не овладел техникой "слепой печати", примерно 2% из моих поисковых запросов я в спешке вводил не в той раскладке, в которой хотел. Конечно же, результаты поиска по таким запросам отсутствовали напрочь, и мне приходилось корректировать запрос, что иногда было затруднительно, так как запрос состоял из нескольких, часто разноязычных русских и английских слов.

Так как я не считаю себя уникальным и неповторимым, я понял, что многие люди ежечасно делают точно такие же ошибки. Тогда-то и появилась мысль реализовать данный сервис. Работа над алгоритмом заняла около двух месяцев (Python-версия). На трансляцию кода в PHP и создание веб-сайта ушло еще примерно столько-же.

How It Works? или Как это работает

Алгоритм расшифровки неправильно набранного текста (CODENAME: Дикая Собака Динго) основывался на стандартном вобщем-то методе проверки невстречаемых символов для той или иной раскладки клавиатуры. Так, в английской раскладке не может быть слов, содержащих в себе символы типа запятой, точки и прочее. Таким образом, изначальное слово в запросе "j,kbxbt" следует расшифровать в  русское  слово "обличие".
Затем алгоритм был дополнен проверками на группы символов, так например в русском языке в слове не может встречаться больше пяти согласных символов подряд, к тому же возможные группы из 5ти согластных строго детерминированы (как сочетание нтльм в слове джентльмен, льксв в фольксваген или рдств в усердствовать и тому подобное)
Важной особенностью алгоритма является возможность корректного перекодирования нескольких слов запроса подряд, набитых в разных, подчас правильных раскладках. К примеру, далеко не каждый автоперекодировщик сможет корректно расшифровать такого рода запросы: "jkmifz фраза в cvtifyyjq раскладке" или "pfdnhf будет yjdsq день". Наш алгоритм с этим успешно справляется. 

В данный момент поддерживаются следующие системы поиска:

  • Google во всех его ипостасях
  • Yandex со всеми дочками и сыночками
  • Rambler, но пока как-то багово
  • Alexa и Nigma (кто вообще там что-то ищет?)


Потестировать работу алгоритма Вы можете по ссылке CODENAME Дикая Собака Динго
Буду рад Вашим комментариям!

 


Добавить в любимые (202) | Сформировать ссылку на статью | Просмотров: 21026

Ваш коментарий будет первым

Добавить коментарий
  • Пожалуйста оставляйте коментарии только по теме.
Имя:
E-mail
Коментарий:



Код:* Code

Powered by AkoComment Tweaked Special Edition v.1.4.6
AkoComment © Copyright 2004 by Arthur Konze - www.mamboportal.com
All right reserved

 
Advertisement
Advertisement