Филология в Сети

Поисковые системы: заметки и новости

Август 2006

К другим новостям | Филологический поиск

Сервисы для поиска по базе запросов AOL

16.08.06. Вот уже две недели как шумит в Интернете история с базой пользователей AOL, в конце июля по ошибке или же сознательно выложенной на http://research.aol.com. Напомню, что база эта, объемом чуть больше 2 Gb, содержит информацию о примерно 21 млн поисковых запросов, сделанных 657 тысячами пользователей в период с 1 марта по 31 мая 2006 (каждому пользователю приписан уникальный id, что дает возможность просмотреть его историю поиска).

Разумеется, сейчас на http://research.aol.com базы уже не найти (найти можно тут), но за те десять дней, что она там пробыла, ее успели скачать все заинтересованные лица. И не просто скачать, но сделать на основе базы ряд поисковых сервисов.

Так, AOLSearchDatabase позволяет вести поиск по id пользователя, словам запроса и — как заявлено — по адресам сайтов, на которые совершались переходы, однако последняя функция у меня работать отказалась (возможно, это временное явление). Из приятных особенностей — возможность сортировки данных в таблице выдачи. Помимо поиска, на AOLSearchDatabase также есть Randomizer, выдающий историю запросов случайного пользователя.

Более продвинутый ресурс — AOLSearchLogs. Поиск здесь работает быстрее и, в отличие от AOLSearchDatabase, ищет не точные совпадения слов, а точные совпадения последовательностей символов. Так, на запрос "pushkin" AOLSearchLogs выдает и "pushkin's", и "pushkin1", а AOLSearchDatabase — нет. Помимо поиска (и того же Randomizer'а), на AOLSearchLogs есть оживленный раздел, который посвящен стихийному Data Mining, разысканиям в области aol'овской базы. Основное развлечение там — составление психологических портретов пользователей по их поисковым историям, выдвижение гипотез относительно их занятий, мест проживания и т. д. Для каждого id пользователя в AOLSearchLogs создается свой профиль, куда можно занести подобную гипотетическую историю, скажем: "From that massive list of search terms, for instance, it's possible to guess that AOL user 710794 is an overweight golfer, owner of a 1986 Porsche 944 and 1998 Cadillac SLS, and a fan of the University of Tennessee Volunteers Men's Basketball team".

Еще один сайт — AOLPsycho — уже полностью посвящен "психоанализу пользователей AOL и их поисковым историям". AOLPsycho предлагает выбрать поисковую историю случайного пользователя и написать по ее мотивам "психоаналитическую" заметку (или отредактировать чужую). Каждой заметке можно приписать характеризующие ее теги. Сто самых частотных отображаются на главной странице сайта. Конечная цель AOLPsycho амбициозна — описать все 650 тысяч пользователей. Пока что их описано около двухсот, но полку "психоаналитиков" прибывает... Искать в базе на AOLPsycho, в отличие от AOLSearchDatabase и AOLSearchLogs, можно только по id.

Как оценить эту новую народную забаву, не знаю. С одной стороны, действительно забавно, с другой — жаль aol и ее пользователей.

Филология в Сети

Поисковые системы: заметки и новости

Август 2006

Сервисы для поиска по базе запросов AOL

Поисковик по резюме и вакансиям на JobsMarket

Лучшие поисковики по версии Time

Quintura Search получила одобрениеДоктора Файл Файндера

Благотворительные поисковики

Автофокус: приятная мелочь

Феномен детских поисковиков

Изменения в интерфейсе Google.com

Google Book Search заключил партнерствос Калифорнийским университетом

Обновление Yahoo Site Explorer

Ян Педерсен (Yahoo) о SIGIR 2006

Гуглократии — нет

Поисковик для школьников от AOL

Microsoft изучает поведение пользователей

Yahoo Search Builder

Уровень доверия "Вебальты"

Наверх: новые функции

Открываем ленту новостей

Quintura Search получила одобрение
Доктора Файл Файндера

Google Book Search заключил партнерство
с Калифорнийским университетом