Филология в СетиПоисковые системы: заметки и новостиНовости AOLСервисы для поиска по базе запросов AOL16.08.06. Вот уже две недели как шумит в Интернете история с базой пользователей AOL, в конце июля по ошибке или же сознательно выложенной на http://research.aol.com. Напомню, что база эта, объемом чуть больше 2 Gb, содержит информацию о примерно 21 млн поисковых запросов, сделанных 657 тысячами пользователей в период с 1 марта по 31 мая 2006 (каждому пользователю приписан уникальный id, что дает возможность просмотреть его историю поиска). Разумеется, сейчас на http://research.aol.com базы уже не найти (найти можно тут), но за те десять дней, что она там пробыла, ее успели скачать все заинтересованные лица. И не просто скачать, но сделать на основе базы ряд поисковых сервисов. Так, AOLSearchDatabase позволяет вести поиск по id пользователя, словам запроса и — как заявлено — по адресам сайтов, на которые совершались переходы, однако последняя функция у меня работать отказалась (возможно, это временное явление). Из приятных особенностей — возможность сортировки данных в таблице выдачи. Помимо поиска, на AOLSearchDatabase также есть Randomizer, выдающий историю запросов случайного пользователя. Более продвинутый ресурс — AOLSearchLogs. Поиск здесь работает быстрее и, в отличие от AOLSearchDatabase, ищет не точные совпадения слов, а точные совпадения последовательностей символов. Так, на запрос "pushkin" AOLSearchLogs выдает и "pushkin's", и "pushkin1", а AOLSearchDatabase — нет. Помимо поиска (и того же Randomizer'а), на AOLSearchLogs есть оживленный раздел, который посвящен стихийному Data Mining, разысканиям в области aol'овской базы. Основное развлечение там — составление психологических портретов пользователей по их поисковым историям, выдвижение гипотез относительно их занятий, мест проживания и т. д. Для каждого id пользователя в AOLSearchLogs создается свой профиль, куда можно занести подобную гипотетическую историю, скажем: "From that massive list of search terms, for instance, it's possible to guess that AOL user 710794 is an overweight golfer, owner of a 1986 Porsche 944 and 1998 Cadillac SLS, and a fan of the University of Tennessee Volunteers Men's Basketball team". Еще один сайт — AOLPsycho — уже полностью посвящен "психоанализу пользователей AOL и их поисковым историям". AOLPsycho предлагает выбрать поисковую историю случайного пользователя и написать по ее мотивам "психоаналитическую" заметку (или отредактировать чужую). Каждой заметке можно приписать характеризующие ее теги. Сто самых частотных отображаются на главной странице сайта. Конечная цель AOLPsycho амбициозна — описать все 650 тысяч пользователей. Пока что их описано около двухсот, но полку "психоаналитиков" прибывает... Искать в базе на AOLPsycho, в отличие от AOLSearchDatabase и AOLSearchLogs, можно только по id. Как оценить эту новую народную забаву, не знаю. С одной стороны, действительно забавно, с другой — жаль aol и ее пользователей. Поисковик для школьников от AOL11.08.06. AOL открыла новый поисковый сервис (StudyBuddy), ориентированный на школьников. Разумеется, на школьников прежде всего американских. Основная идея сервиса — помощь в выполнении домашних заданий — определила и основные его черты: разбиение поисковой выдачи по школьным предметам и классам. К сожалению, сама выдача поиска на сегодняшний день довольно скудна (в этой связи см. и список источников поисковика), но идея, нельзя не признать, полезна и интересна. Cделали б еще, что ли, поисковик по готовым домашним заданиям. Ей-богу, был бы популярен :) |
© АБ, 2006. |