Филология в СетиПоисковые системы: заметки и новостиСпециализированные поисковикиСервисы для поиска по базе запросов AOL16.08.06. Вот уже две недели как шумит в Интернете история с базой пользователей AOL, в конце июля по ошибке или же сознательно выложенной на http://research.aol.com. Напомню, что база эта, объемом чуть больше 2 Gb, содержит информацию о примерно 21 млн поисковых запросов, сделанных 657 тысячами пользователей в период с 1 марта по 31 мая 2006 (каждому пользователю приписан уникальный id, что дает возможность просмотреть его историю поиска). Разумеется, сейчас на http://research.aol.com базы уже не найти (найти можно тут), но за те десять дней, что она там пробыла, ее успели скачать все заинтересованные лица. И не просто скачать, но сделать на основе базы ряд поисковых сервисов. Так, AOLSearchDatabase позволяет вести поиск по id пользователя, словам запроса и — как заявлено — по адресам сайтов, на которые совершались переходы, однако последняя функция у меня работать отказалась (возможно, это временное явление). Из приятных особенностей — возможность сортировки данных в таблице выдачи. Помимо поиска, на AOLSearchDatabase также есть Randomizer, выдающий историю запросов случайного пользователя. Более продвинутый ресурс — AOLSearchLogs. Поиск здесь работает быстрее и, в отличие от AOLSearchDatabase, ищет не точные совпадения слов, а точные совпадения последовательностей символов. Так, на запрос "pushkin" AOLSearchLogs выдает и "pushkin's", и "pushkin1", а AOLSearchDatabase — нет. Помимо поиска (и того же Randomizer'а), на AOLSearchLogs есть оживленный раздел, который посвящен стихийному Data Mining, разысканиям в области aol'овской базы. Основное развлечение там — составление психологических портретов пользователей по их поисковым историям, выдвижение гипотез относительно их занятий, мест проживания и т. д. Для каждого id пользователя в AOLSearchLogs создается свой профиль, куда можно занести подобную гипотетическую историю, скажем: "From that massive list of search terms, for instance, it's possible to guess that AOL user 710794 is an overweight golfer, owner of a 1986 Porsche 944 and 1998 Cadillac SLS, and a fan of the University of Tennessee Volunteers Men's Basketball team". Еще один сайт — AOLPsycho — уже полностью посвящен "психоанализу пользователей AOL и их поисковым историям". AOLPsycho предлагает выбрать поисковую историю случайного пользователя и написать по ее мотивам "психоаналитическую" заметку (или отредактировать чужую). Каждой заметке можно приписать характеризующие ее теги. Сто самых частотных отображаются на главной странице сайта. Конечная цель AOLPsycho амбициозна — описать все 650 тысяч пользователей. Пока что их описано около двухсот, но полку "психоаналитиков" прибывает... Искать в базе на AOLPsycho, в отличие от AOLSearchDatabase и AOLSearchLogs, можно только по id. Как оценить эту новую народную забаву, не знаю. С одной стороны, действительно забавно, с другой — жаль aol и ее пользователей. Поисковик по резюме и вакансиям на JobsMarket15.08.06. Сегодня электронный рынок труда JobsMarket (открылся 1-го августа 2006), позиционирующий себя как проект WEB 2.0, запустил специализированный поисковый сервис — "Поиск резюме и вакансий Рунета" (бесплатен для зарегистрированных пользователей). На данный момент поиск ведется по 61 сайту Рунета, причем, как обещают разработчики, вскоре будет сделан фильтр, позволяющий удалять из результатов поиска дубликаты. Что в данном случае принципиально. Для того, чтобы воспользоваться новым сервисом на JobsMarket, нужно после регистрации нажать на оранжевые "ВАКАНСИИ" либо синие "РЕЗЮМЕ" вверху страницы. (Они выглядят не как ссылки, а как заголовки, потому поначалу запросто можно запутаться.) Свой подход к поиску авторы JobsMarket называют "принципом одного окна", подразумевая под этим объединение информации, получаемой с ряда сайтов, на одной странице. Будем надеяться, у Jobster.ru теперь появился серьезный конкурент. |
© АБ, 2006. |