Социальный поиск

 

 

 

Социальный поиск – технология, предполагающая, что на выдачу поисковых результатов оказывается непосредственное влияние человека.

Социальный поиск реализуется в сервисах вопросов и ответов,  собранных пользователями каталогах ресурсов, "ручном" ранжировании поисковых результатов путем выставления им   определенных тегов или баллов.

 

 

 

Поиск в стиле Web 2.0

 

Социальный поиск  одна из основных тенденций развития современных поисковых технологий.

Все крупные поисковые системы имеют сервисы ответов-вопросов: Windows Live QnA, Yahoo!Answers, Google Answers, Ответы@Mail

 

Майкл Твидейл (Michael Twidale, профессор университетf Иллинойс): Люди во время интернет-поиска часто хотят взаимодействовать с другими людьми. Однако разработчики поисковых систем об этом пока мало задумываются.

 

Анна Артамонова (директор по маркетингу Mail.Ru): Релевантный ответ зачастую зависит от правильно составленного запроса. В социальном поиске нет необходимости задумываться над тем, как спросить, потому что вопрос адресуется обычному человеку, а не машине.

Анна Артамонова: Если пользователи будут рейтинговать (оценивать) выдачу поисковых систем, это будет уникальный симбиоз технического и социального аспектов. И будущее именно за таким «скрещиванием».

 

С поисковике ChaCha.com на запрос пользователя отвечает не случайный участник коммьюнити, а эксперт в предметной области, который должен предоставить ссылку в течение 20 секунд. Эксперты делятся на четыре категории (по компетенции и оплате труда :-). Эксперт должен дать удовлетворительные ответы на 10 пользовательских запросов, в дальнейшем он сможет зарабатывать от 5 до 10 $ в час. Вопросы бесплатны, эксперты оплачиваются  из средств рекламы.

Брэд Бостик (Brad Bostic, президент ChaCha.com): Количество зарегистрированных на сайте экспертов уже превышает 2500 человек. Я уверен, что ChaCha.com сможет обеспечить более высокое качество результатов, нежели современные "машинные" поисковики. Наш социальный поисковик откроет пользователям доступ к тем источникам информации, которые недоступны машинам вроде Google.

 

 

9.11.2008 Microsoft открыла доступ к  социальному поисковому инструменту SearchTogether  для обменая своими результатами поиска и просматра поисковых запросов и выдачи своих коллег. SearchTogether может сохранять поисковые сессии и пометки пользователей.

 

21.11.2008 Google встроила в свой поисковик систему SearchWiki, которая позволяет пользователям персонализировать поисковые результаты по запросу меняя порядок следования ссылок, удаляя их и добавляя комментарии к результатам. Внесенные однажды изменения отображаться для сделавшего их пользователя, но для других пользователей поисковика Google не видны.

Юрген Галлер (Juergen Galler), директор по продуктам Google): Мы всегда считали, что лучший поисковый сервис должен понимать, что нужно пользователю. -  SearchWiki действительно приближает Google к этому идеалу: это самая глубокая настройка поиска, которую мы когда-либо предлагали, ведь пользователь лучше всех знает, какие результаты поиска подходят ему лучше всего.

 

2.02.2009 Основатель Wikipedia Джимми Уэйлс запустил сервис вопросов-ответов Wikianswers. Чтобы работать с Wikianswers, регистрация на ресурсе не требуется.

 

 

 

Яндекс о социальном поиске

 

Из блога компании «Яндекс»:

  • Поиск в интернете проделал большой путь: от поиска по описаниям сайтов из каталога к поиску по текстам страниц, от учета ссылочной авторитетности (PageRank), интерпретации поведения пользователя на выдаче до сложных систем машинного обучения (MatrixNet). Сегодня мы на пороге следующего серьезного изменения.

  • В интернете уже опубликованы десятки, по другим подсчетам – сотни миллиардов веб-страниц. Более 99% из них созданы не людьми: являются спамом, дубликатами контента или другим автоматически сгенерированным мусором. По коротким поисковым запросам, например, [яндекс], в вебе может найтись более 100 млн. документов. Иногда в подобных случаях даже нет смысла искать слова по тексту страницы. Нам нужно понять, какие страницы по подобному запросу будут признаны другими людьми как наиболее авторитетные.

  • Аналогичный процесс информационной перегрузки имеет место при потреблении информации пользователями интернета. Многие материалы, с которыми вы можете столкнуться в сети, на первый взгляд похожи на что-то стоящее, но могут вводить вас в заблуждение или оказаться скрытой рекламой.

  • Чтобы решить эту проблему, люди давно научились выбирать сайты, например, новостные, которым они доверяют. Это им помогло, но сейчас этого уже недостаточно.

  • Мы стали больше доверять не сообщениям «официальных» источников, а персонализированной информации, исходящей от знакомых, которым мы верим. Появившиеся социальные сети помимо функции общения стали играть роль сетей по эффективному распространению информации. А решение в них вопроса доверия и отбора информации привело к тому, что значительная часть информационной активности переместилась из классического веба в социальные сети.

  • Парадигма сегодняшнего интернета включает в себя слова "авторство", "авторитетность", "подписка", "дружба" и возникающий на основе этого – персональный информационный поток. Анонимная информация перестает оказывать влияние на людей, ибо просто не проходит через их фильтры. Веб-поиск, по нашему мнению, просто должен быть не глупее пользователей, уже научившихся отбирать информацию, и использовать схожие механизмы для адекватного ее восприятия.

  • Знаменитый Твиттер, с полным потоком данных которого (Firehose) недавно начал работать Яндекс, великолепно решил задачу построения сети распространения информации между людьми. Короткие твиты как результаты поиска могут быть полезны, когда какое-то важное событие происходит или произошло прямо сейчас, а классические медиа еще не успели осветить развитие ситуации. Эту задачу решает Real-Time поиск по Твиттеру (http://twitter.yandex.ru). Еще одно применение такого поиска – это поиск мнений людей о той информации, с которой пользователь уже знаком.

  • Однако именно поиск веб-страниц и других объектов в интернете, упомянутых в Твиттере или соцсетях, – это то, зачем по-настоящему нужны социальные сети поиску. Эту модель реализовал поисковик Топси (http://topsy.com), результаты которого теперь используются Яндексом.

  • Анализируя упоминания материалов авторами, которым доверяет алгоритм, опираясь на понятие авторитетности для отсечения мусора, поиск может находить то, что наиболее интересно большинству людей. А Real-Time анализ популярности тем, обсуждаемых прямо сейчас в соцсетях, позволяет определять наличие событий и потребности у пользователя в свежих материалах.»

 

 

 

Like - символ времени

 

15.02.2010

Facebook представил набор социальных плагинов и, в их числе, главный из них – кнопку Like, призванную стать основой его поисковика.

Все они связаны с таргетированием и вирусным механизмом передачи информации о контенте и web-приложениях, благодаря сотням миллионов пользователей добровольно их классифицирующим.

Вместо того, чтобы индексировать сеть тысячими ботов, прокачивающими терабайты трафика, и затем на тысячи датацентрах по всему миру пытаться определять ценность этого контента для людей с помощью спорных алгоритмов, Facebook предложил пользователям самим решать, какой именно контент является полезным для них, а какой – мусорным.

Этим ежедневно и занимаются сотни миллионов пользователей, просто нажимая кнопку Like на понравившихся им страницах на сотнях тысячах сайтов.

Через 2,5 месяца после представления кнопки Like Facebook ежедневно  обрабатывал уже 3 млрд. ее нажатий на более чем 400 тыс.сайтах!

Facebook поясняет суть полученного патента на примере:

“Например, Крис ищет ресторанчик где бы мог перекусить очередным вечером. Facebook, зная, что этот человек заядлый рокер, ранжирует список всех доступных заведений такого рода, чтобы подобрать наиболее логичное заведение для такого рода увлечения. Далее, учитывая “лайки” уже проголосовавших хиппарей из самого близкого социального круга общения Криса, движок ещё больше сужает круг выдачи. Поскольку Facebook, имея огромную личную историю Криса, реально отслеживает и финансовые предпочтения человека в том числе, он ещё больше уточняет выборку, принимая в расчет его реальные денежные возможности. На самом же деле, таких сугубо личных факторов учитывающихся в итоговом ранжировании могут быть тысячи… чем более активен человек (или его окружение) в сети – тем более феноменально точным будет наш поиск!”

Откуда у вебмастеров потребность ставить эти самые “лайки” на сайты?

Они генерируют большой обратный трафик и вызывают гигантские волны посещений в ответ на зазывное “лайкание” их посетителей.

 

Уже зафиксировано появление так называемых лайк-ферм , которые массово скупают чужие голоса, обеспечивая стремительную раскрутку через новые возможности Facebook.

 

 

 

Google Social Search

 

25.08.2011

Google Social Search (социальный поиск) запущен корпорацией Google в 2009 году.

Данный сервис осуществляет поиск информации, исходя из записей знакомых и друзей в социальной сети, блоге, почте и соцсети Google+.

Скажем, пользователю нужна информация о каком-либо кафе или клубе, ему нужно зайти на свою страницу и ввести запрос в строку поиска. Если у кого-нибудь из друзей имеются записи об этом заведении, пользователь увидит это в результатах поиска.

Результаты такого в некоторой степени личного поиска будут показываться в выдачах Google, отделенные записью вида «Results from people in your social circle», что в переводе означает «результаты поиска по вашим контактам».

 

 

 

Volunia

 

07.02.2012 Открыто тестирование Volunia — «радикально нового» поисковика от Массимо Марчиори (Massimo Marchiori), профессора Падуанского университета(Италия).

Volunia объединяет элементы поиска с функционалом социальной сети. Служба, к примеру, позволит контактировать с другими пользователями, ищущими информацию на ту же тему.

Интерфейс Volunia представлен на 12 языках, в том числе на русском.

Массимо Марчиори разработал несколько веб-технологий, в частности поисковый движок HyperSearch.

 

 

 

YaCy

 

28.11.2011 Free Software Foundation Europe (FSFE) представила поисковую систему с открытым кодом YaCy (читается: ya see) - поисковую систему от людей и для людей.

Карстен Герлофф (Karsten Gerloff), президент FSFE): YaCy — не вызов Google, он даже не задумывался, как вызов Google. Это просто реализация нового захватывающего подхода к веб-поиску, расширяющего возможности пользователя.

YaCy демонстрирует принципиально иной подход к поиску на технологиях Peer-to-Peer (P2P).

У YaCy нет центрального сервера — вместо этого результаты поиска обеспечивает добровольческая пиринговая сеть, на данный момент состоящая из независимых пользователей.

В децентрализованной поисковой системе YaCy сами пользователи решают, что попадет в результаты выдачи, или в каком порядке они будут представлены.

 

В отличие от традиционных систем поиска, YaCy построена так, чтобы защищать приватность пользователя и поисковые запросы перед отправкой шифруются.

Пользовательский компьютер сам формирует поисковые индексы и рейтинги, так что со временем результаты выдачи все лучше и лучше совпадают с тем, что пользователь ищет.

Демо-версию YaCy  можно испытать на сайте проекта (http://search.yacy.net/).

Чтобы испытать YaCy в полном объёме, надо движок установить YaCy на свой компьютер, сделав его частью пиринговой сети (он начинает получать от неё поисковые результаты и отдавать их другим пирам). ПО потребовало у kmp 30GB свободного места на диске....

 

 

YaCy уже используется в качестве локального поиска на ряде сайтов (sciencenet.kit.edu, yacy.geocaching-portal.com, и сам сам сайт Free Software Foundation Europe — fsfe.org и др.). Локально поиск YaCy доступен из браузера по адресу: http://localhost:8090/

 

 

 

 

Blekko

 

Blekko (http://blekko.com/) — социальная поисковая система, которая использует слештеги.

Создана в 2010 году Ричардом Скрентом (Richard «Rich» Skrenta) - выдающимся программистом, вирусописателм, хакером и т.п.

Создатели blekko разработали собственный «Билль о правах веб-поиска»:

  1. Поиск должен быть открытым;

  2. На результаты поиска должны влиять люди;

  3. Сведения о рейтингах сайтов не должны быть секретными;

  4. Веб-данные должны быть легкодоступными;

  5. Не существует алгоритма поиска, который подходил бы всем;

  6. Расширенный поиск должен быть доступным;

  7. Инструменты поискового движка должны быть открытыми для всех;

  8. Поиск и сообщество должны идти рука об руку;

  9. В результатах поиска не должно быть спама;

  10. Должна соблюдаться конфиденциальность поисковых запросов.

blekko использует слештеги  для:

  • сужения области поиска (в поисковой выдаче только сайты, отобранные вручную экспертами в своей области, сообществами пользователей или же лично вами). Когда пользователь вводит в строке поиска запрос и добавляет после него слештег, поиск выполняется только по тем ресурсам, которые были связаны с этим тегом. Ограничивая область поиска, это позволяет быстрее найти нужную информацию. Слештег /news выполнит поиск по новостным сайтам, слештег /recipes по кульнарным.

  • сортировки результатов. Например, слештег /date сортирует результаты поиска по дате.

В одном поисковом запросе можно использовать сразу несколько слештегов, добиваясь еще более точных результатов поиска.

 

Слештег включает название, ключевые слова, а также список сайтов, по которым будет выполняться поиск. Расширяемый пользователями список слештегов: http://blekko.com/tag/show#tab3 , тут на 12.12.2011:

/accounting

/actors

/acupuncture

/aids

/aikido

/airlines

/airports

/alcohol

/allergies

/alternative-medicine

/american-history

/android

/anime

/antiques

/apple

/appliances

/archery

/architecture

/aromatherapy

/art-museums

/artificial-intelligence

/arts

/astrology

/astronomy

/atheist

/av

/ayurveda

/baby

/baseball

/basketball

/beauty

/beer

/bees

/biology

/biotech

/bluegrass

/book-reviews

/boxing

/broadway

/buddhist

/camping

/cancer

/car-parts

/car-rental

/car-repair

/cardiology

/cars

/celiac

/celtic

/chef

/chemistry

/childrens-apparel

/christian-music

/climate

/climbing

/clothing

/cloud

/cocktails

/coffee

/college-basketball

/college-football

/hvac

/insurance

/inventors

/investing

/college-sports

/colleges

/comic-books

/conservative

/conspiracies

/contentfarms

/cosplay

/coupons

/cricket

/cruises

/cycling

/dance

/dermatology

/designers

/diabetes

/digital-collections

/discgolf

/diy

/dnd

/dogs

/easter

/ebooks

/economics

/energy

/environment

/esl

/etiquette

/fanfic

/fantasy-football

/fashion

/fathers-day

/federal-agencies

/fitness

/flowers

/furniture

/gadgets

/games

/gardening

/genealogy

/genetics

/geocaching

/geology

/golf

/green

/hacker

/halloween

/ham-radio

/handbags

/health

/hearing

/herbal-medicine

/history

/hoaxes

/holidays

/homeopathy

/hotels

/humor

 

/ipadapps

/islam

/it

/jazz

/jeans

/jerseys

/jewelry

/jewish

/karate

/knitting

/language

/law

/lawn-care

/lgbt

/liberal

/librarianship

/lyrics

/marinebiology

/maternity

/math

/medications

/meditation

/mlb

/mlk

/mma

/momblogs

/money

/mormon

/mothers-day

/motorcycles

/movie-reviews

/movies

/music

/mythology

/nanotechnology

/national-labs

/national-parks

/nba

/news

/nfl

/nhl

/nursing

/nutrition

/olympics

/open-source

/opera

/organic

/paintball

/paleontology

/parenting

/peace-corps

/pediatrics

/perfumes

/pets

/photography

/plasticsurgery

/poetry

/politicalblogs

/politics

/pregnancy

/presidents

/programming

 

/progressive

/psych

/psychology

/puzzles

/quilting

/racing

/raw-food

/recipes

/religion

/retailers

/retirement

/reviews

/robotics

/rock

/royalty

/rugby

/safeshop

/sailing

/salary

/sca

/science

/sem

/seoblogs

/seosites

/shakespeare

/shoes

/smallbusiness

/snowboarding

/soccer

/sports

/sql

/startrek

/starwars

/sunglasses

/supreme-court

/swimming

/swimwear

/tea

/tea

/tech

/tech-reviews

/techblogs

/tennis

/thanksgiving

/tickets

/tolkien

/toys

/travel

/tv-reviews

/twilight

/uniforms

/vaccines

/vc

/vegan

/vegetarian

/volleyball

/watches

/weather

/webdesign

/wedding

/wine

/wordpress

 

 

Blekko-игра: Вводим запрос с тегом /monte, и видим три колонки с результатами поиска: в blekko, Google и bing. Выбираем колонку с наиболее ожидаемыми  (самыми пертинентными) результатами и видим названия поисковых систем.

blekko использует быстрые ссылки, при помощи которых можно выполнять разнообразные действия, например:

  • seo — открывает страницу с информацией о сайте (сведения о количестве страниц, числе посетителей и их географической принадлежности, адрес файла robots.txt, наличие RSS-потока, количество видеофайлов на страницах сайта, IP-адрес и так далее).

  • links — выводит список сайтов, которые ссылаются на веб-страницу.

  • spam — позволяет сообщить поисковику, что сайт является «мусорным».

  • dup — показывает страницы с таким же содержимым.

  • add — дает возможность быстро добавить страницу к одному из пользовательских слештегов.

  • source — открывает HTML-код страницы.

С помощью blekko имеет смысл искать только страницы на английском языке (русскоязычный поиск слаб и есть проблемы с кодировкой — многие русскоязычные сайты отображаются некорректно).

17.10.2011 Компания «Яндекс» инвестировала $15 млн  в поисковую систему . Генеральный директор и основатель «Яндекса» Аркадий Волож даже вошел в совет директоров американской компании blekko.