Игорь Ашманов

 

 

igor@ashmanov.com

 

1962-1986

Игорь Станиславович Ашманов родился в Москве, в 1962 году,  в семье аспиранта Мехмата МГУ.

В 1983 году окончил Мехмат МГУ (у меня бабушка там училась, отец и мать. Так что деваться, по сути, было некуда). Работал в Вычислительном центре АН СССР, в Отделе искусственного интеллекта.

Все бурлило. Женя Веселов, автор «Лексикона», сидел в соседней комнате. Игру «Тетрис» тоже делали рядом. Там же работала Ольга Дергунова (будущий директор российского офиса Microsoft), рядом работал Аркадий Борковский, автор первого словаря по вычислительной технике и первого электронного словаря «Джинн» в России (сейчас занимает высокую должность в Yahoo!)

1987-1994

в компании «Информатик» разрабатывал лингвистическую часть системы правописания «Орфо» в компании «Информатик» (использована в MS Word), сначала сделал в ней всю лингвистику, а с 1991 года руководил всей разработкой.

В разгар путча, петляя между танками, большая часть сотрудников компании «Информатик» покинула страну. Я остался, собрал новую команду и сделал еще одну версию программы, теперь уже под Windows – ту самую, которую мы в 1994 году продали Microsoft для встройки в Microsoft Word

В 1994 году «Орфо» выиграла конкурс Microsoft и вошла в состав русской версии Microsoft Office.

Разрабатывал электронный словарь «Контекст»

1995-1998

после продажи ОРФО корпорации Microsoft, ушёл из «Информатика», защитил диссертацию по прикладной лингвистике, и  открыл собственную компанию «МедиаЛингва» (вместе с партнёром-инвестором). Выпускал электронный словарь «МультиЛекс», поисковик «Следопыт», автоматический аннотатор «Либретто» и другие умные программы

1999

перешёл в «Рамблер» с командой из 15 человек, сначала директором по разработке и исследованиям, потом исполнительным директором

2001

открыл собственную компанию «Ашманов и Партнёры»

Вначале очень нервничал, что не смогу без работы «на дядю». Как только я перестал бояться, принял решение действовать самостоятельно, на меня сразу хлынули заказы, люди, клиенты. Единственным ограничением был я сам.

2004

создал компании Поисковые технологии и Наносемантика.

2005-2009

Выпустил спам-фильтр Спамтест (продан Лаборатории Касперского, агрегатор новостей и обменную сеть Новотека, товарный поисковик Аппликата, сервис персональных поисковиков Flexum, автоаудитор сайтов Site-Auditor, инкубатор виртуальных собеседников и блогов  Аяяй.ру, агергатор контекстной рекламы Блондинка.Ру, анализатор видимости проекта в Сети Seo-Rate, создал ежегодные конференций по поисковому маркетингу и рекламе Optimization.ru и Etarget.ru, написал книгу «Продвижение сайтов и поисковая оптимизация».

 

 

 

Игорь Ашманов: личность Рунета

 

 

 

 

 

Из интервью еженедельнику Computerra

 

27.05.2007

- Мне чай с лимоном, - говорит Ашманов подошедшему официанту.

- С лимоном нет, - гордо отвечает официант.

- Тогда без лимона, - кивает Ашманов.

Вот, собственно, и все.

 

 О Natural Language Compiler

Ашманов: Допустим, что есть в центре Москвы очень успешная софтверная компания "Файн и сыновья", которая уже восемь лет работает над единой, фантастической системой машинного перевода.

Там ситуация такая: в отечественной прикладной лингвистике в свое время Мельчуком и Жолковским была взорвана бомба под названием "модель смысл-текст". Эта лженаука повредила мозги очень многим тогда, от последствий отечественная прикладная лингвистика избавлялась очень долго, но так и не избавилась до конца. Апресяновская группа ("Этап-2", "Этап-3") потратила 30 лет на неработающую систему перевода!

Суть же самой идеи в очень грубом изложении в следующем: если мы аккуратно опишем актанты (валентности глаголов, они же лексические функции) всех глаголов и научимся переводить один в другой и подставлять лексические функции одна в другую, то на выходе получим машинный переводчик. Общая идея в том, что у каждого глагола есть набор лексических функций, и в каждом языке этот набор такой же, но средства выражения другие. И если мы средства выражения опишем, то дальше можем взять глагол в одном языке, оценить, какие лексические функции несут окружающие его существительные, и построить выражение с тем же набором лексических функций на другом языке. Просто подставив переводы слов в рамку лексических функций.

Идея эта неверна, что было понятно чуть ли не с самого начала. Они - Мельчук с Жолковским - пытались сделать толково-комбинаторный словарь. Собрали чуть ли не сотню аспирантов и составили. Вот такой толщины (показывает). Я его купил в восьмидесятых годах за сорок рублей. Толстый черный словарь. В нем было четыреста глаголов. И когда я начал его читать, то понял, что это сборник анекдотов. Буквально через каждые десять глаголов им приходилось придумывать новые лексические функции, ибо в реальности множество этих функций оказалось разомкнутым. Они сделали шестисотстраничный словарь для четырехсот глаголов, но было видно, что, во-первых, эту работу нельзя завершить, а во-вторых, пользоваться ей невозможно, потому что все плывет, множество незамкнутое, и свести его не удается. Я его почитал, выбросил в ведро, но жена потом обратно достала, пожалела сорок рублей. Так до сих пор и стоит, весь в потеках.

И вот один важный сотрудник этой компании - он изначально программист, насколько я понимаю - решил, что все Маркса поняли неправильно, а он один понял правильно. Он - единственный правильный последователь Мельчука и Жолковского, до этого реализации были неверные. Но если сделать все по классической науке, то все заработает. В результате у него сидит сто лингвистов, они уже восемь лет над этим корпят, потратили пятнадцать миллионов долларов, он рассказывает о блестящих перспективах Основателю, а Основатель пересказывает всем остальным.

Они откладывали выпуск уже много раз (последний раз компания отложила выпуск беты в марте этого года - Прим. ред.), пару раз даже собирались свернуть идею и делать translation memory, что гораздо проще и более осмысленно (что-то типа TRADOS).

Как обычно, я в таких случаях в глубине души сомневаюсь - а вдруг всё не так просто, здесь готовится чудо, а я просто дурак. Ну, посмотрим - они на этот раз обещают всё к 2009 году.

 

О Google Translation

Ашманов: Представим себе крупную американскую интернет-компанию Doodle, которую десять лет назад основали Матвей и Гарри. Они сделали себе переводчик, статистический, на базе translation memory. Он заметно хуже "Промта". Руководитель этого проекта, китаец, говорит: нет, лингвистикой мы не будем заниматься, она для машинного перевода не нужна. Главное, мол, это вычислительная мощность. Когда я такие вещи слышу, я думаю, что человек не понимает, что говорит. Простейшие выражения иногда переводятся нормально. Но как только дело доходит до длинных предложений, ситуация меняется. Это ведь известная проблема - машинные переводчики плохо справляются с фразами длиннее определенного порога. У "Промта" - из всех известных мне переводчиков с русской парой - этот порог самый высокий. Doodle ломается гораздо быстрее. И начинается полная ахинея. За счет своей лексической идеи Doodle переводит "Касперский" как "Norton", а "Ашманов" - как "Advertising". Пока там все негодное, нет даже простейшего лингвистического сглаживания, падежи все неправильные. Это все результат желания делать вещи, в которых ты не разбираешься, делать их самым общим образом, думая, что если ты чего-то добился в своей области, то так же легко у тебя получится преуспеть в чужой. И, я думаю, на Doodle это скоро скажется.

 

О собственном машинном переводчике

Ашманов: Голубая мечта  - это... машинный переводчик. Нового поколения, естественно. Но к нему  пока подступаться боюсь, хотя идея "правильного переводчика" у меня есть, и наша команда даже сделала работающий прототип еще в 1999 году.

 

Мимо проходит официант.

- Принесите, пожалуйста, еще чаю, - говорит Ашманов.

- С лимоном? - спрашивает официант.

 

 

 

Ашманов и Касперские

 

Ашманов: Женат на антивирусе (Наталье Касперской), занимаюсь разработкой технологических решений для других компаний и поисковой оптимизацией (search engine optimization или SEO).

Ашманов: Я избавился от "Спамтеста", чтобы избежать естественного поглощения.  Да и устал с женой (Натальей Касперской) подписывать акты приемки-сдачи. Касперские - это большая компания, а мы - "Ашманов и партнеры" - маленькая, и нас уже начало притягивать к Касперским. Сделали первый проект. Им понравилось. Пришли за вторым проектом, за третьим, за четвертым. Вскоре у нас уже было семь контрактов с ними. Мы незаметно становились подразделением "Лаборатории Касперского".

 

Касперская Наталья Ивановна — председатель Совета директоров «Лаборатории Касперского», а также генеральный директор компании InfoWatch — разработчика систем защиты конфиденциальной информации от внутренних угроз. До избрания на пост председателя Совета директоров была руководителем «Лаборатории Касперского» более 10 лет. Свободно владеет английским и немецким языками.

Наталья Касперская: вести бизнес нужно, руководствуясь определенными высокими моральными ценностями, просто потому, что иначе не работает. Если ты хочешь достичь серьезных результатов, то нужно следовать принципам чести и честности. Очень важно, чтобы работала команда. Один человек вообще ничего не может сделать! В чем-то я разбираюсь лучше, в чем-то — хуже, в чем-то не понимаю вообще ничего — и здесь важно уметь прислушаться к мнению других.

В 1998 г. развелась с Евгением Касперским. Замужем за Игорем Ашмановым. У Натальи Ивановны двое детей от первого брака и двое от второго. Дочь Маша родилась 5 марта 2009 года.

Евгений Касперский: Биография Натальи — словно дорога к воплощению «американской мечты». «Просидев несколько лет с детьми», пришла работать в «Ками» и из скромного продавца в отделе «софта и харда» за 6 лет превратилась в руководителя известной и перспективной компании.

 

 

 

 

Наносемантика

http://www.nanosemantics.ru

 

Наносемантика занимается разработкой интерактивных баз знаний и новых типов интерфейсов на основе технологий распознавания естественного языка:

  • Построение технологий и интерфейсов общения человека и машины на естественном языке, а также развитие технологий искусственного интеллекта.

  • разработка для сайтов наших клиентов уникальных виртуальных помощников – инфов (систем с элементами искусственного интеллекта, которые в режиме диалога общаются с пользователем на понятном ему языке).

  • Разработана онлайновая экспертная система, которая предназначена для быстрого сужения поиска без потери качества выборки. Она помогает пользователю выбрать из клиентской базы знаний подходящий именно ему объект, из любого множества объектов.

Наносемантика использует только собственные программные и лингвистические решения, технологии и базы знаний.

 

 

 

А-я-яй.ру

www.iii.ru

А-я-яй.ру (www.iii.ru) — проект «Наносемантики».

  • Мы уверены, что уже через несколько лет на каждом сайте, в каждой микроволновке и стиральной машине, в каждом банкомате и автомобиле будет жить свой информационный эльф — инф, виртуальное существо, с которым можно будет поговорить, дать приказ или получить справку. Почему бы не начать строить будущее прямо сейчас?

  • В проекте А-я-яй.ру каждый может создать своего инфа. Вы можете выбрать внешний вид для своего инфа, обучить инфа отвечать на разнообразные вопросы, вынести его на свой сайт, в блог или социальную сеть.

  • Инф может быть вашим вторым «я», которое разговаривает в блоге, пока вас нет, а может быть помощником: секретарём, консультантом в интернет-магазине, сотрудником службы техподдержки.

  • Инфы не только прикольные персонажи, они могут работать на вас. Они не устают, не просят есть и не являются членами профсоюза. До принятия законов о равноправии роботов и людей ещё минимум несколько десятков лет. Вы можете создать и обучить столько инфов, сколько пожелаете и занять лучшие места в этом новом мире.

  • Помните, что время, вложенное в обучение вашего инфа — не пропадает. Инф ничего не забывает и постоянно умнеет. Мы рассчитываем вместе с вами — сообществом авторов инфов — делать искусственный разум всё разумнее и разумнее, в этом году мы планируем запустить проекты совместного создания сверх-умных инфов целыми сообществами разработчиков.

 

 

 

 

Поисковая система «Ашманов и Партнеры»

 

Поисковая система - это программный комплекс в составе:

  1. веб-робота (выкачивает указанные страницы с заранее заданной частотой, глубиной и другими параметрами),

  2. индексатора (получает закачанные роботом страницы и строит по ним индекс),

  3. поискового интерфейса (забирает полученные индексы и производит собственно поиск по ним – принимает поисковые запросы и возвращает пользователю ответ в виде страницы выдачи),

  4. модули генерации отчётов и составления и обработки расписаний (обеспечивает своевременное выполнение заданий на индексирование).

Что умеет:

  • совмещение полнотекстового (лингвистический поиск по ключевым словам в текстах) и атрибутивного (по полям, как в базах данных) поиска;

  • учёт при поиске семантических рубрик, распознавание синонимов;

  • система индексации, оптимизированная под максимальную скорость и полноту сбора информации с сайтов;

  • полностью управляемая индексация, поддержка robots.txt и стоп-слов;

  • возможность экспорта результатов в формате XML и представления выдачи в дизайне своего сайта;

  • индексирование документов содержащихся в СУБД (поддержка OLEDB и ODBC);

  • поиск в нескольких независимых индексах с возможностью объединения результатов;

  • поиск в текстах на любых языках.

Отличие от глобальных поисковых систем (Яндекс, Google): полный контроль над поисковой базой.

Предназначена для:

  • корпоративных сайтов,

  • крупных порталов,

  • Intranet-систем,

  • баз данных.

Кто использует: ММВБ, Финам, Regnum, Независимая газета, Allexpo, Новотека и др.

 

 

 

 

Гиперпоиск

 

Гиперпоиск - технология для автоматической расстановки энциклопедических ссылок на веб-страницах.

Гиперпоиск повышает удобство сайта, предлагает дополнительный контент и удерживает посетителей.

Гиперпоиск позволяет повысить число показов страниц на 15-20% за счёт дополнительных просмотров справок.

Гиперпоиск предназначен в первую очередь для интернет-СМИ и тематических порталов.

Как это работает

Гиперпоиск находит в тексте веб-страницы важные объекты (имена персон, названия организаций, географические названия) и подсвечивает их как гиперссылки. Таким путём в тексте статьи автоматически возникают энциклопедические ссылки, дающие справку по выделенному объекту.

Справка формируется таким образом: при клике по выделенному объекту запускается поиск всех статей на сайте, в которых упоминается этот объект. Фактически, в качестве справки пользователю показываются результаты поиска объекта по сайту.

Кто использует: ММВБ, Финам, Regnum, Независимая газета, Allexpo, Новотека и др.

 

 

Об авторском праве

 

Игорь Ашманов:

  • Вот основной принцип, я для себя его выработал, он очень простой: в совладельцы нужно брать всех тех и только тех, кто оказывает существенное влияние на развитие бизнеса.

  • Я работал в компании, которая разрабатывала электронные словари «Мультилекс». Однажды к нам обратились шведы, которые хотели распространять у себя электронный шведско-русский словарь.

  • Я пошел по проторенной дорожке: я пошел в самое крупное словарное издательство в стране и сказал: «У вас же есть шведский словарь, вот, он у меня на полке стоит с вашим логотипом. Продайте мне, как всегда (у меня тогда уже было право на тридцать словарей) еще и на этот лицензию – на его компьютерную форму».

  • Они сказали: «Не можем!» – «Почему?» – «Ну, вот там три автора, там есть два автора, доктора наук, знатоки шведского языка из иняза, или из университета (я сейчас не помню). Третий автор – аспирант, которого они назначили автором просто потому, что он им вычитывал словарные статьи. Ну, корректором работал. Он был хороший умненький аспирант, помогал им, естественно, безвозмездно, они его за то включили в авторы. Теперь оба этих доктора профессора померли, и остался один живой автор, который требует каких-то сумасшедших денег, совершенно неадекватен, не дает издавать новые словари.

  • И в результате наследники этих двух настоящих авторов не получают с этого словаря ничего». На самом деле понятно, что он не вносил существенного вклада в этот бизнес, в этот словарь. Его взяли по дружбе, по жалости, не знаю, по расположению.

  • Это грубая ошибка. Потому что авторство – это такая же священная вещь, как и собственность. Нельзя делать автором того, кто автором, по сути, не является. И с собственностью то же самое.

 

 

Читайте

 

Игорь Ашманов и его книги «широко известны в узких кругах» всех, кто имеет какое-либо отношение к интернет-бизнесу.

  1. Ашманов И. С. Жизнь внутри пузыря. — М.: Манн, Иванов и Фербер, 2008. — 208 с. (http://www.ashmanov.com/pap/bubble/)

  2. Ашманов И. С., Иванов А. А. Продвижение сайта в поисковых системах. — М.: «Вильямс», 2007. — 304 с.

  3. «Правила Ашманова» – о проблемах управления программистами и программными проектами (http://www.ashmanov.com/pap/ashrul.phtml)