Сетевые
образовательные ресурсы |
Massive Open Online Course
МООС
(Massive
Open Online Course)
- массовые интернет-курсы с
интерактивным участием и открытым доступом.
Термин MOOC придумали в 2008 году Дэвид Кормиер из канадского
Университета острова принца Эдуарда (University of Prince Edward
Island) и Брайен Александер из Национального института технологий в
либеральном образовании (National Institute for Technology in
Liberal Education).
Крупнейшие
MOOC-площадки США:
-
Coursera,
детище стэнфордских профессоров Эндрю Нг (по другой версии он Ын)
и Дафной Келлер.
Более 17 000 миллионов студентов (пользователей).
-
Udacity,
структура, возникшая на базе программы по информатике
Стэнфордского университета
-
edX,
учреждённая Гарвардским университетом и Массачусетским
технологическим институтом
В других странах:
-
Iversity
в Германии (300 тысяч студентов, больше, чем где-либо в
Европе),
-
Open Univercity
в Великобритании,
-
OpenupEd
— детище образовательных структур Евросоюза,
-
EduKart
в Индии и т. д.
Coursera:
более 1000 (!!!) курсов , представленных классическими текстовыми материалами
(учебные пособия, проверочные задания, ключи к упражнениям и т. п.), аудиолекциями и видеоматериалами. Академическую поддержку Coursera оказывают 33
крупнейших североамериканских университета (в том числе и элитные Принстон,
Стэнфорд, Джонс Хопкинс, Калифорнийский технологический институт, Эдинбургский,
Торонтский, Колумбийский и Пенсильванский университеты). Под академической
поддержкой понимаются не просто предоставление университетами своих учебных
материалов и дидактических наработок, но и прямое участие преподавательского
корпуса в учебном процессе.
Статистика
Coursera
(2015 года). В
среднем 5-8% из всех записавшихся студентов успешно проходят курсы.
Для сложных курсов только 3% записавшихся студентов доходят до стадии
финального экзамена и лишь 1,5% сдают его.
Статистика
eDX
(2013 года). Из
841 687 человек, зарегистрировавшихся на курсах в первый год обучени
43 196
(5,1%) изучили материалы в достаточной степени, чтобы
получить сертификат об окончании.
Последние исследования показывают, что онлайновые
курсы не уступают по эффективности традиционным формам обучения.
|
Udacity.
Nanodegrees
Udacity
получила $35 млн венчурного финансирования из США, Бразилии,
Японии, Германии.
Себастьян Тран
(Sebastian Thrun, основатель и исполнительный
директор Udacity):
-
Наша система образования создана по запросам индустрии. Они
предоставили нам лучшие кадры, а также деньги для создания
контента, и они же разработали начальный проект учебной
программы.
-
онлайновое обучение не должно составить конкуренцию
университетскому образованию. Это курсы профессиональной
подготовки, у которых крайне практичная задача — подготовить
человека к работе по конкретной профессии. В такой ситуации
обучение становится более направленным: человеку
даются только необходимые знания, поэтому весь процесс
идёт быстрее.
Udacity начал
выдавать нанодипломы в
области веб-разработки (Front-End Web Developer). Их
признают при устройстве на работу в Google, AT&T, Autodesk, Cloudera, Salesforce
и другие крупные компании.
Получение
«нанодиплома» рассчитано на 6-12 месяцев, при условии обучения 10 часов в неделю.
Особенности
преподавания/изучения:
-
Высокая интерактивность курса
-
Даются именно те
навыки, которые востребованы сейчас в индустрии.
-
Отрабатывается навык,
а не теория.
-
Огромное количество
полезных ссылок.
-
Преподаватели
практики из Facebook, Twitter, MongoDB и т.п.
-
Курсы разбавлены
интервью с интересными людьми из топовых Tech компаний
-
Постоянное развитие
курса
-
Вовлечение студентов,
которые становятся рецензентом (reviewers).
-
Сильный
калифорнийский акцент преподавателей (сложности понимания +
развитие навыка слушания).
-
Расписание вебинаров
часто попадает на ночные часы
-
Неакадемичный стиль
преподавания.
-
Материал не всегда
структурирован с точки зрения теории.
Обучение
в Udacity платное: $200 в месяц (дешевле, чем в ведущих
университетах).
https://youtu.be/hk9fNvHdmKc
|
kmp
рекомендовал
COURSERA
kmp
рекомендует
ПЕРЕВЕДЕМ
COURSERA
+
Тонкости
перевода
11.06.2016
COURSERA становится
всё более жадной
(как Udacity) и постепенно коммерциализируется. Этот частный
проект имеет полное право зарабатывать деньги. Раньше они
заявляли о всеобщем доступе к «бесплатному образованию» (“is
commited to making the best education in the world freely available
to any person who seeks it”), но теперь слово «бесплатно» тщательно
удалено со всех страниц сайта.
Получив аудитории в десятки миллионов человек, Coursera
отказалась от выдачи бесплатных сертификатов. Затем они
отключили бесплатный доступ к опросникам и заданиям. И вот
теперь Coursera убирает все курсы со
старой платформы и в результате
пропадёт огромное количество материала из общественного
пользования, как на форумах, так и в задачниках.
Coursera даёт всем время до 30 июня 2016,
чтобы скачать курсы.
01.07.2016
Доступ к последним бесплатным лекциям и курсам закрыт.
Часть данных с Coursera нашла себе
приют на площадке archive.org. Администрация «архива» стала
поэтапно загружать вытянутые со старой Coursera данные.
... похоже на свалку файлов, без
какой-либо структуры и оформления. |
КРИТЕРИЙ
УСПЕШНОСТИ?
Журнал Science
опубликовал
исследование Джона Хансена
(John Hansen) из Гарварда и
Джастина Рейха
(Justin Reich) из MIT, посвящённое социальному анализу тех
людей, которые используют онлайн-курсы Massive Open Online
Courses (MOOCs) для повышения уровня собственного
образования.
Выяснилось, что доступностью таких
услуг в интернете преимущественно пользуются люди с
достаточно высоким социальным статусом, живущие в районах с
более обеспеченным населением.
Основными темами онлайн-курсов
являются наука, технология, инженерия и математика, которые
обеспечивают значительное преимущество на рынке.
Вывод исследователей: оскольку людям с низким социальным
статусом услуги онлайн-образования кажутся ненужными, то
такая возможность на самом деле ещё больше увеличивает
разницу между людьми.
Это ставит под сомнение одну из целей
онлайн-курсов MOOC — дать возможность получать
высококачественное образования людям из разных социальных
слоёв общества.
|
Открытое
образование
«Открытое образование»
(https://openedu.ru/)
- образовательная платформа, предлагающая онлайн-курсы по
базовым дисциплинам, изучаемым в российских университетах.
Платформа создана Ассоциацией "Национальная платформа
открытого образования", учрежденной ведущими университетами
- МГУ, СПбПУ, СПбГУ, НИТУ «МИСиС», НИУ «ВШЭ», МФТИ, УрФУ и
ИТМО.
Все
курсы, размещенные на Платформе, доступны бесплатно и без
формальных требований к базовому уровню образования.
-
все курсы разрабатываются
в соответствии с требованиями федеральных
государственных образовательных стандартов;
-
все курсы соответствуют
требованиям к результатам обучения образовательных
программ, реализуемых в вузах;
-
особое внимание уделяется
эффективности и качеству онлайн-курсов, а также
процедурам оценки результатов обучения.
Для
желающих зачесть пройденный онлайн-курс при освоении
образовательной программы бакалавриата или специалитета в
вузе предусмотрена уникальная для России возможность
получения подтвержденных сертификатов.
|
Проекты Mail.Ru Group
Технопарк,
Техносфера и Технотрек.
-
Мы
учим серьезно.
образовательная программа не может быть простой. Ее заканчивает
около 25% поступивших, т. е. 3/4 мы отчисляем в процессе
обучения.
-
Мы
учим лучших из лучших.
Наш отбор должен быть нацелен на выявление не просто знающих
студентов, но тех, кто вдобавок крайне замотивирован учиться и
профессионально развиваться. Сейчас конкурс составляет более 15
человек на место.
-
Мы
учим конкретным вещам.
Мы не хотим конкурировать с вузовскими программами обучения. Мы
считаем их необходимыми, но недостаточными для оптимального
обучения IT-специалиста, особенно программиста. Поэтому наши
программы дополняют вузовские в части практико-ориентированного
обучения. Мы стремимся, чтобы соотношение теории и практики в
наших программах составляло 30/70, пока достигли примерно 50/50.
-
Мы
учим самому востребованному.
Наши преподаватели все они без исключения каждый день работают с
технологиями, которые преподают. Поэтому наши курсы — живые, мы
изменяем (дополняем, улучшаем) их каждый семестр.
-
Мы учим и учимся вместе.
|
kmp
рекомендует
ТЕХНОСФЕРА
Видео / 2 семестр /
Информационный поиск
2 семестр. Современные методы и средства построения систем
информационного поиска:Обзор
лекций
Лекция 1. Введение в информационный поиск. Обзор архитектуры
поисковых систем
Определение задачи информационного поиска. Примеры поисковых
систем. Задачи, связанные с поиском информации. История
развития поисковых систем. Логическая модель информационного
поиска, его задачи. Принципы булева поиска. Матрица
«термин-документ». Обратный индекс. Словарь и координатные
блоки. Создание обратного индекса. Разбиение на токены и
сортировка. Словари и координатные блоки.
Лекция 2. Лингвистика
Что такое лингвистика, каковы её задачи. История зарождения
и развития лингвистики как науки. Задачи, решаемые
лингвистикой, её разновидности. Общая лингвистика: фонетика,
фонология, морфология, синтаксис, семантика, прагматика.
Историческая лингвистика. Лингвистическая типология.
Социолингвистика. Диалектология. Лексикография.
Психолингвистика. Математическая лингвистика. Статистическая
лингвистика. Подходы к языку: рационалистический и
эмпирический. Морфология. Корпусная лингвистика. Конкорданс,
законы Ципфа, поправки и формула Мандельброта.
Лекция 3. Основы обработки текста
Критерии документа, кодировки. Уровни лингвистического
анализа. Токены и термины. Детекция языка: графематический,
N-граммный и лексический подходы. Нормализация. Проблемы
токенизации. Наличие и отсутствие пробелов. Китайский,
японский, арабский языки. Ударение и диакритика. Классы
эквивалентности. Понижение регистра. Стоп-слова.
Лемматизация. Стемминг. Предиктор. Виды языков.
Статистическое снятие омонимии. Разбиение текста на
предложения. Расширение поискового запроса.
Лекция 4. Коллокации
Методы подсчёта вероятности: параметрический и
непараметрический подходы, стандартные и биноминальные
распределения, мультиноминальное и нормальное распределения,
аппроксимирование. Байесовский подход к статистике.
Определение коллокаций, их признаки. Частотность биграмм.
Фильтр по частям речи. Отклонения, гистограммы отклонений.
Поиск коллокаций, примеры применения t-критерия. Поиск
отличий в словоупотреблении. Критерий Пирсона. x2-критерий.
Критерий отношения правдоподобия. Относительные частоты.
Взаимная информация. Разреженность данных. F-мера.
Лекция 5. Языковые модели. N-граммы. Цепи Маркова
Цели распознавания языка. Языковые модели. Поиск с
использованием языковых моделей. Фундаментальная проблема
нехватки данных. Построение N-грамм. Метод максимального
правдоподобия. Сглаживание. Валидация моделей. Линейное
смешение моделей. Цепь Маркова. Матрица переходов.
Последовательность состояний. Скрытые марковские модели. Три
задачи HMM. Алгоритмы вперёд и назад. Алгоритмы Витерби,
Баума-Уэлша. Применение НММ Таггер. Анализ поведения
пользователя.
Лекция 6. Машинный перевод
Определение и задачи машинного перевода. История развития
машинного перевода. Подходы к машинному переводу: rule-based,
corpora-based, hybrid. Три основные методологии. RBMT, его
сравнение с SMT, их преимущества и недостатки. Параллельный
корпус. Выравнивание по предложениям. Word-based модели.
Модели IBM Model, их ограничения. Фразовые модели: фразовый
статистический перевод, вычисление вероятности перевода,
модель языка, модель перевода, построение фразовой таблицы.
Декодирование. Оценка машинного перевода. BLEU (Bilingual
evaluation understudy). Эволюция машинного перевода.
Лекция 7. Индексация
Общая схема базы поиска. Назначение обратного индекса.
Технические ограничения и дисковая подсистема. Cостав
обратного индекса и варианты его построения. Оптимизация
пересечения блоков. Сжатие координатных блоков: сравнение
побитовых и побайтовых подходов: код Фибоначчи, VarByte,
гамма-коды, Simple9. Практические советы по уменьшению
объема индекса. Структуры данных, используемые для
построения словаря. Подходы к хранению стоп-слов. Проблемы
индексации больших объемов. Распределение документов и
балансировка баз. Архитектура индексатора.
Лекция 8. Архитектура web-поиска. Текстовое ранжирование
Логическая схема поисковой машины. Поисковый кластер.
Индексация. Булев поиск. Вычисление веса. Коэффициент
Жаккара. Частотная матрица. Модель «мешка слов». Частота
термина. Логарифмическое взвешивание. Документная частота.
IDF. Документы как векторы. Методы оптимизации текстового
ранжирования. Термины с большим IDF. Документы с большим
количеством терминов из запроса. Статические веса, общий
вес. Эшелоны. Кластеризация индекса. Параметрические индексы
и зоны. Поля (числовые зоны). Индексы для зон. Компактность
вхождения. Вероятностный поиск. Использование языковых
моделей при поиске. Варианты сравнения моделей.
Правдоподобие запроса и документа. Сравнение моделей.
Обратная связь по релевантности. Бинарная вероятностная
модель. Байесовы сети в задаче ранжирования.
Лекция 9. Дизайн поисковой выдачи. Сниппеты. Оценка качества
поиска
Примеры дизайнов страниц поисковых выдач разных ресурсов.
Компоненты SERP. Органические результаты. Выделение
параграфов. Разбиение на предложения. Формирование сниппета,
общий алгоритм формирования. Обогащение сниппетов. Метрики
сниппетов. Оценка асессорами. Метрики качества поисковой
системы. Качество поиска. Стандартные коллекции. TREC.
Точность/полнота. Критика чистой релевантности. Маркерные
тесты. Поиск периферийных сайтов. Региональная навигация.
Тематический поиск. Общее качество поиска. Асессорская
служба. Оценка релевантности документа. Кросс-валидация.
SOM-карты. Автопоиск ошибок. Онлайн-метрики. Оценка гипотез.
Кликовые метрики. Корреляция с асессорами.
Лекция 10. Особенности web-поиска. Спайдер
Популярность пользования поиском. История поисковых систем.
Основы web-поиска. Потребности пользователей. Эмпирическая
оценка поисковых результатов пользователем. Коллекция
web-документов. Поисковая реклама, как она ранжируется,
каковы её плюсы и минусы. Спайдер, его задачи. Очередь
URL’ов. Поисковые роботы. Основная архитектура спайдера.
Парсинг: нормализация URL. Распределённый спайдер.
Взаимодействие серверов. Схема Mercator. Front queues, back
queues. Свежесть базы. Deep Web (труднодоступные сайты).
Карты сайтов. Хранение документов. Удаление шума.
Лекция 11. Поиск дубликатов в Web
Сравнение документов: точные и неточные дубликаты, почти
дубликаты, версии для печати. Три этапа определения похожих
документов. Шинглы (shingles), опция сжатия. Множественная
модель, матричная модель. Поиск похожих колонок. Сигнатуры.
Выявление похожего множества (minhashing). Поиск похожих
пар. Отбор кандидатов из сигнатур Minhash.
Locality-sensitive hashing. Распределение по частям и по
корзинам. LSH-компромиссы. Поиск дубликатов в Web.
Лекция 12. Применение самоорганизующихся карт в поисковой
машине
Лекция разбита на две части. Первая часть: вопросы
приоритезации спайдера поисковой машины, алгоритмы
сегментации больших сайтов на части и распределение
приоритетов обкачки сегментов. Вторая часть: алгоритмы
анализа и визуализации больших объемов данных при помощи
самоорганизующихся карт Кохонена (SOM), применение этого
инструмента в задаче анализа структуры веба и приоритезации
поискового робота, возможность применения SOM для анализа
данных в различных областях разработки поискового движка.
Лекция 13. Выявление спам-сайтов на основе анализа контента
страниц
Различные аспекты очистки поискового индекса от мусора.
Вопросы построения классификаторов. Базовые темы машинного
обучения: правильное построение обучающего множества,
генерация признаков, выбор алгоритмов классификации.
Проблематика построения классификаторов для различных
классов данных.
Лекция 14. Поведенческое и ссылочное ранжирование
Вычисление поведенческой релевантности. Индексация анкорного
текста. Алгоритм HITS, Page Rank. Метод блочной структуры.
Системы для обработки графов.
Лекция 15. Ранжирование с машинным обучением
Классическое ранжирование. Факторы ранжирования.
Ранжирование на основе машинного обучения. Специфика задачи
машинного обучения ранжированию. Формальная постановка
задачи. Градиентный спуск. Деревья решений. «Невнимательные»
деревья решений. Алгоритмические композиции над деревьями
решений (bagging, boosting). Стакинг. Алгоритм BagBoo.
Вопросы построения обучающих данных. Активное обучение.
Сэмплирование неопределённости. Комитетные методы активного
обучения. Применение самоорганизующихся карт для
сэмплирования обучающих данных. Алгоритм SOM+QBag для
активного обучения ранжированию.
http://habrahabr.ru/company/mailru/blog/253441/
|
kmp
|