Программа дисциплины «Программирование
(язык Python)»
школы лингвистики Гуманитарного факультета НИА ВШЭ
Содержание
1. Программирование на
языке Python.
1.1. Работа с файловой
системой: обход дерева каталогов, создание директорий.
1.2. Множества и
операции над ними.
1.3. Модуль urllib2:
загрузка веб-страниц и файлов. Использование регулярных
выражений для извлечение информации из HTML. Краулеры.
Структура GET-запроса, анализ и составление GET- запросов.
1.4. Функции как
«объекты первого класса». Аргументы по умолчанию, keyword
arguments.
1.5. Списочные и
словарные включения.
2. Инструменты хранения и
обработки лингвистических данных.
2.1. Реляционные базы
данных, СУБД (на примере SQLite). Таблицы, первичный ключ,
представление корпусных данных в виде БД, нормализация
данных. Работа с БД через графический интерфейс. Основы SQL
(SELECT, INSERT, UPDATE).
2.2. HTML и CSS для
обеспечения доступа к лингвистическим ресурсам. Веб-формы и
GET- запросы.
2.3. Инструменты
разметки корпусов, форматы представления корпусных данных и
их преобразование
|