kmp news

      

Python

 

 

https://ru.wikipedia.org/wiki/Python

https://ru.wikipedia.org/wiki/Ван_Россум,_Гвидо

 

 

Владимир Павлович Селегей:

  • Современный лингвист обязательно должен быть и компьютерным лингвистом.

  • Если вы хотите заниматься самостоятельными лингвистическими исследованиями, у вас должен быть свой набор компьютерных инструментов. Вы должны владеть определенными методами анализа. Поскольку не всегда в вашем распоряжении есть что-то готовое, вам необходим некоторый уровень технической подготовки, чтобы сегодня быть лингвистом на международном уровне.

  • Вы должны уметь работать с корпусом, уметь статистически обрабатывать результаты, уметь писать простые тексты на Питоне, работать с пакетами статистической обработки, которые ориентированы на лингвистов.

  • Лингвисту выучить это несложно, потому что лингвист – это человек точного знания. С самого своего создания лингвистика была сильно математизированной наукой, и те структуры, с которыми работает лингвист, – это, по существу, математические структуры...

 

 

 

Программа дисциплины «Программирование (язык Python)»
школы лингвистики Гуманитарного факультета НИА ВШЭ

Содержание

1. Программирование на языке Python.

1.1. Работа с файловой системой: обход дерева каталогов, создание директорий.

1.2. Множества и операции над ними.

1.3. Модуль urllib2: загрузка веб-страниц и файлов. Использование регулярных выражений для извлечение информации из HTML. Краулеры. Структура GET-запроса, анализ и составление GET- запросов.

1.4. Функции как «объекты первого класса». Аргументы по умолчанию, keyword arguments.

1.5. Списочные и словарные включения.

2. Инструменты хранения и обработки лингвистических данных.

2.1. Реляционные базы данных, СУБД (на примере SQLite). Таблицы, первичный ключ, представление корпусных данных в виде БД, нормализация данных. Работа с БД через графический интерфейс. Основы SQL (SELECT, INSERT, UPDATE).

2.2. HTML и CSS для обеспечения доступа к лингвистическим ресурсам. Веб-формы и GET- запросы.

2.3. Инструменты разметки корпусов, форматы представления корпусных данных и их преобразование

 

 

 

Coursera: Программирование на Python

 

05.09.2017

На Coursera новый онлайн-курс от МФТИ и Mail.Ru Group для всех желающих: «Программирование на Python» .

Курс читают разработчики, применяющие Python в проектах и он покрывает все необходимые для ежедневной работы темы:

Введение в Python
Структуры данных и функции
Объектно ориентированное программирование
Углубленный Python
Многопоточное и асинхронное программирование
Итоговый проект

Понадобится до 6 часов времени в неделю (2 часа на просмотр видеолекций, 4 — на выполнение тестов и домашних заданий).

Лекционные материалы и задания без оценки бесплатны, для оцениваемых заданий и получения сертификата необходимо приобрести курс.

 

 

 

Изучаем Python

 

1

Знакомимся с ресурсом Python Tutor (поддерживает семь языков (Python, Java, JavaScript, TypeScript, Ruby, C, and C++)!

2

Знакомимся с ресурсом Python для начинающих

3

Знакомимся с ресурсом Online Python Tutor (для курса по программированию MIT).
В окно редактора можно скопировать любой код или посмотреть готовые простые примеры (факториал, квадратный корень, последовательность Фибоначчи и т.д.). Навигация осуществляется стрелками на клавиатуре.

 

 

 

 

NLTK + Python

 

 

NTLK (Natural Language Toolkit) — пакет библиотек и программ для символьной и статистической обработки естественного языка, написанных на языке программирования Python.

NTLK хорош для студентов, изучающих компьютерную лингвистику, искусственный интеллект, информационный поиск и машинное обучение.

NTLK является свободным программным обеспечением.

  • http://nltk.org/book/
    Учебник Питона и компьютерной обработки текстов на естественном языке, использующий NLTK: не требует начального знания Питона, использует множество корпусов текстов, доступных онлайн в NLTK, и содержит множество упражнений.

  • http://groups.google.com/group/nltk-russian/topics
    Группа NLTK по-русски


 

 

 

kmp