О приложении
«Менеджер терминологии Lite»
Приложение «Менеджер терминологии Lite» предназначено для автоматизации поиска
терминологии в текстах, ее извлечения и сохранения для дальнейшей обработки.
Приложение позволяет:
• задавать множество файлов, в которых будет выполняться подсчет частоты
употребления слов и словосочетаний;
• формировать на основе данного подсчета список терминологических кандидатов (ТК)
— слов или словосочетаний, которые встречаются в анализируемых текстах с
определенной частотой;
• получать статистические данные по каждому ТК, например, информацию об
относительной частоте;
• извлекать переводы из словарей PROMT;
• настраивать параметры анализа и отображения результата;
• добавлять найденные ТК в словари PROMT;
• получать и сохранять контекстные примеры для найденных ТК.
Подробная информация о компании «ПРОМТ» — авторе и разработчике систем машинного
перевода PROMT и ее программных продуктах представлена на web-сайте компании.
Все права защищены. © ООО «ПРОМТ», 2003-2010.
Добавление файлов для анализа
Для анализа и обработки могут быть добавлены файлы следующих форматов: TXT, HTML,
Microsoft Word 95-2007, Excel 2007 и PowerPoint 2007.
Image Чтобы добавить файлы для анализа, нажмите кнопку Image Добавить или
выберите в меню команду Файл → Добавить (клавиши Ctrl+N). В диалоге Выбрать
тексты выполните следующее:
1. Нажмите кнопку Добавить файлы или Добавить web-страницу. В первом случае
выберите один или несколько файлов, во втором — укажите адрес web-страницы.
Чтобы сохранить группу выбранных документов, нажмите кнопку Сохранить. Чтобы
добавить для анализа сохраненную ранее группу файлов (файл с расширением *.grp),
нажмите кнопку Загрузить.
2. В раскрывающемся списке Исходный язык укажите язык, на котором написан текст
добавляемых документов.
При завершении работы с приложением выбранное значение исходного языка
сохраняется.
3. Если нужно удалить один или несколько выделенных в списке файлов, нажмите
кнопку Удалить. Для удаления всех файлов из списка используйте кнопку Удалить
все.
4. Нажмите кнопку OK.
Если параметры приложения были предварительно настроены и их не нужно менять,
нажмите кнопку Обработать. Иначе, после нажатия кнопки OK настройте параметры и
запустите обработку с помощью соответствующей команды меню или кнопки на панели
инструментов.
Настройка параметров
Image Чтобы настроить параметры приложения, нажмите кнопку Image на панели
инструментов или выберите в меню команду Сервис → Параметры (клавиши Shift+O).
Откроется диалог Параметры, который содержит следующие параметры:
• Учитывать регистр — при обработке текста учитывается регистр букв (например, «apple»
и «Apple» будут рассматриваться как отдельные ТК);
• Исключать повторяющиеся предложения — при обработке предложение, повторяющееся
целиком, будет учтено только один раз;
• Нормализовать словоформы — все словоформы для конкретного слова, встреченные в
текстах, приводятся к исходной форме.
Этот параметр доступен только в том случае, если в данном приложении
используются функции переводчика PROMT (см. следующий раздел).
Чтобы восстановить значения параметров по умолчанию, выберите команду Сервис →
Установить параметры по умолчанию (клавиши Shift+D).
При закрытии приложения сохраняются все изменения параметров.
После изменения параметров нужно повторно выполнить анализ.
Запуск анализа текста и просмотр результата
Приложение позволяет не только анализировать тексты и искать в них ТК, но и
переводить найденные ТК с помощью переводчика PROMT, а также извлекать для них
переводы из словарей PROMT. Для подключения переводчика достаточно выбрать
нужное направление перевода в раскрывающемся списке на панели инструментов.
Значение Не выбрано данного списка отключает функции переводчика.
Image Чтобы начать анализ и обработку добавленных документов, нажмите кнопку
Image на панели инструментов или выберите в меню команду Выполнить → Продолжить
(клавиши Shift+R).
Чтобы прервать анализ, нажмите на панели инструментов кнопку Image или выберите
в меню команду Выполнить → Прервать (клавиши Shift+S).
Image После завершения анализа отображается результирующая таблица, вид и
содержимое которой зависят от заданных параметров обработки и отображения. Могут
отображаться следующие столбцы:
• ТК — найденные терминологические кандидаты;
• Относительная частота — отношение количества употреблений слова
(словосочетания) к общему количеству словоформ в тексте. Для удобства
отображения эта величина умножается на 100 000;
• Словари PROMT — названия словарей, в которых найдены переводы для конкретного
ТК.
Если перевод не найден в словарях данного направления перевода, то в столбце
Словари PROMT ставится прочерк;
• Перевод PROMT — переводы, выполненные переводчиком PROMT.
Просмотр примеров контекста
Контекст — это фрагмент текста (предложение или его часть), в пределах которого
встречается терминологический кандидат.
Примеры контекста отображаются в панели контекста, которая по умолчанию
находится в нижней части окна.
Image Чтобы открыть панель контекста (если она не открыта) и просмотреть
найденные примеры для выделенного ТК, нажмите кнопку Image на панели
инструментов или выберите в меню команду Вид → Панель контекста (клавиши Shift+C).
Панель можно разместить в любом месте экрана. Для этого подведите указатель мыши
к ее заголовку и, удерживая нажатой левую кнопку мыши, перетащите панель на
новое место. Чтобы прикрепить панель к окну приложения, дважды щелкните левой
кнопкой мыши по заголовку панели.
Терминологические кандидаты выделяются в контексте красным цветом. В конце
каждой строки с контекстом приведен путь к файлу (выделен синим цветом), в
котором найден данный контекст.
Если к приложению подключен переводчик PROMT, можно получить мгновенный машинный
перевод фрагмента контекста. Для этого выделите его. Появится всплывающая
подсказка с переводом
Просмотр переводов из словарей PROMT
Image Чтобы просмотреть все переводы для конкретного ТК, найденные словарях
PROMT заданного направления перевода, щелкните по нужному ТК правой кнопкой мыши
и выберите команду Переводы из словарей (клавиши Ctrl+D). В открывшемся окне
будет отображена краткая информация из словарной статьи для каждого словаря:
название словаря, варианты перевода, исходная форма и часть речи.
Просмотр статистики по словарям и ТК
Статистика по словарям содержит сведения об общем количестве слов, найденных в
каждом словаре.
Image Чтобы получить статистику по словарям, нажмите кнопку Image на панели
инструментов или выберите в меню команду Вид → Статистика по словарям.
Статистика по ТК содержит следующие сведения: общее количество слов в
обрабатываемых файлах, общее количество найденных ТК, количество слов и
количество словосочетаний, в том числе найденных в словарях, а также значение
«покрытия» текста словосочетаниями — отношение суммарного количества слов в
словосочетаниях к полному количеству слов в тексте.
Image Чтобы получить статистику по ТК, нажмите кнопку Image на панели
инструментов или выберите в меню команду Вид → Статистика по ТК.
Сортировка терминологических кандидатов
Найденные ТК можно отсортировать в списке по различным критериям (см. таблицу).
Для выбора варианта сортировки используйте нужную команду в меню Вид или
щелкните левой кнопкой мыши по названию соответствующего столбца в заголовке
результирующего списка.
После выбора варианта сортировки список ТК обновляется автоматически, кроме
сортировки по словарям. В этом случае следует повторно выполнить анализ.
Критерий сортировки Действие
По ТК в алфавитном порядке. Выберите команду Вид → Сортировать по ТК или
щелкните кнопкой мыши по столбцу ТК.
По значению относительной частоты (в порядке убывания). Выберите команду Вид →
Сортировать по частоте или щелкните кнопкой мыши по названию столбцу
Относительная частота.
По названиям словарей. Выберите команду Вид → Сортировать по словарям или
щелкните кнопкой мыши по столбцу Словари PROMT.
В открывшемся диалоге выделите в правом списке один или несколько словарей и
добавьте их в левый список с помощью кнопок переноса. При необходимости измените
приоритет добавленных словарей. Нажмите кнопку OK.
По ключевому слову (словосочетанию). Выберите команду Вид → Сортировать по
ключевому слову.
В открывшемся диалоге введите ключевое слово и при необходимости установите
дополнительные параметры. Нажмите кнопку OK.
Чтобы отключить сортировку по ключевым словам, удалите набранное ключевое слово
из поля ввода.
Сортировка по словарям и ключевому слову используются совместно с сортировкой по
ТК или частоте в соответствии со следующим приоритетом:
1. Сортировка по ключевому слову.
2. Сортировка по словарям.
3. Сортировка по ТК или относительной частоте.
Работа с ТК
Image Чтобы выбрать один или несколько ТК для дальнейшей работы, установите
флажки напротив нужных ТК.
Ввод ТК в словарь PROMT
Приложение позволяет добавлять найденные ТК в пользовательские словари, что
позволит в будущем получать их перевод.
Image Чтобы добавить ТК в пользовательский словарь:
1. Щелкните по ТК правой кнопкой мыши и выберите команду Добавить в словарь
(клавиши Ctrl+G).
Эта команда также вызывается двойным щелчком левой кнопки мыши по ТК.
2. В открывшемся диалоге выберите словарь, режим редактирования и нажмите кнопку
Создать.
3. Введите необходимую грамматическую информацию и переводы для исходного слова
или словосочетания.
Если в списке отмечено несколько ТК, то их ввод в словарь будет выполняться
последовательно