Выбор терминологических экстракторов для выявления номинаций понятий языковой политики в текстах официальных документов Европейского Союза

Прикладная лингвистика
Авторы:
Аннотация:

Инвентаризация терминологии реализуется, как правило, в автоматизированном режиме с использованием специализированного программного обеспечения. Многообразие терминологических экстракторов требует разработки критериев, позволяющих осуществлять их выбор для решения конкретных исследовательских задач. Цель данной статьи – осуществить сопоставительный анализ терминологических экстракторов с точки зрения их доступности и результативности извлечения потенциальных терминов из специального текста для решения конкретной исследовательской задачи, а именно инвентаризации номинаций понятий языковой политики из текстов официальных документов Европейского Союза. В качестве методологической базы использован комплекс современных научных методов: таксономический, объяснительное описание, обобщение, сопоставительный анализ. Осуществлено сопоставление 4 свободно доступных терминологических экстракторов, рекомендованных для работы отделом по координации терминологии Европейского союза TermCoord, и 1 программного инструмента, выбранного на основании сведений об его эффективности, представленных в научных публикациях. Анализ критериев, заявленных разработчиками анализируемого программного обеспечения, позволил выделить 5 таксонов для сопоставления терминологических экстракторов. Таксономический анализ позволил выявить оптимальные по критериям инструменты: онлайн-экстрактор OneClick Terms и инструмент корпусного запроса Sketch Engine, которые затем были сопоставлены с точки зрения их результативности в решении исследовательской задачи. Для проверки терминологических экстракторов на эффективность результаты их работы были сопоставлены со списком терминов, извлеченных вручную, что затем позволило применить критерии полноты и точности, традиционно используемые в информационном поиске, для сравнения результативности экстракторов. С учетом конкретной исследовательской задачи наиболее важной характеристикой является полнота, и по этому показателю оптимальным экстрактором оказался инструмент корпусного запроса Sketch Engine. Таким образом, в данной статье представлен комплексный подход к определению эффективности терминологических экстракторов не с точки зрения извлечения терминов, отражающих понятия определенной предметной области, а с точки зрения их результативности для решения конкретной исследовательской задачи.